LiveTranslate Python SDK 参考文档
通过 DashScope Python SDK 调用 Qwen-LiveTranslate,实现实时语音翻译。
使用指南: 教程和完整示例请参见实时翻译。
在
通过
在
导入方式:
服务端通过回调向客户端发送事件。继承此类并实现相应方法来处理事件。
导入方式:
请求参数
在 OmniRealtimeConversation 构造函数中设置以下参数:
点击查看示例代码
点击查看示例代码
| 参数 | 类型 | 必选 | 说明 |
|---|---|---|---|
model | str | 是 | 模型名称。推荐使用 qwen3.5-livetranslate-flash-realtime。qwen3-livetranslate-flash-realtime 为旧版模型。 |
callback | OmniRealtimeCallback | 是 | 处理服务端事件的回调对象。 |
url | str | 否 | 服务端点:wss://dashscope.aliyuncs.com/api-ws/v1/realtime。默认为 DashScope 端点。 |
api_key | str | 否 | 用于鉴权的 API Key。未提供时,SDK 自动读取 DASHSCOPE_API_KEY 环境变量。 |
OmniRealtimeConversation.update_session 设置以下参数:
点击查看示例代码
点击查看示例代码
| 参数 | 类型 | 必选 | 说明 |
|---|---|---|---|
output_modalities | List[MultiModality] | 否 | 输出类型。默认值:[MultiModality.TEXT, MultiModality.AUDIO]。可选值:[MultiModality.TEXT](仅文本)或 [MultiModality.TEXT, MultiModality.AUDIO](文本和音频)。 |
voice | str | 否 | 音频输出的音色。默认值:Cherry。参见支持的音色。 |
input_audio_transcription_model | str | 否 | 设为 qwen3-asr-flash-realtime 可获取源语言的语音识别结果。使用时须同时设置 translation_params,否则服务端返回参数无效错误。 |
translation_params | TranslationParams | 否 | 翻译设置。 |
TranslationParams 构造函数中设置以下参数:
点击查看示例代码
点击查看示例代码
| 参数 | 类型 | 必选 | 说明 |
|---|---|---|---|
language | str | 否 | 目标语言代码。默认值:en。参见支持的语种。 |
corpus | TranslationParams.Corpus | 否 | 热词设置,用于提高特定术语的翻译准确度。 |
corpus.phrases | dict | 否 | 热词映射(key:源语言术语,value:目标语言翻译)。示例:{'Inteligencia Artificial': 'Artificial Intelligence'} |
核心接口
OmniRealtimeConversation 类
导入方式:from dashscope.audio.qwen_omni import OmniRealtimeConversation
| 方法签名 | 服务端事件(通过回调返回) | 说明 |
|---|---|---|
def connect(self) -> None: | 服务端事件:会话已创建;服务端事件:会话配置已更新 | 连接服务端。 |
def update_session(self, output_modalities: List[MultiModality], voice: str = None, translation_params: TranslationParams = None, **kwargs) -> None: | 服务端事件:会话配置已更新 | 更新会话设置。连接后立即调用。未调用时使用默认值。参见 OmniRealtimeConversation.update_session 参数。 |
def end_session(self, timeout: int = 20) -> None: | session.finished:服务端完成翻译并结束会话 | 结束会话。服务端会完成剩余翻译后再关闭。 |
def append_audio(self, audio_b64: str) -> None: | 无 | 向输入缓冲区发送 Base64 编码的音频数据。服务端自动检测语音边界并触发翻译。 |
def close(self) -> None: | 无 | 停止任务并关闭连接。 |
def get_session_id(self) -> str: | 无 | 返回当前会话 ID。 |
def get_last_response_id(self) -> str: | 无 | 返回最近一次响应 ID。 |
回调接口 (OmniRealtimeCallback)
服务端通过回调向客户端发送事件。继承此类并实现相应方法来处理事件。
导入方式:from dashscope.audio.qwen_omni import OmniRealtimeCallback
| 方法签名 | 参数 | 说明 |
|---|---|---|
def on_open(self) -> None: | 无 | WebSocket 连接建立时调用。 |
def on_event(self, message: dict) -> None: | message:服务端事件 | 收到服务端事件时调用。 |
def on_close(self, close_status_code, close_msg) -> None: | close_status_code:状态码。close_msg:日志信息。 | WebSocket 连接关闭时调用。 |

