支持 92 种语言及术语干预
Qwen-MT 是基于 Qwen3 微调的机器翻译模型,支持 92 种语言。它提供术语干预、领域提示和翻译记忆功能,帮助提升翻译质量。
使用限制
模型详情、定价和限流,请参见模型广场。
获取 API Key 并将其设置为环境变量。如需使用 SDK,请先安装 SDK。
在翻译调用中添加
模型差异:
DashScope 接口中,在支持的模型上设置
在专业翻译任务中,可能遇到以下问题:
当文本包含品牌名称、产品名称或技术术语时,为确保翻译的准确性和一致性,您可以在
如需指定模型使用特定的翻译风格或句式,您可以在
如需让翻译风格适应特定领域,您可以通过
您可以在 Qwen-MT 中使用自定义提示词来指定语言、风格等细节。此方式与
示例:将西班牙语翻译为英语(法律领域):
发送请求时,请使用下表中的 English name 或 Code。
API 参数详情请参见:
工作原理
-
提供待翻译文本:
messages数组中只能包含一条消息,role设为user,content为待翻译的文本。 -
设置语言:在
translation_options参数中设置源语言(source_lang)和目标语言(target_lang)。支持的语言列表见支持的语言。如需自动检测源语言,将source_lang设为auto。
指定源语言可以提高翻译准确性。您也可以通过自定义提示词设置语言。
- OpenAI 兼容
- DashScope
- 仅支持单轮翻译:该模型专为翻译任务设计,不支持多轮对话。
- 不支持系统消息:不能通过
system角色的消息设置全局行为,请在translation_options参数中定义翻译配置。
模型选择
- 通用场景推荐选择
qwen-mt-flash,在质量、速度和成本之间取得平衡,支持增量流式输出。 - 对专业领域翻译质量要求最高时,选择
qwen-mt-plus。 - 对简单实时场景需要最快响应速度时,选择
qwen-mt-lite。
| 模型 | 适用场景 | 质量 | 速度 | 成本 | 支持语言数 | 支持增量流式输出 |
|---|---|---|---|---|---|---|
| qwen-mt-plus | 翻译质量要求高的场景,如专业领域、正式文档、学术论文、技术报告 | 最佳 | 标准 | 高 | 92 | 不支持 |
| qwen-mt-flash | 通用首选。 适用于网站/应用内容、产品描述、日常沟通、博客文章等场景 | 良好 | 快 | 低 | 92 | 支持 |
| qwen-mt-turbo | 该模型将不再更新,请使用 flash 替代。 | 一般 | 快 | 低 | 92 | 不支持 |
| qwen-mt-lite | 简单、对延迟敏感的场景,如实时聊天、直播弹幕翻译 | 基础 | 最快 | 最低 | 31 | 支持 |
快速开始
获取 API Key 并将其设置为环境变量。如需使用 SDK,请先安装 SDK。
- OpenAI 兼容
- DashScope
请求示例响应示例
流式输出
流式输出的通用概念(SSE 协议、如何启用流式、计费和 Token 用量),请参见流式输出。本节仅介绍机器翻译特有的流式行为。
stream: true 即可启用流式输出。与标准流式输出的唯一区别是需要包含 translation_options:
| 模型 | 增量流式输出 |
|---|---|
| qwen-mt-flash, qwen-mt-lite | 支持 — 每个 chunk 仅包含新生成的内容 |
| qwen-mt-plus, qwen-mt-turbo | 不支持 — 每个 chunk 包含截至目前生成的全部内容 |
incremental_output=True 可启用增量流式输出。
提升翻译质量
在专业翻译任务中,可能遇到以下问题:
- 术语不一致:产品名称或行业术语翻译不正确。
- 风格不匹配:译文风格不符合特定领域(如法律、营销)的要求。
术语干预
当文本包含品牌名称、产品名称或技术术语时,为确保翻译的准确性和一致性,您可以在 terms 字段中提供术语表,指定模型使用您定义的翻译。
按以下步骤定义和传递术语:
1
定义术语
创建一个 JSON 数组并赋值给
terms 字段。数组中每个对象表示一个术语,格式如下:2
传递术语
通过
translation_options 参数传递定义的 terms 数组。- OpenAI 兼容
- DashScope
请求示例响应示例添加术语后,翻译结果与您传入的术语一致:"biological sensor" 和 "health status of the body"。
翻译记忆
如需指定模型使用特定的翻译风格或句式,您可以在 tm_list 字段中提供源语言-目标语言的句对作为示例。模型会模仿这些示例的风格来完成当前翻译任务。
1
定义翻译记忆
创建一个名为
tm_list 的 JSON 数组。数组中每个 JSON 对象包含一个源语言句子及其对应的译文,格式如下:2
传递翻译记忆
通过
translation_options 参数传递翻译记忆数组。- OpenAI 兼容
- DashScope
请求示例响应示例
领域提示
如需让翻译风格适应特定领域,您可以通过 translation_options 参数传递领域提示。例如,法律或政务领域的翻译应使用正式用语,而社交媒体的翻译应口语化。
领域提示目前仅支持英文。
- OpenAI 兼容
- DashScope
请求示例响应示例
自定义提示词
您可以在 Qwen-MT 中使用自定义提示词来指定语言、风格等细节。此方式与 translation_options 参数互斥——如果同时使用,translation_options 可能不会生效。
为获得最佳翻译效果,建议使用
translation_options 配置翻译设置。- OpenAI 兼容
- DashScope
请求示例响应示例
生产建议
-
控制输入 Token 数量
Qwen-MT 模型的最大输入限制为 8,192 个 Token。对于长内容,可采用以下策略控制输入 Token 数:
- 分段翻译:翻译长文本时,按语义单元(如段落或完整句子)而非字符数分段处理,以保持上下文完整性,提高翻译质量。
- 提供最相关的参考内容:术语、翻译记忆和领域提示都会作为 Token 加入输入提示词。为优化 Token 用量,请只提供与当前任务最相关的参考内容,避免使用大而全的通用列表。
-
根据场景设置
source_lang- 源语言不确定时(如社交聊天中包含多语言文本),将
source_lang设为auto,由模型自动识别源语言。 - 语言固定且准确性要求高的场景(如技术文档、操作手册),始终明确指定
source_lang,可以提高翻译准确性。
- 源语言不确定时(如社交聊天中包含多语言文本),将
支持的语言
发送请求时,请使用下表中的 English name 或 Code。
如果不确定源语言,可以将
source_lang 参数设为 auto 进行自动检测。- qwen-mt-plus/flash/turbo(92 种语言)
- qwen-mt-lite(31 种语言)
| 语言 | English name | Code |
|---|---|---|
| 英语 | English | en |
| 简体中文 | Chinese | zh |
| 繁体中文 | Traditional Chinese | zh_tw |
| 俄语 | Russian | ru |
| 日语 | Japanese | ja |
| 韩语 | Korean | ko |
| 西班牙语 | Spanish | es |
| 法语 | French | fr |
| 葡萄牙语 | Portuguese | pt |
| 德语 | German | de |
| 意大利语 | Italian | it |
| 泰语 | Thai | th |
| 越南语 | Vietnamese | vi |
| 印度尼西亚语 | Indonesian | id |
| 马来语 | Malay | ms |
| 阿拉伯语 | Arabic | ar |
| 印地语 | Hindi | hi |
| 希伯来语 | Hebrew | he |
| 缅甸语 | Burmese | my |
| 泰米尔语 | Tamil | ta |
| 乌尔都语 | Urdu | ur |
| 孟加拉语 | Bengali | bn |
| 波兰语 | Polish | pl |
| 荷兰语 | Dutch | nl |
| 罗马尼亚语 | Romanian | ro |
| 土耳其语 | Turkish | tr |
| 高棉语 | Khmer | km |
| 老挝语 | Lao | lo |
| 粤语 | Cantonese | yue |
| 捷克语 | Czech | cs |
| 希腊语 | Greek | el |
| 瑞典语 | Swedish | sv |
| 匈牙利语 | Hungarian | hu |
| 丹麦语 | Danish | da |
| 芬兰语 | Finnish | fi |
| 乌克兰语 | Ukrainian | uk |
| 保加利亚语 | Bulgarian | bg |
| 塞尔维亚语 | Serbian | sr |
| 泰卢固语 | Telugu | te |
| 南非荷兰语 | Afrikaans | af |
| 亚美尼亚语 | Armenian | hy |
| 阿萨姆语 | Assamese | as |
| 阿斯图里亚斯语 | Asturian | ast |
| 巴斯克语 | Basque | eu |
| 白俄罗斯语 | Belarusian | be |
| 波斯尼亚语 | Bosnian | bs |
| 加泰罗尼亚语 | Catalan | ca |
| 宿务语 | Cebuano | ceb |
| 克罗地亚语 | Croatian | hr |
| 埃及阿拉伯语 | Egyptian Arabic | arz |
| 爱沙尼亚语 | Estonian | et |
| 加利西亚语 | Galician | gl |
| 格鲁吉亚语 | Georgian | ka |
| 古吉拉特语 | Gujarati | gu |
| 冰岛语 | Icelandic | is |
| 爪哇语 | Javanese | jv |
| 卡纳达语 | Kannada | kn |
| 哈萨克语 | Kazakh | kk |
| 拉脱维亚语 | Latvian | lv |
| 立陶宛语 | Lithuanian | lt |
| 卢森堡语 | Luxembourgish | lb |
| 马其顿语 | Macedonian | mk |
| 迈蒂利语 | Maithili | mai |
| 马耳他语 | Maltese | mt |
| 马拉地语 | Marathi | mr |
| 美索不达米亚阿拉伯语 | Mesopotamian Arabic | acm |
| 摩洛哥阿拉伯语 | Moroccan Arabic | ary |
| 内志阿拉伯语 | Najdi Arabic | ars |
| 尼泊尔语 | Nepali | ne |
| 北阿塞拜疆语 | North Azerbaijani | az |
| 北黎凡特阿拉伯语 | North Levantine Arabic | apc |
| 北乌兹别克语 | Northern Uzbek | uz |
| 书面挪威语 | Norwegian Bokmal | nb |
| 新挪威语 | Norwegian Nynorsk | nn |
| 奥克西坦语 | Occitan | oc |
| 奥里亚语 | Odia | or |
| 邦阿西楠语 | Pangasinan | pag |
| 西西里语 | Sicilian | scn |
| 信德语 | Sindhi | sd |
| 僧伽罗语 | Sinhala | si |
| 斯洛伐克语 | Slovak | sk |
| 斯洛文尼亚语 | Slovenian | sl |
| 南黎凡特阿拉伯语 | South Levantine Arabic | ajp |
| 斯瓦希里语 | Swahili | sw |
| 他加禄语 | Tagalog | tl |
| 塔伊兹-亚丁阿拉伯语 | Ta'izzi-Adeni Arabic | acq |
| 托斯克阿尔巴尼亚语 | Tosk Albanian | sq |
| 突尼斯阿拉伯语 | Tunisian Arabic | aeb |
| 威尼斯语 | Venetian | vec |
| 瓦瑞语 | Waray | war |
| 威尔士语 | Welsh | cy |
| 西波斯语 | Western Persian | fa |

