url 参数传入音频文件的可访问 URL 地址,prefix 参数作为音色名称前缀。
voice 值填入以下请求中。
voice_id 参数用于指定新音色的 ID,audio_url 参数传入音频文件的可访问 URL 地址。
voice_id 值填入以下请求中。
| 项目 | 要求 |
|---|---|
| 支持格式 | WAV(16bit)、MP3、M4A |
| 音频时长 | 推荐 10~20 秒,最长不超过 60 秒 |
| 文件大小 | 不超过 10 MB |
| 采样率 | 16 kHz 及以上 |
| 声道 | 单声道或双声道。双声道音频仅处理首声道,请确保首声道包含有效人声。 |
| 内容 | 音频必须包含至少 5 秒连续清晰的朗读内容(无背景音),其余部分仅允许短暂停顿(不超过 2 秒)。整段音频应避免出现背景音乐、环境噪音或其他人声。请使用正常语速的说话音频,不要上传歌曲或唱歌录音。 |
| 支持语言 | 因驱动音色的语音合成模型(通过 target_model 参数指定)而异,详见下方说明 |
target_model 绑定到特定的语音合成模型,不能跨模型使用。如果您需要在多个模型上使用同一段音频的声音,请为每个模型分别创建音色。