cURL
查询任务状态并获取生成的视频。
输入语音和视频长度不一致,会如何处理?
默认按音频、视频两者中时长较短的来截断。当输入的音频时长大于视频时长时,若希望按音频长度来生成,可将
轮询策略
- 调用提交视频口型替换任务接口获取
task_id。 - 每 15 秒轮询一次,直到
task_status为SUCCEEDED或FAILED。 - 任务成功后,从
output.video_url获取视频。
注意事项
- URL 有效期:视频 URL 在任务完成后 24 小时过期,请及时下载保存。
- 状态流转:
PENDING→PRE-PROCESSING→RUNNING→POST-PROCESSING→SUCCEEDED或FAILED。UNKNOWN表示任务不存在或已过期。
常见问题
输入语音和视频长度不一致,会如何处理?
默认按音频、视频两者中时长较短的来截断。当输入的音频时长大于视频时长时,若希望按音频长度来生成,可将 parameters.video_extension 设为 true,算法将使用原视频画面"倒放-正放"交替模式扩展视频时长,直至与音频相同。
输入音频中有静音情况,会如何处理?
音频静音的时段,预期视频中人物也会闭嘴。
输入视频中有无人脸/脸拍不全的情况,会如何处理?
若音频中有人声,但画面无人或未出现人物嘴型,则保留原视频画面,音频正常播放。
输入视频中有多人的情况,会如何处理?
仅支持替换一个人物。算法会按照输入人脸参考图(input.ref_image_url)识别指定人脸。若未输入人脸参考图,则默认选择第一个有人脸画面中占比最大的人脸。
