跳转到主要内容
视频口型替换

声动人像 VideoRetalk — 查询视频口型替换任务结果

查询声动人像 VideoRetalk 视频口型替换任务状态,获取生成的视频

GET
/api/v1/tasks/{task_id}
cURL
curl -X GET 'https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY"
{
  "request_id": "87b9dce5-7f36-4305-a347-xxxxxx",
  "output": {
    "task_id": "3afd65eb-9604-48ea-8a91-xxxxxx",
    "task_status": "SUCCEEDED",
    "submit_time": "2025-09-11 20:15:29.887",
    "scheduled_time": "2025-09-11 20:15:36.741",
    "end_time": "2025-09-11 20:16:40.577",
    "video_url": "http://dashscope-result-sh.oss-cn-shanghai.aliyuncs.com/xxx.mp4?Expires=xxx"
  },
  "usage": {
    "video_duration": 7.2,
    "size": "1080*1920",
    "video_ratio": "standard",
    "fps": 25
  }
}
查询任务状态并获取生成的视频。

轮询策略

  1. 调用提交视频口型替换任务接口获取 task_id
  2. 15 秒轮询一次,直到 task_statusSUCCEEDEDFAILED
  3. 任务成功后,从 output.video_url 获取视频。

注意事项

  • URL 有效期:视频 URL 在任务完成后 24 小时过期,请及时下载保存。
  • 状态流转PENDINGPRE-PROCESSINGRUNNINGPOST-PROCESSINGSUCCEEDEDFAILEDUNKNOWN 表示任务不存在或已过期。

常见问题

输入语音和视频长度不一致,会如何处理? 默认按音频、视频两者中时长较短的来截断。当输入的音频时长大于视频时长时,若希望按音频长度来生成,可将 parameters.video_extension 设为 true,算法将使用原视频画面"倒放-正放"交替模式扩展视频时长,直至与音频相同。 输入音频中有静音情况,会如何处理? 音频静音的时段,预期视频中人物也会闭嘴。 输入视频中有无人脸/脸拍不全的情况,会如何处理? 若音频中有人声,但画面无人或未出现人物嘴型,则保留原视频画面,音频正常播放。 输入视频中有多人的情况,会如何处理? 仅支持替换一个人物。算法会按照输入人脸参考图(input.ref_image_url)识别指定人脸。若未输入人脸参考图,则默认选择第一个有人脸画面中占比最大的人脸。

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

路径参数

string
必填

提交任务时返回的 task_id

响应

200-application/json
string

本次请求的唯一 ID。

object
object

任务成功时返回的用量信息。