跳转到主要内容
视频生成

悦动人像 EMO — 创建任务

提交悦动人像 EMO 唱演视频生成异步任务

POST
/services/aigc/image2video/video-synthesis
cURL
curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis' \
  --header 'X-DashScope-Async: enable' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "emo-v1",
    "input": {
      "image_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20251225/onmomb/emo.png",
      "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/aejgyj/input_audio.mp3",
      "face_bbox": [302, 286, 610, 593],
      "ext_bbox": [71, 9, 840, 778]
    },
    "parameters": {
      "style_level": "normal"
    }
  }'
{
  "output": {
    "task_id": "a8532587-fa8c-4ef8-82be-xxxxxx",
    "task_status": "PENDING"
  },
  "request_id": "7574ee8f-38a3-4b1e-9280-11c33ab46e51"
}

模型概览

模型简介
模型名模型简介
emo-v1悦动人像 EMO,基于人物肖像图片和音频,生成口型与音频同步的唱演视频。适用于数字人播报、音乐 MV、虚拟主播等场景。
计费与限流
模型名计费单价任务下发接口 QPS 限制同时处理中任务数量免费额度
emo-v1(1:1)0.08 元/秒511800 秒
emo-v1(3:4)0.16 元/秒51

前置条件

在调用本接口前,需先调用 EMO 图像检测 接口对人物图片进行检测,获取 face_bbox(人脸边界框)和 ext_bbox(扩展边界框),再将其传入本接口。

使用流程

  1. 调用 EMO 图像检测 接口,传入人物图片,获取 face_bboxext_bbox
  2. 调用本接口,将图片 URL、音频 URL 及上一步获取的 bbox 信息一并提交,获取 task_id
  3. 调用查询视频生成结果接口,使用 task_id 轮询任务状态,直到获取生成的视频 URL。

错误码

大模型服务通用状态码请查阅错误信息

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

Header 参数

enum<string>
必填

固定值 enable,启用异步模式。

enable

请求体

application/json
enum<string>
必填

模型名称,固定为 emo-v1

emo-v1
object
必填
object

响应

200-application/json
string

本次请求的唯一 ID。

object