cURL
请先获取 API Key 并配置为环境变量。
模型概览
模型简介
| 模型名 | 模型简介 |
|---|---|
| emo-v1 | 悦动人像 EMO,基于人物肖像图片和音频,生成口型与音频同步的唱演视频。适用于数字人播报、音乐 MV、虚拟主播等场景。 |
| 模型名 | 计费单价 | 任务下发接口 QPS 限制 | 同时处理中任务数量 | 免费额度 |
|---|---|---|---|---|
| emo-v1(1:1) | 0.08 元/秒 | 5 | 1 | 1800 秒 |
| emo-v1(3:4) | 0.16 元/秒 | 5 | 1 | — |
前置条件
在调用本接口前,需先调用 EMO 图像检测 接口对人物图片进行检测,获取 face_bbox(人脸边界框)和 ext_bbox(扩展边界框),再将其传入本接口。
使用流程
- 调用 EMO 图像检测 接口,传入人物图片,获取
face_bbox和ext_bbox。 - 调用本接口,将图片 URL、音频 URL 及上一步获取的 bbox 信息一并提交,获取
task_id。 - 调用查询视频生成结果接口,使用
task_id轮询任务状态,直到获取生成的视频 URL。

