跳转到主要内容
效果调优

视频生成微调

优化视频生成提示词的方法与技巧

相关 API 参考

提示词公式

这里的提示词指正向提示词,用于描述视频的画面内容和运动效果。描述越准确详细,生成视频的质量越高。

基础公式

适合刚接触 AI 视频生成的用户,或用于获取创作灵感。简洁灵活的提示词往往能产生更具想象力的视频。
提示词 = 主体 + 场景 + 运动
  • 主体 — 视频的核心对象,可以是人物、动物、植物、物品或虚构对象。
  • 场景 — 主体所处的环境,包括背景和前景,可以是真实或虚构的环境。
  • 运动 — 主体的具体动作以及场景中的其他元素,从静止画面到微动、大幅运动、局部运动或整体运动均可。

进阶公式

适合有一定 AI 视频生成经验的用户。在基础公式之上添加更丰富、细致的描述,提升视频的质感、生动度和叙事性。
提示词 = 主体(描述)+ 场景(描述)+ 运动(描述)+ 审美控制 + 风格化
  • 主体描述 — 描述主体的外观细节,可用形容词或短句。例如:"身着民族服饰、黑发盘起的苗族少女"或"来自异世界的天神,身着残破却华丽的衣裳,背生一对由废墟碎片构成的奇异翅膀。"
  • 场景描述 — 描述主体所处环境的细节,可用形容词或短句。
  • 运动描述 — 描述运动的具体细节,包括幅度、速度和效果。例如"剧烈摇曳"、"缓缓移动"或"击碎玻璃"。
  • 审美控制 — 包括光源、光线环境、景别、拍摄角度、镜头类型和运镜方式。常用影视术语参见下方的提示词词典。
  • 风格化 — 描述视频的视觉风格,例如"赛博朋克"、"线稿插画"或"废土风"。常见风格参见下方的提示词词典。

图生视频公式

图片已定义了主体、场景和风格,因此提示词应侧重描述期望的运动和运镜方式。
提示词 = 运动 + 运镜
  • 运动描述 — 描述画面中元素的运动,如人物奔跑、动物摇手等。可用"快速地"、"缓慢地"等形容词控制运动的速度和强度。
  • 运镜方式 — 如果对镜头运动有具体要求,可使用"镜头推进"、"镜头左移"等提示词。如需保持镜头固定,可用"固定机位"来强调。

声音公式(Wan 2.5/2.6)

借助原生音频能力,可在提示词中添加入声、音效和背景音乐的描述,实现对声音效果的精细控制。
提示词 = 主体 + 场景 + 运动 + 声音描述(人声/音效/背景音乐)
  • 声音描述 — 描述视频中的声音元素及其随时间的变化,引导生成的声音内容和氛围与画面叙事精准匹配。主要包括三类:
    • 人声 = 角色台词 + 情绪 + 语气 + 语速 + 音色 + 口音
    • 音效 = 发声材质 + 动作 + 环境音
    • 背景音乐 = 背景音乐/配乐 + 风格
人声示例: 一位男士正在表演脱口秀。他用轻松的语气、适中的语速、清晰的嗓音、美式英语口音说:"好好学习,天天向上。"音效示例: 一颗小玻璃球从桌上掉落到木地板上,在安静的室内环境中发出"啪嗒"一声。背景音乐示例: 雨夜,一条阴森狭窄的走廊尽头有扇窗户,配上悬疑风格的背景音乐。

参考视频生视频公式(Wan 2.6)

Wan 2.6 支持通过引用输入视频中的主角来生成视频,可引用角色的外观、运动和音色。角色可以是人物、卡通形象、宠物或道具。
提示词 = 角色 + 动作 + 台词 + 场景
  • 角色 — 用 character1 等标识引用主角,最多同时引用三个角色。可在提示词中多次引用同一角色,精准控制其行为。
  • 动作 — 描述角色或其他元素的运动,包括静态姿势、表情和情绪变化、肢体动作、外部作用力和位移。
  • 台词 — 角色的说话内容,支持单个角色发言或多个角色对话。
  • 场景 — 角色所处的环境,包括背景和前景,可以是真实或虚构的环境。
示例:这是一个充满幻想的童话场景。character1 在草地上蹦蹦跳跳地玩耍,character2 在旁边的苹果树下弹奏钢琴。一个苹果掉在 character2 的头上,character1 指着 character2 开心地说:"你快要变成科学家啦!"
此示例中,character1 的参考视频是一只兔子,character2 的参考视频是一只狗,每个参考视频仅包含单个角色。

多镜头公式(Wan 2.6)

Wan 2.6 支持生成多镜头连贯叙事的视频。可通过提示词精确控制镜头结构、机位和时长,确保主体、场景、氛围等关键元素在不同镜头间保持一致。
提示词 = 整体描述 + 镜头编号 + 时间戳 + 镜头内容
  • 整体描述 — 简要概括整个视频的内容,说明故事主题、叙事风格、核心情绪或核心事件,帮助 AI 把握整体叙事方向。
  • 镜头编号 — 为每个镜头编号,区分视频中不同场景或片段的顺序,使视频结构更加清晰。
  • 时间戳 — 指定每个镜头在视频中的时间范围,确保镜头内容与视频时间线对应,提升生成准确度。
  • 镜头内容 — 描述每个镜头中主角或物体的具体行为,包括动作、语言、表情和姿势。可参考单镜头的通用提示词写法。
示例 这是一个关于"放弃与重拾"的短篇故事,以第三人称视角展开的短剧。 镜头 1 [0--3 s] 男孩独自坐在操场角落,低头看着手中的一封信,轻轻叹了口气,眼神充满迷茫。 镜头 2 [4--6 s] 硬切转场,固定机位,聚焦男孩湿润的眼睛,眼角含泪,表情失落而无助。 镜头 3 [7--10 s] 硬切转场,场景切换到一间朴素的教室,一位眼神温柔而坚定、穿着素雅的女生带着温暖而坚定的微笑走向男孩,安慰他。

提示词优化技巧

1. 自动优化:开启 prompt_extend 参数

调用 API 时,开启 prompt_extend 参数,系统会自动优化并重写你的正向提示词。该功能对简短、通用的提示词效果较好,例如"一只小猫在雪地里玩雪球"。
prompt_extend 在 API 调用中的使用示例,请参见文生视频图生视频开发者指南。

2. 利用提示词公式生成提示词

当需要精确控制画面细节、风格或复杂动态时,可使用结构化的提示词公式来编写提示词。 可将公式作为 system message 提供给大语言模型(如 qwen3.7-plus),由其生成结构化的提示词。
本示例使用 OpenAI SDK。运行前请先安装依赖:
pip install openai
更多代码示例,请参见文本生成模型概述
输入示例
import os
from openai import OpenAI

try:
  client = OpenAI(
    # 如果未配置环境变量,请将下行替换为你的 API Key:api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
  )

  completion = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
      {"role": "system", "content": "你是一个提示词优化助手。提示词公式为:提示词 = 主体 + 场景 + 运动 + 声音描述(人声/音效/背景音乐)\n声音描述:描述视频中的声音元素及其随时间的变化,引导生成的声音内容和氛围与画面叙事精准匹配。主要包括三类:人声、音效和背景音乐。\n人声 = 角色台词 + 情绪 + 语气 + 语速 + 音色 + 口音\n示例:一位男士正在表演脱口秀。他用轻松的语气、适中的语速、清晰的嗓音、美式英语口音说\"好好学习,天天向上\"\n音效 = 发声材质 + 动作 + 环境音\n示例:一颗小玻璃球从桌上掉落到木地板上,在安静的室内环境中发出\"啪嗒\"一声。\n背景音乐 = 背景音乐/配乐 + 风格\n示例:雨夜,一条阴森狭窄的走廊尽头有扇窗户,配上悬疑风格的背景音乐。"},
      {"role": "user", "content": "一只小猫在雪地里玩雪球"},
    ],
  )
  print(completion.choices[0].message.content)
  # 如需查看完整响应,请取消下行注释
  # print(completion.model_dump_json())
except Exception as e:
  print(f"Error message: {e}")
输出示例
主体:一只毛茸茸的小猫
场景:冬日清晨的积雪小院,雪地里铺着厚实松软的积雪,远处有结霜的树枝和一个小雪人
运动:小猫用前爪滚起一个小雪球,笨拙地往前推。突然雪球碎裂,小猫吓得往后一跳,随后又好奇地凑上前,打了个喷嚏,翻了个跟头,继续用头顶着雪球玩耍
声音描述:
- 人声:无
- 音效:小猫踩在雪地上柔软的"咯吱咯吱"声;雪球滚动的"沙沙"声;雪球碎裂的"咔嚓"声;小猫可爱而清脆的"阿嚏"喷嚏声;它翻滚时积雪落下的"簌簌"声
- 背景音乐:轻快温暖的钢琴曲,带有儿歌风格,节奏跳跃,像小动物在嬉戏玩耍,营造出充满童趣的冬日氛围

完整提示词:
一只毛茸茸的小猫在冬日清晨的积雪小院里玩雪球。它用前爪滚起一个小雪球,笨拙地往前推。突然雪球碎裂,小猫吓得往后一跳,打了个喷嚏,随后又好奇地凑上前,最后用头顶着雪球、翻滚着继续玩耍。音效包括脚踩积雪的"咯吱"声、雪球滚动的"沙沙"声、碎裂的"咔嚓"声、小猫的"阿嚏"喷嚏声以及积雪落下的"簌簌"声。背景音乐为轻快温暖的儿歌风格钢琴曲,营造出温馨可爱的冬日氛围。

提示词词典

以下示例如非特别说明,均使用 Wan 2.2 生成。声音生成示例使用 Wan 2.5 Preview 生成。

声音生成

生成带有同步音频的视频时,需要描述与画面匹配的人声、环境音等元素。

人声

单人说话
单人说话,低角度拍摄,广角,大窗户透入自然光,柔光,暖色调,中心构图。一位古典面容的女性模特,拥有飘逸的赤褐色长发,被框在一个装饰着新鲜黄色野花(如油菜花)的华丽金色画框内。她身穿浅黄色连衣裙,点缀着闪闪发光的圆形黄色亮片,搭配半透明蕾丝长手套。她的右手搭在画框边缘,左手向前伸出,指尖贴在看不见的屏障上,手指和前臂微微绷紧。画框内的背景融入朦胧的天空般的薄雾。广角镜头使视角略有弯曲,前景的野花在边缘虚化,增强了人物从艺术品中浮现或被其中的超现实效果。高处的窗户透入阳光,在她的面部和镀金画框上投下柔和均匀的光线,突显了花瓣和织物的质感。环境音:轻柔的管弦乐弦乐在背景中微微响起。她轻声低语:"这是自由……还是另一种牢笼?"
多人对话
多人对话,暖色调,大窗户透入自然光,柔光,中景,中心构图。复古木质镶板餐厅,深色木质墙壁和一扇大窗户,窗外是郁郁葱葱的绿色植物。阳光透过窗户射入,为场景投射出柔和的侧光。餐桌上摆满了烤火腿、新鲜面包、葡萄、银质餐具和闪闪发光的茶壶。左侧的白人男性穿着深色西装、白色衬衫和黑色马甲,表情严肃专注,说话时嘴唇动作清晰。对面的白人女性留着棕色短发,身穿带有精致碎花图案的深色连衣裙,面容平静略带忧郁,眼神微垂,陷入沉思。他们的手轻放在桌面上,没有动作。男性低声说道:"我们不能一直假装什么都没变。"女性轻轻叹了口气,喃喃回应:"但如果遗忘比记住更痛呢?"
音色
月光,柔光,侧光,中近景,中心构图。舒适的儿童卧室内,银白色的月光透过窗户在木地板上投下柔和的阴影。一位约 6 岁的白人小女孩蜷缩着靠在蓬松的枕头旁,穿着带有小星星图案的浅粉色睡衣。她紧紧抱着一个超大的棕色泰迪熊,小脸埋进柔软的毛绒中,然后微微抬起,天真而温柔地低语:"别怕,我会保护你的。"她宽大的眼睛在昏暗的光线中微微发亮,充满真诚和安静的勇气。相机在与视线齐平的高度保持稳定,捕捉她嘴唇微动的细节,她再次开口,声音几乎像呼吸般轻柔:"我在这里。"背景中隐约传来房屋的吱呀声和远处的虫鸣声,微风吹过窗户旁的薄纱窗帘。
唱歌
超现实风格,中全景,白天,晴光,柔光,侧光,暖色调,中心构图。两位年轻的白人女性身处一片翠绿起伏的草地中,背景是纯净的蓝天和朵朵白云。前景中,一位二十多岁、皮肤白皙有雀斑的女性穿着天蓝色针织背心,微卷的棕色头发裹着浅蓝色头巾。她侧躺在柔软的草地上,右手轻托脸颊,左臂自然伸展。她清澈的目光直视镜头,嘴角带着浅浅的微笑。微风轻拂她的头发和衣服。在她身后,另一位年轻女性靠在一个巨大的卡通风格粉色蘑菇上,蘑菇上点缀着白色圆点。她戴着酒红色针织发箍,穿着黄色吊带和飘逸的白色长裙,裙摆在风中微微摇曳。她闭着眼睛,表情宁静满足,仿佛沉浸在阳光下的梦境中。蘑菇表面光滑色彩饱和,像童话中的道具。画面伴随着轻柔的民谣吉他音乐。前景中的女性轻声哼唱:"追随光芒,野花生长的方向",嗓音清澈柔美。背景中鸟鸣声和远处树叶的沙沙声传来,增添了自然的宁静感。

音效

脚步声
蒸汽朋克风格,黄昏,混合光源(煤气灯与霓虹灯交织),侧光,冷色调中透着橙红色光晕,中全景,中心构图。镜头缓缓推进,展现维多利亚城市一条昏暗狭窄的铁路小巷。青石板路面泛着潮湿的光泽,浓雾缓缓流淌,缠绕在生锈的铜管和蒸汽阀门周围。一群复古风格的机器人列队前行,关节处不时冒出小团蒸汽。脚步声,金属脚掌敲击地面有节奏的"嗒嗒"声。深背景处,一座巨大的齿轮状建筑耸立而起,外墙上交错着传动杆和压力计。顶端矗立着一座无线电塔,持续发出苍白的蓝色电弧。霓虹招牌"WAN"在雾中闪烁,伴随低频的电流嗡鸣。
敲门声
低角度,中景,均衡构图,冷色调,昏暗光线,仅远处街灯投射出微弱的侧背光。一位孤独的私家侦探,中年白人男性,穿着竖起衣领的风衣,软呢帽下露出锐利警惕的目光。他站在一条狭窄昏暗的小巷尽头,面前是一扇饱经风霜、油漆剥落的木门,灰绿色的漆面已褪色。被雨水打湿的鹅卵石在巷口摇曳的微弱灯光下闪闪发亮。侦探抬起右手,用食指关节以精确的节奏敲门:轻敲两下,再重重敲一下,重复三次。每次敲完后他都停顿一下,微微侧头倾听,下巴紧绷,表情严肃。
物体坠地
俯拍角度,顶视图,柔光,白天,中心构图,冷色调。中近景画面中,一只手用拇指和食指捏着一颗白色乒乓球,悬在木质桌面正中央。球体松手后在重力作用下垂直下落,触桌面时发出清脆的"嗒"声,随即弹起至低于起始高度。这一动作不断重复,每次弹跳力度逐渐减弱,伴随的清脆敲击声也 progressively 减弱。背景为虚化的室内元素——隐约可见台灯和书架。随着过程推进,球体的垂直运动逐渐衰减,最终静止在桌面上。有节奏的"嗒嗒"声与每次弹跳精准同步。
撞击声
低角度,中近景,白天,柔光,中心构图,冷色调。一辆红色小玩具车停在倾斜 30 度的光滑纸板坡道顶端,在漫射的室内光下车身微微反光。坡道尽头被一堵垂直的白墙截断。松手后,玩具车缓缓滑下,沿坡道平稳加速,塑料车轮在光滑的纸板表面无声滚动。到达底部后,玩具车前保险杠撞到墙面,发出短促清脆的撞击声。碰撞使前车盖微微凹陷,足以看出损坏痕迹。动量反转,玩具车向后弹回,在平地上滚行约 20 厘米后最终停下。
火焰燃烧声
特写,侧光,白天,冷色调渐变暖色调,中心构图,柔光。一块纯净无瑕的冰块占据画面中心,内部冻结着细小的气泡,表面凝结着霜花,晶莹剔透。突然,冰芯中央窜出一簇火焰,橙红色的火光逐渐蔓延。冰块并未融化,而是仿佛经历了材质转换,变成了炽热的木炭与熔岩纹理。火焰从内向外吞噬冰块,从透明渐变为不透明的黑色木炭与深红色交织,火星四溅,光影摇曳。最终整块冰化作熊熊烈火,仍保持着最初的立方体形状。背景是深蓝色的天空,微风轻拂,空气中飘浮着细碎的霜尘。火焰燃烧的噼啪声中夹杂着低沉的嗡鸣。
游戏音效
8 位像素风格,俯视角画面。屏幕上展现迷宫般的地下城,笼罩在黑暗之中。只有身穿银色盔甲的骑士周围亮着一圈像素化的光晕,仿佛头顶悬浮着微弱的魔法灯,形成中心构图。身披闪亮银甲、手持长剑的骑士稳步前行,每步都是逐帧动画,落脚时地面微微震动。他穿行在狭窄通道中,墨色黑暗随着他的移动逐帧退散,新的路径和房间以像素化的淡入效果出现。当他踩到隐藏的压力板时,远处石墙发出"咔嚓"声效,以像素风格的机械动画缓缓滑开,露出一个藏有巨大宝箱的密室。背景音是低沉循环的 8 位冒险音乐,间或传来滴水和回荡的脚步声。宝箱开启的瞬间,金光迸发,伴随着清脆的"叮!"声效。
电子音效
故障音效,VHS 故障美学,CRT 扫描线效果,倾斜角度,中景,对称构图。光线为霓虹灯与屏幕光混合,暖色调。一个赛博舞者在 80 年代复古 VHS 噪点中出现,身处昏暗的地下街机厅,周围是旧式游戏机和闪烁的显示器。这个人形生物拥有镀铬四肢、发光的红色光学传感器,暴露的机械关节闪烁着电蓝色的光。节拍响起后,它开始一系列精准而僵硬的动作——手臂突然折叠成锐角,头部旋转 180 度,一条腿不自然地向前伸展——动作模拟模拟磁带的卡顿效果。每个动作都伴随着视觉故障转场:画面扭曲成滚动的雪花噪点,然后通过 CRT 水平扫描线切换到下一个姿势。身后,霓虹粉和青色光在抛光金属表面上反射。音频是复古合成波音乐,带有稳定的电子脉冲。背景音效包括旧电子设备低沉嗡鸣、偶尔磁带倒转的咔嗒声,以及远处失真的无线电通话。
ASMR
ASMR,一把黑色刀具从右向左切入放置在浅色木质砧板上的白色蓬松云朵状物体。云朵接触刀面时产生形变,表面裂开,被切下的部分发生位移。云朵边缘持续升起轻烟。切割完成后刀面静止,云朵被一分为二,一侧发生塌陷。整个过程伴随轻微的"嘶嘶"声和干冰升华的气流声。
动物声音
逆光,柔光,广角镜头,中心构图。一位戴着圆顶礼帽、身穿剪裁考究的深色长外套的中年秃顶男子,背对镜头在广阔开阔的荒野中缓慢前行。外套下摆在风中飘动。他的四周环绕着一大群体态丰满的纯白色绵羊。它们在他前方整齐地分开,又在身后合拢,宛如一条流动的河流。干燥的土黄色草地在淡蓝色天空下缓缓起伏,一直延伸到地平线。阴沉的日光均匀散落,笼罩着整个场景。空气中一片安静,只有绵羊移动时羊毛摩擦的轻微沙沙声和远处传来的叫声。他向前走时,左侧一只绵羊抬起头,发出轻柔的"咩"声。
键盘声
一只手在由各种饼干和糖果组成的键盘上敲击按键。每次指尖落下,对应的饼干键帽微微下沉后迅速回弹,同时发出清脆的"咔嗒"声,融合了饼干的酥脆感和机械键盘的清晰反馈。咖啡表面微微荡漾,桌面和杯子上的光影轻轻摇曳。咖啡杯偶尔发出极轻微的"咕噜"声。手指继续以连续稳定的节奏按下不同的键帽。

环境音

自然环境
白天,暖色调,侧光,特写,中心构图。一位栗色卷发年轻女子身穿带有精致蕾丝花边的浅蓝色吊带裙,优雅地站在阳光照耀的花园中。她纤细的指尖轻轻捏住一朵粉色玫瑰花瓣的边缘,以流畅从容的动作将其从花朵上摘下。相机近距离聚焦她的手和花朵,捕捉每一个微妙的动作——指尖的微颤、花瓣与花茎轻柔的分离。她的面部柔和地虚化,目光低垂,表情宁静专注,嘴唇微启。身后是一片盛开的花海——牡丹、雏菊和薰衣草——渐变为绿色与柔色的虚化背景。阳光在她的肌肤和裙摆上投下柔和的高光,营造出自然的光晕。没有对话或人声;环境音包括树叶的轻轻摇曳声、远处鸟儿的鸣叫声以及微风拂过花瓣的声音。
城市环境
移轴镜头,中景,均衡构图。芝加哥"L"线列车在高架轨道上平稳行驶,穿梭于密集的城市峡谷之间。晨光从天空倾泻而下,为场景投射出柔和的方向性光线,突显车厢的金属光泽,同时在相邻摩天大楼上投下淡淡的阴影。列车保持清晰对焦,犹如精心制作的微缩模型,车轮在铁轨上发出咔嚓声,驶过弯道段,逐渐接近车站。车厢内的乘客虚化为柔和的轮廓,带有淡淡的运动拖影;周围建筑虚化成梦幻般的光斑,窗户闪烁着暖色调和冷色调。相机在轨道高度水平平移,形成无缝的追踪运动,增强微缩世界的视觉错觉。背景音效包括列车的节奏隆隆声、远处的城市嗡鸣、偶尔的刹车尖叫声和公共广播系统中模糊的报站声。
特定空间
轮廓光,逆光,低对比度,冷色调,低饱和度,中全景,长焦镜头。以太空为背景,一位身穿白色宇航服的宇航员在深邃的黑色太空中缓慢漂浮。头盔表面反射着遥远恒星的微光,面罩内隐约可见他平静的面容。他右手稳稳地举着一台老式胶片相机,左手轻轻调整对焦环,对准地球按下快门,动作沉稳而专注。地球悬于画面右上方,完整的球体被蓝色大气层包裹,在黑暗中散发柔和的光晕。镜头微微推进,宇航员的身体随推力微微后仰,姿态失重自然。背景中,银河如光雾般横跨虚空,几颗星星缓缓闪烁。远处一颗流星划过,留下一道短暂的光迹。背景声音内容:极低频的宇宙背景辐射白噪声,以及航天器金属结构因温差产生的间歇性轻微"咔嗒"形变声。

背景音乐

情绪音乐
毛毡风格,柔光,白天,中景,中心构图。温馨快乐的氛围音乐。一座异想天开的彩虹色毛线桥横跨布料景观,毛线缓慢而有节奏地缠绕和松开。桥梁由厚实的毛毡羊毛制成,带有缝合接缝,每个拱形似乎像活的一样微微跳动。一辆用纽扣装饰的小汽车行驶在桥上,车轮由黑色线缝制,椭圆形塑料纽扣作车头灯。汽车驶过时,由红黄色毛线卷成的弹簧状小乘客从桥的隐藏缝隙中弹出,轻轻弹跳几下。每个弹簧乘客都有两颗黑色珠子眼睛和缝制的微笑。背景是绗缝棉布天空,点缀着刺绣云朵和手缝星星。配乐是柔和的木吉他音乐和布料的细微沙沙声。每当弹簧乘客弹出时,都伴随着轻柔的笑声:"嘻嘻!"相机保持静止,捕捉整个场景的清晰细节。
卡点音乐
卡点音乐,迪斯科球反射光,人造光,柔光,侧光,暖色调,中景,中心构图,低角度。一个拟人化的猫头角色,部分三花部分白色,站在黄色舞台中央。他穿着剪裁合体的白色西装,翻领上有黑色圆形图案,双手戴着蓬松的白色手套。他随着节奏举起右臂、弯曲左肘,双腿交叉摆出经典的 70 年代舞蹈姿势。猫的眼睛明亮,胡须微微抽动,耳朵随节拍抖动。上方,多个旋转的迪斯科球将光斑洒满整个空间。背景是黑白棋盘格墙壁和巨大的复古音箱。地板由红蓝紫色的面板组成的舞池向远处延伸。当放克音乐响起,伴随着清晰的鼓点和低音贝斯,他哼唱着:"我是夜之王,灯光下的舞王,像猫一样喵但像人一样跳舞——耶!"光影流转间,彩色光斑在他的西装表面舞动。背景音是人群欢呼和复古合成器旋律的混合。
轻音乐
定格动画,中景,对称构图。光线冷暖混合,光源来自真实的纸灯笼和透过半透明宣纸的月光,辅以柔侧光。整个场景由多层纸张构成的极简二维世界。下方,蓝绿色的折叠纸波浪轻轻荡漾。一艘精致小巧的白色折纸船带着清晰的折痕在变幻的光影中平稳前行。突然,黑色剪纸触手从深处缓缓伸出,一只巨大的纸章鱼出现,哑光表面仿佛在吞噬光线。然后,在透过半透明描图纸天空洒下的柔和月光下,发光的纸水母群有节奏地漂浮,它们的边缘巧妙地被逆光勾勒。背景音乐是安静的钢琴曲,偶尔伴随清脆的风铃声,共同营造出宁静神奇的氛围。

影视审美控制

通过编写不同维度的提示词,可以提升生成视频在特定维度的可控性和表现力。

光源类型

日光
轮廓光,低对比度,中近景,日光,左侧重构图,干净的单人镜头,暖色调,柔光,晴光,侧光,白天。一位少女坐在高高的草丛中,身后站着两只毛茸茸的驴。女孩约十一二岁,穿着简单的碎花连衣裙,头发扎成两条辫子,脸上带着天真烂漫的笑容。她盘腿坐着,轻轻抚摸身旁的野花。驴子体格健壮,耳朵竖起,好奇地望向镜头。阳光洒满田野,构成温暖自然的画面。
火光
火光,过肩镜头。一位穿着白色衬衫和棕色马甲的男子站在壁炉前,看向镜头右侧的人物。
阴天光
中焦,柔光,低对比度,轮廓光,低角度,阴天光,低饱和度,中近景,干净的单人镜头,冷色调,中心构图。低角度镜头捕捉一名男子的户外近景。他穿着黑色衣服、灰色毛衣、白色衬衫和黑色领带。他看着镜头向前走。身后是一栋棕色建筑,窗户内透出黄色灯光。前方是一扇黑色的门。相机向前移动。镜头右侧,一个模糊的黑色物体来回摇曳。背景为黑色。
晴光
日落,暖色调,中景,低饱和度,日光,侧光,晴光。在厨房中,一位白人男性正在准备食物。中近景平视镜头,他穿着白色衬衫和黑色领带,站在摆有蓝色杯子、糖罐和其他调味品瓶子的桌子旁。他从糖罐中舀一些糖放入杯中。虚化的背景是贴有花卉壁纸的墙壁,墙上挂着一个装满物品的白色柜子。阳光从窗户射入。

光线类型

柔光
日落,柔光,侧光,轮廓光,暖色调,低饱和度,中心构图,中近景,平视拍摄。一对情侣站在一辆黄色出租车旁,半身镜头。男子穿着米色风衣,领子微微竖起,双手插在口袋里,面带微笑,身体微微前倾。女子戴着绿色贝雷帽,搭配同色系连衣裙和蕾丝手套,优雅地挽着男子的手臂,身体微微靠向他。背景中隐约可见复古风格建筑的轮廓。两盏绿色街灯投射出温暖的光晕。远处,一名身着经典制服的警察笔直站立,增添了城市街景的真实感。光线从画面右侧射入,在人物轮廓上形成柔和的轮廓光。整体色调金黄,营造出自然温馨的氛围。
硬光
硬光,侧光,中景,低饱和度,高对比度,中焦,平视拍摄,男性特写。他穿着条纹衬衫,坐在木质桌子旁,桌上放着一些文件夹和一部红色电话。他的双臂交叉在胸前,头部靠在墙上。他的眼睛闭着,嘴巴微微张开,正在说话。前景有一个模糊的人物身影。背景是深色木质墙壁,挂着一幅画和其他装饰物。整个场景传达出一种安静、沉思的氛围。
侧光
轮廓光,侧光,柔光,中近景,黄昏,日落,中心构图,暖色调,低饱和度,长焦镜头。一位蓬松棕色卷发的女子优雅地站在一座华丽的彩色玻璃窗前。她穿着飘逸的白色长裙,头发整齐地向后梳。透过窗户的彩色光线轻柔地照亮了她柔和的面部轮廓。女子正在与画外某人交谈,但眼中闪过一丝悲伤,为她神秘的气质增添了一层深度。背景昏暗,光影对比强烈,进一步凸显了角色情绪的张力。彩色玻璃在夕阳下投射出斑斓的光影,增强了整体画面的艺术感和氛围感。
高对比度
高对比度,高饱和度,短边构图,日落,中焦,柔光,逆光,暖色调,轮廓光,中近景,日光,晴光。一位穿着黄色格子连衣裙、戴着耳环的白人女性的近景。随着低角度相机上升,这位女性抬头仰望,眼中含泪,望向前方并说话。虚化的背景是一面白色砖墙,上面挂着一幅画。下方是一个木柜,放着花瓶和台灯,旁边是一把椅子。左侧是一个棕色柜子,上面放着台灯,后面是一扇敞开的门,外面有阳光照射进来。

时间段

白天
日出,白天,柔光,侧光,轮廓光,中近景,中心构图,暖色调。一位白人女性坐在白色大床上,穿着蓝白格子棉质上衣。她的头发凌乱蓬松,呈自然的金棕色波浪卷。她的面容略带疲惫,温柔地望向镜头,仿佛在交谈。阳光透过浅米色窗帘洒入房间,在床单和墙壁上投射出柔和的光影。白色铁艺窗栏环绕着窗户,增添了室内安静温馨的氛围。相机聚焦于女子上半身,背景虚化以突出她的情绪以及与环境的微妙互动。
夜晚
实景光,高饱和度,混合光,夜晚,顶光,柔光,全景,对称构图,广角。在昏暗的灯光下,平视镜头捕捉到两人坐在桌前交谈的全景。左侧的男子穿着绿色毛衣和白色裤子,专注地看着右侧的女子。女子穿着条纹衬衫和蓝色牛仔裤,手里拿着一本书或文件夹。他们周围充满了复古氛围,摆放着老式家具、吊灯和窗帘背景。桌上还放着一些物品。
黎明
黎明,火光,左侧重构图,冷色调,低对比度,俯拍。视频中,镜头缓缓推进,聚焦于弓箭手的眼睛和箭。弓箭手穿着户外服装,目光专注。当他的手指松开弓弦时,箭迅速离弦。镜头继续推进,捕捉弓箭手专注的表情和箭开始移动的瞬间。背景是简单的户外场景,有树木和草地。

景别

特写
一名男子的面部平视特写。他有蓝色眼睛,秃顶。脸上布满汗水。他盯着镜头,然后低下头。屏幕底部出现白色英文字幕"My little Max..."。背景虚化模糊。相机向上移动,俯拍男子后脑勺的特写。
近景
轮廓光,近景,日光,柔光,低饱和度,中心构图,白天。平视镜头中,三个人物构成画面。中间是一个穿红色校服的男孩,约十五六岁,微卷的金发,五官分明,表情专注。他先看向左侧,然后迅速转头看向右侧,再回头看向左侧,嘴唇开合,仿佛在对话。他的动作自然流畅,眼神随转头而变化。右侧是一位女性的虚化面部,只露出半张脸,约三十多岁,表情模糊。背景是教室环境,墙上挂满黑白相框。隐约可见几位穿红色校服的学生身影。前景中,一个模糊的身影快速从镜头前经过,增添了动感。光线柔和均匀,整体色调偏中性,突出了画面的层次和细节。
广角
中心构图,广角,大远景,逆光,定场镜头,实景光,暖色调。在阳光照射下的罗马广场上,穿着长袍的演员们围着一张大理石桌子争论。镜头缓缓向右移动,捕捉他们激烈的讨论和手势。背景中,一辆马车缓缓驶过鹅卵石街道,发出吱吱声。一位历史学家的画外音讲述了那个时代的政治紧张局势,将历史与现代视角融合在一起。画面中的演员表情严肃,动作自然,仿佛真实的历史重现。

构图

中心构图
柔光,暖色调,中近景,中心构图,黄昏,清晰日光,轮廓光。镜头缓缓推进,聚焦一位风度翩翩的老年绅士的面部。他有着醒目的银白色长发和修剪整齐的飘逸胡须。他穿着剪裁合体的深色西装和同色系领带。他举止优雅。柔和温暖的光线包裹着他的面部,形成淡淡的轮廓光,如同黄昏时分透过窗户的阳光。他的表情若有所思。他凝视着远方,沉浸在思绪或回忆中。背景虚化。这突显了他饱经风霜、睿智而平静的面容。每一道皱纹似乎都在诉说一个不为人知的故事。
右/左侧重构图
过肩镜头,特写,中焦距,柔光,低对比度,左侧重构图,阴天光,干净的单人镜头。正面特写展示一位女性在户外花园中行走。她穿着浅色服装。她的头发盘在网兜中。她的表情专注而若有所思。她望向远方。她的头微微转动,仿佛在观察周围环境。背景是修剪整齐的花园,有整齐的树篱和远处的雕塑。场景宁静祥和,可能是在乡村庄园。

镜头

镜头焦距
长焦
近景,柔光,日光,侧光,晴光,干净的单人镜头,长焦镜头,冷色调,中心构图。男子面部平视特写。他穿着黑色西装和白色衬衫,系着红色领带。他的头发花白,眼窝深陷,眼周有两道皱纹。他的嘴唇紧闭,表情严肃而专注。背景模糊,但可以看出是室内环境,可能是办公室或会议室。男子身后有一扇窗户,透过玻璃可以看到外面的世界。
超广角鱼眼
均衡构图,顶光,暖色调,低对比度,超广角鱼眼,群像镜头。一群白人男女围站在白色墙壁的圆形洞口旁,向下俯视。低角度近景拍摄中,他们的表情各异,展现出惊讶、好奇和兴奋。其中一人正拿着一个棕色纸袋并打开它。他穿着黑色衣服,金色头发。其他人围在他身边,面部被光线照亮,看起来非常清晰。背景墙壁为白色,与人物形成鲜明对比。
拍摄角度
过肩角度
双人镜头,长焦,暖色调,过肩镜头,高对比度,柔光,日光,白天,近景,中心构图。一个女孩坐在窗边。平视视角下,她穿着红黑条纹毛衣,内搭蓝色高领衫。金色的短发柔顺地垂在耳后。她温柔地望向画外的人,嘴角带着浅浅的微笑,表情自然亲切。她的双手轻叠在桌上,桌上放着一本打开的书和一个冒着热气的白色陶瓷杯。背景虚化,日光从窗外柔和地射入。隐约可见温暖的黄色灯光和零星的红色装饰,营造出温馨的氛围。
高角度
高角度,日光,超广角鱼眼,干净的单人镜头,混合色调,白天。俯视特写,一名男子坐在橙色出租车的后座上。他穿着黑色夹克和灰色毛衣,目光望向车窗外,表情严肃而深思。出租车正在行驶,背景是城市街道,可以看到其他车辆和建筑。男子腿上放着一个银色双把手支架。他的双手放在膝盖上,手指轻轻敲击着膝盖。
航拍
暖色调,大远景,航拍,晴光,硬光,白天,定场镜头。在荒凉的沙漠中,一辆黑色 SUV 正在公路上飞驰。俯视镜头下,车辆行驶在道路左侧。车顶有行李架和红色尾灯。镜头缓缓推进。车辆前方是一望无际的黄色沙丘,远处隐约可见几座山峰。天空呈淡蓝色,阳光穿透云层,为这片荒凉的土地带来一丝温暖。道路两侧是干燥的草地,点缀着一些低矮的灌木。
镜头类型
干净的单人镜头
近景,俯拍角度,顶光,柔光,黎明,低对比度,高角度,低饱和度,日光,干净的单人镜头,长焦,荧光灯,冷色调,中心构图。在昏暗的环境中,一位白人女性仰面漂浮在水中。俯视特写中,她留着棕色短发,脸上有几颗雀斑。随着相机向下移动,她将头转向右侧,水面泛起涟漪。虚化的背景漆黑一片,只有微弱的光线照亮了女性的面部和部分水面,呈现出蓝色。她穿着一件蓝色吊带裙,肩膀裸露。
双人镜头
双人镜头,日光,柔光,侧光,中景,过肩镜头,右侧重构图,中焦,暖色调。一名穿着剪裁合体深色西装、浅蓝色衬衫和深色领带的男子的近景。他面对镜头,头部微微侧转,与镜头左侧的人交谈,表情自然平静。镜头左侧是一位女性的虚化侧面轮廓。她穿着灰色连衣裙,黄色头发整齐地挽成低发髻,身体微微前倾,仿佛在倾听或回应男子。背景是白色墙壁和一扇半开的灰色木门,全部虚化以突出主体。男子站姿挺拔,左手轻放在腰间,右手做出轻微手势,展现出对话中的自然动感。
群像镜头
中焦,柔光,暖色调,火光,群像镜头。在昏暗的教堂中,一位身穿黑色长袍和面纱的女性手持点燃的白色蜡烛。平视近景中,她表情严肃,缓缓向前走。相机随她后退移动,虚化的背景中可以看到其他教友手持蜡烛坐在椅子上。他们穿着正式的服装,表情庄严肃穆。远处的墙上有一扇拱形窗户,微弱的光线从中透入。
定场镜头
高对比度,定场镜头,硬光。在黑白小巷中,雨水在路灯下照亮的路面上闪烁。一个穿风衣的身影走到画面中央,手里夹着香烟,缕缕青烟缓缓飘出。霓虹灯在滴水消防梯上方无声地闪烁。相机缓缓向右移动,捕捉消防梯上雨滴滴落的细节。背景墙和地面反射着微弱的光线。

色调

暖色调
左侧重构图,日落,柔光,暖色调,中近景。一位女性穿着剪裁合体的深棕色羊毛大衣,毛领环绕着她的脸庞。她的金色长发梳成复古发型。她坐在木质长椅上,身体微微倾向另一位虚化的女性角色。她们手里拿着热饮,轻声交谈。随着对话的进行,她的笑容逐渐扩大,眼睛弯起,表情充满真诚的喜悦。背景中虚化的人群缓慢移动,营造出温暖亲密的氛围。夕阳的余晖勾勒出她的侧脸,柔和的光线增强了她表情的变化与情感的流动。
低饱和度
轮廓光,近景,柔光,低饱和度,冷色调,中心构图。平视镜头中,一位老年男子的面部轮廓清晰可见。他戴着宽边黑色帽子,长长的白发从帽檐下露出,垂落在灰色羊毛大衣的领口。他的眼睛微微闭合,嘴唇微启,仿佛在低声诉说着什么。背景虚化,呈现出冷色调的城市街景。一只手臂从画面右侧伸出,手持一把黑色手枪,枪口轻轻贴在老人的太阳穴上,营造出一种紧张而安静的氛围。

动态控制

运动

街舞
一群充满活力、风格各异的街舞舞者在明亮霓虹灯照射的宽阔舞台上表演街舞。侧光勾勒出他们的轮廓,形成光环效果。电影级广角镜头捕捉他们同步的动作、充满活力的能量和青春洋溢的表情。快节奏的镜头运动与音乐节拍相匹配,展示复杂的脚步动作、爆发力和团队默契。
跑步
跑步场景。短跑运动员的面部因极度用力而扭曲,肌肉紧绷,牙齿紧咬。他穿着轻便的田径背心、短裤和专业钉鞋。他以全速向 100 米赛道的终点冲刺。身体前倾,头部突出,双臂以最大幅度和频率摆动。一条腿爆发性蹬地,另一条腿大步向前。他的胸部撞断终点线彩带。背景是模糊的跑道和观众。计时器显示关键时间。终点线彩带清晰可见。
乒乓球
室内乒乓球比赛的平视近景镜头。两名男子正在进行激烈的比赛。一名穿橙色衬衫的男子挥拍击球。另一名穿灰色衬衫的男子专注地接球。附近,一位穿蓝色衬衫的观众双臂交叉,全神贯注地观看。画面采用固定机位拍摄,无相机运动。室内光线柔和。背景中隐约可见观众席和运动器材。纪实摄影风格。近景。
滑雪
一名单板滑雪运动员在 U 型池中完成高难度空中旋转。视频采用跟拍视角和广角镜头,营造出身临其境的视觉体验。滑雪运动员从雪坡上腾空而起,在蓝天的映衬下完成优美的翻转抓板动作,并稳稳落地一气呵成。明亮的阳光、壮丽的雪山背景以及滑雪运动员色彩鲜艳的装备和滑板,构成了一幅力量与美感的壮观画面。完美展现了单板滑雪的速度、技巧和自由精神。

角色情绪

高兴
一位面容和善的老人,戴着草帽,穿着工装裤,站在阳光明媚的菜园里。他手里拿着一个成熟的番茄,非常开心,眼中闪烁着纯粹的喜悦。
惊讶
一位年轻女孩推开门,脸上露出惊讶的表情,看到了一个完全意想不到的场景。

基础运镜

镜头拉远
一个柔软圆润的动画角色带着好奇的表情醒来,发现自己的床是一颗巨大的金色玉米粒。镜头拉远, reveal 房间是一个巨大的回声玉米筒仓,玉米粒堆成高耸的墙壁。温暖的阳光从高处的窗户射入,在地板上投下长长的阴影。
镜头向左移动
繁华城市商业街的橱窗。镜头向左移动,缓缓掠过一家奢侈品店的橱窗,里面展示着迷人的模特和昂贵的商品。镜头继续左移,离开橱窗,展现出附近小巷角落里一个衣衫褴褛的流浪汉蜷缩在角落里瑟瑟发抖。

高级运镜

复合运镜
无人机镜头,快速穿越,从一根结满霜、带有裂痕的圆形管道内部仰视。随后,镜头迅速飞出管道,展现出广阔的极地雪原。正值日出或日落时分,金色的阳光洒满大地。雪地上,一栋建筑旁,几名身穿橙色防寒服的工人似乎正在操作发出白色蒸汽的设备。镜头上摇。这个视角来自一个正在上升的热气球。热气球拖着长长的蒸汽尾巴,飞向朝霞或晚霞染红的天空。最后,视频呈现热气球的全景——一个蓝色热气球,上面印有白色字母"CNG",在壮丽的极地景观中越飞越高。
环绕运镜
逆光,中景,日落,柔光,剪影,中心构图,环绕运镜。镜头跟随角色从背后到正面,展现一位饱经风霜的牛仔紧握枪套,警觉地巡逻着一座荒凉的西部鬼城。牛仔穿着破旧的棕色皮夹克,腰间系着子弹带,帽子压得很低。夕阳为他勾勒出柔和的剪影。身后是破败的木质建筑,破碎的窗户、玻璃碎片散落在地面上,尘土在风中飞扬。镜头从他身后缓缓环绕到正面。光线来自后方,形成强烈的戏剧性对比。画面色调温暖,增强了荒凉的氛围。

风格化

视觉风格

毛毡风格
黄金时段阳光,柔光,中广角,低角度,暖色调。一座异想天开的村庄坐落在巨大的空心树干底部,周围环绕着茂密的绿色植物和蘑菇。戴着羊毛帽子的小毛毡侏儒在长满青苔的轨道上驾驶微型木制火车。火车由小型引擎牵引,小车厢里载着橡果和浆果。阳光透过上方的树叶,投下柔和的阴影,突显树皮和树叶的丰富质感。
3D 卡通
3D 卡通风格。这是一个超现实的梦境,一切由玉米构成。主角们乘坐玉米火车穿过巨大的玉米棒和玉米粒。场景沐浴在温暖的金色光线中,增强了梦幻般的质感。角色们穿着乡村风格的服装,在这个奇特的世界中穿行时展现出惊奇和好奇的表情。玉米火车平稳行驶,车轮由完美形状的玉米粒制成,营造出异想天开且迷人的氛围。
像素风格
在一个色彩斑斓的宇宙中,玩家控制的像素角色在各种形状和独特色调的星球之间旅行。每个星球都有奇怪的地形和外星生物。近景中,玩家角色站在画面中央,与一个友好的外星生物交谈。这个外星人有着圆滚滚的身体和大眼睛,看起来非常可爱。画面上方,像素化的星际风暴和能量漩涡效果缓慢旋转,带来动感。整体风格复古而又未来感十足,色彩明亮鲜艳。
木偶动画
在昏暗的维多利亚风格客厅中,蕾丝窗帘轻轻飘动。毛毡和木制木偶围坐在圆桌旁,摇曳的烛光照亮他们的身影。一声低语让瓷茶杯微微颤动,画中人物的眼神不安地游移。每一帧缓慢而刻意的木偶动画都加剧了紧张感。镜头缓缓向右平移,展示木偶的每一个细微动作,增强了诡异氛围。背景中的家具和装饰细节清晰可见。
黏土风格
黏土风格。在古老树根的缝隙中,隐藏着一座微型精灵村庄,由橡果、树皮、干花和苔藓建造而成。几个由小石块和嫩芽制成的精灵居民正忙碌着。一束阳光穿过树叶的缝隙,像舞台聚光灯一样照亮村庄的中央广场。
黑白动画
这是一段复古风格的黑白动画片段。场景设定在一节行驶中的火车车厢内,正在举行一场婚礼。车厢中央,一对新婚夫妇幸福地依偎在一起。他们面前的桌子上摆放着一个漂亮的三层婚礼蛋糕。两侧的宾客笑容满面,气氛温馨而欢快。突然,火车似乎剧烈颠簸了一下。桌布瞬间被拉走,蛋糕和花束纷纷掉落。这一突发变化打破了宁静。每个人的表情瞬间从喜悦变成夸张的震惊,身体因惯性摇摆,营造出一个充满戏剧性和喜剧感的混乱场景。

特效镜头

移轴摄影
移轴摄影。高角度俯瞰城市一角,聚焦于一个繁忙的十字路口,车辆和行人交织成一幅动态的城市画卷。交通灯交替闪烁,引导着交通的节奏。建筑物的边缘清晰锐利,色彩鲜艳,犹如精致的模型。街道两侧商店招牌林立,霓虹灯在夜晚闪烁,增添了微缩世界的奇幻感。整个场景经过精心渲染,突显了移轴效果的独特视觉冲击力,仿佛在观察一个繁忙有序的微型城市生态系统。
延时摄影
延时摄影,黄昏,日落,轮廓光,中全景,侧光,暖色调,柔光,适度对比度,中心构图。画面中,一个拟人化的金属机器人在繁忙的城市街道上行走。它的外壳散发着银灰色的光泽,身体结构精密,关节处有精细的机械纹理。机器人大约两米高,椭圆形的头部装有两个微微发蓝光的传感器作为眼睛。它自然地摆动手臂,步伐稳健,腿部关节发出轻微的液压声。街道两侧是高耸的玻璃幕墙建筑。夕阳的余晖洒在建筑和机器人身上,形成柔和的轮廓光。行人在背景中穿梭,模糊的人群增添了城市的节奏感。地面覆盖着深灰色沥青,部分区域反射着天空和建筑的倒影。