使用百聆音乐生成大模型(Fun-Music)根据提示词或歌词生成完整歌曲
百聆音乐生成大模型(Fun 音乐大模型)支持输入开放性歌曲的创作要求或歌词,生成整首男/女声演唱的中文或英文歌曲。歌曲通俗易懂,情绪由浅入深,是人类灵感与大模型能力的完美结合。
音乐生成模型:
前提条件
流式模式支持边生成边返回音频数据,适用于实时播放等场景。启用流式输出需要在请求头中添加
Fun-Music 内置专业歌词创作模型。当您选择自行提供歌词时,遵循以下规范可生成更高质量的音乐。
标准歌词结构应包含以下标签:
歌词示例
具体描述情绪、场景、乐器偏好,能生成更贴合需求的音乐。
音乐生成 API 参考
核心功能
- 根据提示词(prompt)自动创作歌词并生成完整歌曲
- 根据自定义歌词(lyrics)生成歌曲
- 支持男声(male)和女声(female)演唱
- 支持中文和英文歌词与提示词
- 支持流式和非流式两种输出模式
- 支持 MP3 和 WAV 音频格式输出
支持的模型
音乐生成模型: fun-music-v1
支持的语言:
- 歌词语言:中文、英文
- 提示词语言:中文、英文
快速开始
前提条件
- 已获取 API Key。获取方式请参见获取 API Key。
- 已将 API Key 配置到环境变量(推荐):
lyrics 和 prompt 参数必须至少提供一个,不可同时为空。当同时传入两个参数时,仅 lyrics 生效,prompt 将被忽略。- 通过提示词生成音乐
- 通过歌词生成音乐
传入
prompt 参数描述音乐风格和场景,模型将自动创作歌词并生成歌曲。流式调用
流式模式支持边生成边返回音频数据,适用于实时播放等场景。启用流式输出需要在请求头中添加 X-DashScope-SSE: enable。
流式模式与非流式模式的输入参数字符数限制不同,请注意区分:
- 非流式模式:
lyrics支持中文 5350 字符、英文 52000 字符,prompt支持 1~2000 字符。 - 流式模式:
lyrics支持中文 300350 字、英文 200250 词,prompt支持 5~1000 个中文汉字或英文单词。
歌词创作规范
Fun-Music 内置专业歌词创作模型。当您选择自行提供歌词时,遵循以下规范可生成更高质量的音乐。
结构标签
标准歌词结构应包含以下标签:
| 标签 | 说明 |
|---|---|
[intro] | 前奏,引入氛围 |
[verse] | 主歌,叙述故事 |
[chorus] | 副歌,情感高潮 |
[bridge] | 桥段,视角转换 |
[outro] | 尾奏,渐弱收尾 |
创作要求
- 原创性原则:严禁抄袭已发表歌曲的歌词,不得模仿知名歌曲的押韵模式或标志性句式。
- 内容安全:禁止涉及政治、暴力、色情、低俗、恐怖、毒品等违法内容,保持内容健康、情感真挚。
- 语言要求:仅支持中文或英文,不支持日文、韩文等其他语言。
最佳实践
提示词撰写
具体描述情绪、场景、乐器偏好,能生成更贴合需求的音乐。
- 推荐:
悲伤钢琴曲,雨夜思念 - 不推荐:
悲伤音乐(过于笼统)
| 风格 | 提示词示例 |
|---|---|
| 民谣 | 温暖治愈的民谣歌曲,木吉他伴奏,讲述午后咖啡馆里的慵懒时光 |
| 古风 | 古风歌曲,古筝与竹笛伴奏,水墨山水般的悠远意境,诉说江湖离别 |
| 摇滚 | 热血摇滚,电吉他失真音墙,密集鼓点,唱出青春的叛逆与自由 |
| 抒情 | 抒情慢歌,钢琴伴奏,安静深沉,带有淡淡忧伤,适合表达思念与回忆 |
| 说唱 | 节拍鲜明的嘻哈说唱,808低音鼓,充满街头活力,讲述城市生活故事 |
| 儿歌 | 欢快可爱的儿童歌曲,木琴与手鼓伴奏,节奏简单明快,教小朋友认识大自然 |
音频格式选择
mp3:适合网络传输和存储,为默认格式。wav:适合后期处理和高质量播放。
API 参考
音乐生成 API 参考
常见问题
lyrics 和 prompt 有什么区别?
lyrics 和 prompt 有什么区别?
lyrics 参数用于传入您自己编写的歌词,模型将严格根据歌词内容进行谱曲和演唱。prompt 参数用于传入对音乐风格、场景的自然语言描述,模型将自动创作歌词并生成对应的音乐。两个参数至少传入一个。如果同时传入,仅 lyrics 生效。流式和非流式模式如何选择?
流式和非流式模式如何选择?
如果只需获取最终的完整音频文件,推荐使用非流式模式,接口调用更简单。如果需要在音乐生成过程中逐步获取音频数据(如边生成边播放),建议使用流式模式。
生成的音频 URL 有效期是多久?
生成的音频 URL 有效期是多久?
音频文件下载 URL 的有效期为 24 小时,请在此时间内完成下载。超过有效期后 URL 将失效,需要重新调用接口生成。
流式和非流式模式的参数限制有何不同?
流式和非流式模式的参数限制有何不同?
两种模式下 350 字符、英文 52000 字符,2000 字符。流式模式下,350 字、英文 200250 词,1000 个中文汉字或英文单词。请根据所选模式注意对应的参数限制。
lyrics 和 prompt 的字符数限制存在差异。非流式模式下,lyrics 支持中文 5prompt 支持 1lyrics 支持中文 300prompt 支持 5
