免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我们大胆做了个决定,大会所有音乐bgm由AI生成,这部分预算可以省了!|Jinqiu Scan

发布日期:2025-11-03 16:16:50 浏览次数: 1549
作者:锦秋集

微信搜一搜,关注“锦秋集”

推荐语

锦秋基金CEO大会大胆采用AI生成音乐,探索科技与艺术的创新融合,让AI从概念走向真实体验。

核心内容:
1. 七款主流AI音乐生成工具横评与优选过程
2. 基于嘉宾特制的个性化音乐生成实践案例
3. ChatGPT与Suno协同创作的技术实现路径

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今年,锦秋基金将以「Experience with AI」为主题,举办首届CEO年度大会。

这是锦秋第一次以这样一场科技与思想交织的形式呈现年会——我们想探讨的不只是AI本身,而是科技、资本与创造力如何在AI时代重新相遇。

我们希望这场活动,不只是一次关于AI的对话,而是一场关于让AI被真正理解、被使用、被体验的真实场域。

大会音乐,肯定是大会电子物料里必不可少的一项。

2025年8月,我们做了七款AI写歌工具横评:从年会BGM到模仿周杰伦,谁能唱出未来?的测评。

当时就已经在设想、探索用AI做出活动音乐。

结果显示:

🏆当时,我们测评了 7 款具有代表性的 AI 音乐生成产品,包括:

  • 由前 Meta 工程师创办、最早提出 “text-to-full-song” 概念的 Suno;

  • 以语音合成技术起家的 ElevenLabs;

  • 由前 DeepMind 团队成员创立 Udio;

  • 字节跳动音乐部门推出的“海绵音乐”;

  • 腾讯音乐娱乐集团推出的“TME Studio”;

  • 昆仑万维基于自研大模型“天工”打造的多模态创作平台“Mureka”。

  • 开源大模型领军者 Stability AI 发布的“Stable Audio”。

在测试完后我们发现:ElevenLabs、Udio 与 Suno是当时产出结果较好的三款产品。



因此,当我们确定用AI 来做这次的CEO大会的音乐时,在简单进行了三款产品的测试后,最终选择了有可能成功率最好的Suno 



01

 真实的测试题目


需求1:每个嘉宾上场前的串场音乐:基于上场嘉宾的公司情况、个人情况,生成一个适合他风格的串场音乐。

需求2:暖场音乐:基于大会的主题、现场的分为,生成多段合适的暖场音乐,用来做储备。


制作1:嘉宾上场前的暖场音乐

因为团队并不擅长音乐、乐理,因此难以准确描述Prompt,因此我们首先使用了ChatGPT生成用来制作音乐的prompt 。

然后使用suno生成适配的音乐


以为宇树科技 CEO 王兴兴上场前的暖场音乐制作为例,ChatGPT首先帮我们生成了可能使用的Prompt

科技感与思辨氛围兼具,冷静而具未来思辨气质。融入细微机械呼吸声与柔和低频,节奏平稳、空间感强,不喧宾夺主,体现理性交流与人机未来思考。

Futuristic and reflective background music combining technological atmosphere with intellectual calm. Subtle mechanical breathing textures and soft low-frequency tones, steady rhythm with spacious ambience. Minimal, balanced, and immersive — evoking rational dialogue and the future relationship between humans and AI.


其次,使用Snuo 进行音乐生成。


从多次生成的音乐中,选择了我们认为可能最合适的内容。


↓下滑更多精彩

为了方便同事之间协作,我们在飞书上进行了音乐素材的管理。


制作2:暖场音乐储备

暖场音乐,我们基本采用了与嘉宾串场音乐的类似制作流程。

首先基于不同暖场时段的议程设计、时长、希望实现的目标,我们设定了不同环节的不同风格。

主要是三类暖场音乐风格

  • 热烈的:节奏感强、充满未来能量;

  • 平静的:温润电子氛围、适合思考;

  • 收束的:弦乐渐入、电子淡出,如尾声般圆满。

因为考虑到暖场音乐需要播放的时间较久。

因此,每一个环节都做了10-20首的音乐储备。




→右滑更多精彩


02

当“音乐小白”遇上AI:哪些能做,哪些做不到

这次测评的本质不是为了做产品的比较,而是希望探索出来最佳实践,解决我们真实的问题——我们不会作曲,却想用AI做出能代表大会气质的音乐。

整体来看,AI确实能帮我们“生成旋律”,但距离“创作音乐”还有距离。

AI能做到的,是风格模仿结构生成——当我们输入“未来感”“工业感”“平静”“仪式感”等关键词,它能迅速生成符合语义的音乐片段;在节奏、配器、氛围的可控性上,AI的生成能力已经超过了想象。

但AI做不到的,是对语义的深层理解。  它不理解“科技感”背后的情绪张力,不理解“温暖的收束”是一种心理上的松弛,也不理解音乐在一个现场场域中承担的“情绪转场”作用。它能做“像音乐的声音”,却很难做“让人相信的声音”。

AI能生成音符,却还不会共鸣。 音乐的创作门槛被彻底打平,取而代之的,是情绪设计的门槛被抬高——你要理解“一个场景的节奏”,理解“一个品牌的声音气质”,理解“音乐如何参与叙事”。


03

不是AI不行,而是在我们不熟悉的领域表达太模糊

AI生成不难,难的是我们如何表达“想要什么”。  Prompt写得准不准,决定了音乐的灵魂。

当用词模糊,比如“未来感”“科技感”“庄重”“思辨”,AI的输出往往千篇一律。

只有精准的描述,才能逐渐逼近理想的结果。但目前来看,这确实不是我们团队中“音乐小白”的强项。

市场上,类似的用户还有很多,这可能也是AI生成音乐类产品可能的优化方向之一。


04

明年的优化方向:争取探讨最

今年我们主要依赖单一模型(Suno),通过反复生成与筛选得到最优版本。

明年,我们希望做得更系统、更智能。比如,结合Suno、Udio、Mureka,让不同模型负责不同音乐风格或段落

今年,我们还尝试写了大会的主题曲。但结果还不能让我们自己100%满意。我们也希望明年能有机会创作出我们全体同事都能满意的大会主题曲。

脑洞更大的想,我们也希望未来有机会尝试下更多的表现形式。比如,通过视觉与灯光控制系统,实现音乐与舞台效果的同步生成。再如,让嘉宾或观众的实时情绪(心率、掌声、现场氛围)反哺AI音乐生成。

希望接下来的一年,我们和AI一起进步!


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询