4000-271-266
免费试用

以假乱真,天工音乐大模型带来颠覆式AI体验

作者:王力 无雀数字化转载

2024-04-05 10:37:37

昨日,昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动,诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品。


邀测开始后,广大用户对「天工SkyMusic」AI音乐生成大模型的热情远超我们的预期,工作人员在极短时间内收到了几十万份测试申请,其中包括众多专业的音乐创作人、媒体及行业专家,还有大量测试申请被源源不断地发至后台。


同时,我们也收到了大量来自用户的真实反馈与高度评价:


“人声很清晰 抒情旋律也好”


“好听!”


“这是天工做的??太厉害了!”


“《悟空》这首歌是演唱气息感的,感情很到位,基本上代表了生成情感以假乱真的能力巅峰之作”


“天工SkyMusic在高音演唱技巧上超出我的想象,非常优秀。”


“太强了,1、AI音乐用户群体非常大;2、生成的音乐可以反复使用;3、很容易做社交裂变”


“副歌部分真丝滑,Beat真好”


“没想到中国团队做的东西比国外的好”


广大用户的热情反馈既然让我们看到了行业对于「天工SkyMusic」AI音乐生成大模型的高度期待,也让我们看到了在以“智力”为主的AGI大模型探索方向中,“情感AGI”的重要意义。


「天工SkyMusic」作为一款专注于音频内容创作与分享的平台,深深植根于对人类情感深刻理解的基础上,认为音频,尤其是音乐,相较于文字和图片,更能触及人心,传达丰富细腻的情感内涵。音乐作为一种全球通用的语言,超越了地域、语言和文化的界限,无论是在和平繁荣的时代,还是面临战争、灾难等严峻挑战之时,都是人们抒发内心情感、寻求心灵共鸣与慰藉的强大工具。


「天工SkyMusic」的诞生,正是基于对这一独特价值的认识与把握,旨在打造一个能够激发创作者灵感,满足听众情感需求的音乐空间。平台鼓励和支持多元风格、多样主题的音乐作品创作,力求以音乐为纽带,连接人与人之间的情感交流,构建起一座跨越时空的心灵桥梁。


与此同时,「天工SkyMusic」的发展也得到了昆仑万维情感AGI(Artificial General Intelligence)技术的有力支持。昆仑万维致力于研发具备深度情感理解与表达能力的AI系统,将其应用于音乐创作、推荐、交互等多个环节,不断提升音乐服务的智能化水平和用户体验。通过情感AGI的持续探索与应用,「天工SkyMusic」有望实现更精准的情感匹配、更具创意的音乐生成以及更人性化的用户交互,使音乐的力量得以更广泛、更深入地触及每个人的生活,成为人们生活中不可或缺的情感寄托与精神滋养。


我们感谢所有积极参与并热情反馈的用户们,感谢你们的支持、鼓励与陪伴,我们将持续迭代、优化、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。


最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索AI音乐的强大魅力!


关于「天工SkyMusic」与「天工3.0」


「天工SkyMusic」AI音乐生成大模型基于昆仑万维「天工3.0」超级大模型打造。4月17日,「天工SkyMusic」将随「天工3.0」同步开启公测。


申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md


「天工3.0」采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的MoE模型之一。相较于上一代「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的Agent能力,使得「天工3.0」能够独立完成规划、调用、组合外部工具及信息,以精准高效地完成产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。


「天工SkyMusic」是目前国内首款且唯一公开可用的AI音乐生成大模型,其采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。


「天工SkyMusic」测试申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md


「天工SkyMusic」具有以下五大特点:


1. 高质量AI音乐


「天工SkyMusic」能够生成80秒44100Hz采样率双声道立体声AI歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。


2. 人声“以假乱真”


人声合成是AI音乐生成中最重要、最能体现生成效果和品质的维度。「天工SkyMusic」的AI人声合成能够达到业内顶尖的SOTA水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。


3. 歌词段落控制


「天工SkyMusic」能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。


4. 多种音乐风格


「天工SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。


5. 音乐智能表达 - 歌唱技巧学习


「天工SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧,让用户创作的歌曲得到更恰当的情感表达。


2023 年,昆仑万维在 “All in AGI 和 AIGC” 的战略推动下,在人工智能领域取得了许多进展,逐步形成了AI大模型、AI搜索、AI音乐、AI动漫、AI 社交、AI游戏等AI业务矩阵。


当前,昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”(Super Model),成为AI行业全新里程碑。


无雀数字化-整体数字化解决方案服务商!无雀数字化管理系统一数字化转型一站式工作台!无雀数字化专注于政企数字化转型,提供整体数字化解决方案和咨询服务帮助客户实现组织数字化、管理数字化和业务数字化!            

责任编辑:王力 无雀数字化转载

原创供稿:4000-271-266(高单价 快结算)   

特别声明:无雀数字化原创文章,未经授权不得转载!





评论 0

文明上网理性发言,请遵守《新闻评论服务协议》

请先登录后,发表评论~

相关推荐

江苏无雀数据科技有限公司 www.wuquedata.com 版权所有
服务热线4000-271-266
ICP备案编号:苏ICP备2022045370号

一对一专业企业顾问

工作时间:9:00-18:00 在线服务

实时解答疑难问题

工作时间:9:00-18:00 在线服务

4000-271-266

工作时间:9:00-18:00 在线服务

售后咨询 电话联系 售前咨询