文字可生成音乐！Meta发布的AI工具AudioCraft有何不同之处？

2023-08-03 10:20

谷歌-A(GOOGL) 0
谷歌-C(GOOG) 0

美东时间周三，Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺)，该工具可以帮助用户根据文本提示创作音乐和音频。

（来源：Meta官网）

Meta表示，这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉，可用文本内容生成高质量、逼真的音频和音乐。

Meta在官网介绍称，MusicGen接受过Meta拥有的和特别授权的音乐训练，可以从文本提示生成音乐，而AudioGen接受过公共音效训练，可从文本提示生成音频，比如模拟狗叫或脚步声；再加上EnCodec编解码器的改进版本，用户可以更高效率地生成更高质量的音乐。

在6月初，Meta推出了名为MusicGen的开源人工智能模型，这是一种深度学习语言模型，可以根据文本提示生成音乐。

Meta的EnCodec是一个基于深度学习的音频编解码器，由人工智能驱动，可以在音频质量没有损失的前提下，将音频压缩到比MP3格式还要小10倍的程度。

AudioGen则是一个来自Meta和耶路撒冷希伯来大学的研究团队的人工智能模型，可以通过输入文本来生成音频，亦可以扩展现有音频。AudioGen可以区分不同的声音对象，并在声学上将它们分开。

Meta还演示了MusicGen和AudioGen工作的流程图，并表示将让这些模型开源，让研究人员和从业人员可以用自己的数据集训练适合自己的模型，并帮助推进人工智能生成音频和音乐领域的发展。

与其他音乐模型相比，AudioCraft系列模型能够生成长期一致的高质量音乐和音频，还简化了音频生成模型的整体设计，使得该工具简单易用。

Meta相信它的模型可以引领新一波歌曲潮流，就像合成器改变音乐一样。“我们认为MusicGen可以变成一种新型的乐器，就像最初出现的合成器一样。”

当然，Meta也承认创作复杂而又优秀的音乐还是比较困难的，因此它选择将AudioCraft开源，以使用于训练它的数据多样化。

今年早些时候，谷歌也发布了名为MusicLM的音乐生成模型，并于5月向上月向所有用户开放。除此之外，目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。

免责声明：以上内容仅代表作者的个人立场和观点，不代表华盛的任何立场，亦并非旨在提供任何投资意见。有关内容不构成任何专业意见、买卖任何投资产品或服务的要约、招揽或建议。本页面的内容可随时进行修改，而本公司毋须另作通知。本公司已尽力确保以上所载之数据及内容的准确性及完整性，如对上述内容有任何疑问，应征询独立的专业意见，本公司不会对任何因该等资料而引致的损失承担任何责任。以上内容未经香港证监会审阅。

文字可生成音乐！Meta发布的AI工具AudioCraft有何不同之处？

推荐文章

美股前瞻 | 美伊和谈引爆市场！纳指期货升逾2%；SpaceX盘前再升超5%，马斯克豪言营收或达万亿美元！

新股申购 | 2只新股今起招股！“机器人大脑第一股” 仙工智能一手入场费5131.24港元，麦科医药-B一手入场费4242.36港元

华尔街如何操盘完成SpaceX史上最大规模IPO

华盛早报 | 特朗普放话美伊协议已达成！美股期指、黄金、白银全线拉升；木头姐4.4亿美元大举买入SpaceX；SK海力士计划8月赴美上市

美国坚持签约时间表 伊朗提出不同协议版本 美伊谈判疑云密布

特朗普称美伊协议定于周日签署 届时霍尔木兹海峡将立即重开

港股周报 | 利空突袭？华尔街限制对冲基金杠杆做多SK海力士和三星电子； 建滔系双雄领涨市场！ 建滔集团周累涨近47%

一周财经日历 | 美联储利率决议来袭，沃什首次议息会议将遭遇空前考验？琻捷电子、溜溜梅下周上市

美国坚持签约时间表伊朗提出不同协议版本美伊谈判疑云密布

特朗普称美伊协议定于周日签署届时霍尔木兹海峡将立即重开

港股周报 | 利空突袭？华尔街限制对冲基金杠杆做多SK海力士和三星电子；建滔系双雄领涨市场！建滔集团周累涨近47%