(原标题:英伟达(NVDA.US)推出新AI模子Fugatto,可修改并生成新声息)
智通财经APP获悉,英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式东说念主工智能(AI)模子,旨在为制作音乐、电影和视频游戏的东说念主们提供工作。
笔据英伟达的说法,这款模子名为Fugatto(Foundational Generative Audio Transformer Opus),不错使用任何文本和音频文献来生成或修改音乐和声息。
举例,该模子不错笔据文本教唆创建音乐片断,从现存歌曲中删除或添加乐器,改换声息中的口音或情绪,以致发出从未听过的声息。
英伟达利用音频商讨司理、管弦乐队指引兼作曲家Rafael Valle暗示:“咱们但愿创建一个能像东说念主类相通鸠合和产生声息的模子。”
英伟达指出,告白代理商不错使用Fugatto快速定位多个地区的现存告白,并在配音中加入不同的口音和情谊。此外,视频游戏修复者不错使用东说念主工智能模子修改游戏中事先录制的钞票,以适利用户在玩游戏时赓续变化的四肢。
Fugatto不错使小号发出狗吠声或萨克斯管发出喵喵声。该公司补充说,通过微合资极少的讴颂数据,商讨东说念主员发现它不错处治未经事先历练的任务,比如从文本中生成高质地的歌声。
英伟达暗示,Fugatto的好意思满版块使用了25亿个参数,并在包含32个Nvidia H100 Tensor Core GPU的Nvidia DGX系统上进行了历练。该模子的举座使命耗时一年多。
Fugatto可能会与Runway等初创公司以及 Meta Platforms(META.US)等大公司的访佛手艺伸开竞争。10月,Meta 发布了名为Movie Gen的东说念主工智能模子,该模子不错笔据用户教唆创建传神的视频和音频裁剪。
本年 2 月,ChatGPT制造商OpenAI推出了Sora,它不错笔据文本指示创建传神且富足念念象力的场景。这家由微软(MSFT.US)撑抓的公司尚未向公众发布文本转视频模子。