輝達AI模型Fugatto 1指令搞定音效、文字生成聲音

發表於 2024-11-27 00:00 作者: 區塊鏈情報速遞pro

輝達研發團隊,推出全新音訊人工智慧系統「Fugatto」。(資料照,美聯社)

吳孟峰/核稿編輯

〔財經頻道/綜合報導〕全球人工智慧(AI)晶片霸主輝達(NVIDIA)研發團隊,推出全新音訊人工智慧系統「Fugatto」,只要輸入文字指令,就能自動產生或改變任何音樂、人聲及音效。

根據《路透》報導,輝達表示,目前並未打算立即公開推出這項Fugatto(Foundational Generative Audio Transformer Opus 1)技術。

這套系統不僅能創作音樂、去除或新增樂器、改變口音與情緒,還能產生前所未聞的全新音效,為音樂創作、遊戲開發及廣告製作開創嶄新可能,主要鎖定音樂、電影和電玩製作人。

Runway等新創公司以及諸如Meta Platforms等更大型企業,都有發表可根據文字提示生成音訊或視訊的技術。

輝達的新模型會根據文字描述生成音效和音樂,包括新奇的聲音,例如小號會發出像狗叫的聲音。

Fugatto與其他AI技術不同的地方,在於它能接收和修改現有音頻,例如將鋼琴彈奏的一段音樂轉換為人聲演唱版本,或讓錄下來的口語改變口音及其情緒表達。

輝達深度學習應用研究副總裁卡坦察羅(Bryan Catanzaro)表示:「想想過去50年的合成音頻,就會發現當下的音樂聽起來不一樣,因為有電腦、合成器」、「我認為生成式AI將為音樂、電玩和想創作的普通人帶來新的能力」。

標題:輝達AI模型Fugatto 1指令搞定音效、文字生成聲音

地址:https://www.coinsdeep.com/article/183432.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

你可能還喜歡
熱門資訊