元宇宙這盤棋,扎克伯格用AI技術下

發表於 2022-03-13 18:00 作者: 區塊鏈情報速遞pro

  大浪淘沙知金貴,隨着新冠疫情這只黑天鵝對全球經濟的打破與重塑,以往憑借“科創”一詞便能在市場安穩成長的日子一去不復返,是金子還是沙礫都被長達三年之久的疫情給分得明明白白。

  據悉,2月24日凌晨一點,扎克伯格舉辦了一場名爲“元宇宙裏的AI”的活動,活動中扎克伯格講述了了META在AI領域的技術布局,這也是扎克伯格2022年首次談及Meta將在語音翻譯、AI創造以及語音助手等領域重點發力。

  活動中,Meta宣布研發一款爲每個人定制的翻譯軟件,研究人員通過構建高級的AI模型和一款適用所有語言的翻譯器,希望能在“元宇宙”中打造一個無障礙交流的空間。

  Meta計劃研發一款新的AI系統BuilderBot,你在虛擬世界中說什么,AI就能給你展現對應的畫面,不僅如此,Meta新推出了CAIRaoke項目,研發人員开發了一個端到端的神經模型,它可以提供與人們進行更多的交流,可以比以前簡單對話的層面更深一步,能夠理解人們說話的語境。

  最新財報顯示,Meta旗下的“元宇宙”的Reality LABS部門2021年虧損102億美元。扎克伯格的AI大招,救得了衆人都不看好的元宇宙嗎?

  Meta 2021 年股價變化圖

  01、Meta將發力語音翻譯和語音助手

  MetaCEO扎克伯格談到,現在多數AI研究的重點是如何讓AI更好地理解現實世界,但在未來,AI需要幫助人們在現實世界和虛擬世界都能實現導航等功能。並且由於虛擬世界總是在發生變化,AI應該像人類一樣擁有理解環境和學習的能力。

  Meta CEO 扎克伯格

  扎克伯格介紹了AI在語音翻譯、語音助手以及AI創造領域的應用,扎克伯格表示Meta正在打造“萬能”的翻譯對話軟件項目,在去年十月的活動中,Meta AI宣布將打造一款翻譯工具,該項目將分爲兩個部分推進。第一部分是覆蓋全語種,Meta正在構建一個新的高級AI模型,該模型可以從需要訓練的示例更少的語言中學習,然後實現數百種語言的專家級翻譯。第二部分是打造通用語言翻譯器,研究人員正在設計一些新方法,希望能將一種語言的語音實時翻譯成另一種語言。

  02、爲元宇宙打造AI模型,Meta 打造多款觸摸傳感器

  Meta的AI研究人員多年來一直在討論如何建立一個豐富的、具有代表性的模型。並且這款新的模型不僅現在能夠實現預測,還可以適用於未來。FacebookAIResearch的總經理Joelle Pineau說:我們希望模型可以進行長期規劃和推理,以便未來在現實世界和虛擬世界中都能做好AI代理。

  FacebookAIResearch 的總經理Joelle Pineau

  此外,她還向大家介紹幾個Meta正在重點研究的方向,其中有一款是“機器人”。“它可以突破實驗室或工廠等固定場景的限制。並且能夠在家中、在辦公室流暢地操作,自然地與人類交互。”Joelle Pineau 介紹道,“但我們同樣需要機器人自己可以觸摸等方式提高感知世界的能力。”

  爲此,Meta一直在研發新的觸摸傳感器。Meta正在與其他研究人員合作打造一款新的傳感器,目前該傳感器正處在原型階段。與其他傳感器不同的是,該觸摸傳感器的外層會有一層薄薄的膜,膜上嵌有磁性顆粒。當觸摸傳感器變形時,磁信號就會改變。通過這些變化,AI技術可以推斷接觸點施加力的大小,甚至能使用自我監督學習模型來自動校准傳感器,使其更適用於各種場景。

  觸摸傳感器

  不僅如此,Meta還與其他研發機構合作开發的另一種數字傳感器。該傳感器的表面由可變形彈性材料組成,能夠通過傳感器內攝像頭記錄的圖像變化來感受力的變化。

  數字傳感器

  Joelle Pineau也提到,虛擬世界與真實世界之間仍有很大差距,要建立一個可靠的世界模型還有很多工作要做。尤其是,從簡單的物體到人的全身運動都能實時呈現高分辨率的虛擬環境。在演講中,她還宣布Meta的研究人員與Instagram的研究團隊合作,計劃發布一個名爲Instagram Feed Ranking的原型系統。

  03、打造“萬能”翻譯器,還支持百種語言自動標注

  機器翻譯專家Angela Fan認爲,語言是我們用來理解與周圍世界互動的主要途徑之一。她介紹自己在加拿大生活以及在巴黎工作時,常常感受到語言障礙帶來的深遠影響。基於這些語音溝通壁壘,Meta希望每個人都能感受到最新的翻譯技術,“我們希望所有未來的技術在默認情況下都是具有包容性的。”

  據預測,全球大約有20億人說的母語沒有任何可用的翻譯系統。並且,全球有數千種語言,但翻譯系統如今只支持大約100種語言。如何創建真正適合每個人的翻譯系統是Meta一直在思考的問題。

  Angela Fan認爲,創建更具包容性的翻譯的第一步是开發能夠支持多種語言的系統。“我們要是想要實現多語種翻譯,我們就需要必須爲每一個語言方向創建一個單獨的模型,這樣一來,我們就要創建數萬個模型,這是一件非常復雜的事情。”

  爲了解決這一難題,Meta嘗試根據不同的語言體系來加強模型的訓練能力。比如說,羅曼什語作爲一個小衆語種,會與其他語言體系有共同點,語種之間的聯系將會簡化語言模型的开發過程。

  “最近,我們在兩個頂級翻譯比賽中獲勝。”她講到,“我們證明了多語種系統確實比雙語系統更好,通過增加模型大小,例如通過生成更多培訓數據和縮小翻譯規模,我們證明了多語種翻譯是一個非常有前途的發展方向。”

  除此之外,Meta還可以自動創建一些翻譯數據的示例,而無須僱用人員手動翻譯大量數據。目前,Meta已經支持一百多種語言實現自動創建數據集,並且部分數據集开源。

  04、Meta計劃打造超級語音助手,連續決策成AI交互關鍵

  Meta AI的高級研究經理Alborz Geramifard談到語音交互助手時表示,Meta旗下的語音交互助手是一種自監督學習的語音處理方案XLS-$,其特點是可識別128種語言,實現語音識別、語言識別、語音翻譯等功能。他表示,Meta希望將語音識別技術與未來的虛擬技術結合,交談是人與人互動的自然方式,而語音技術可以讓我們與設備和虛擬系統互動,讓虛擬體驗與物理世界更加融爲一體。

  據悉,Meta號稱訓練XLS-R採用的公共數據是其他語言模型的近10倍,它可以識別的語言類型也是其他模型的兩倍多。細節方面,訓練XLS-R的數據包括43.6萬小時的公开演講錄音,涉及有聲讀物、會議程序等各種內容。

  此外,Meta根據4大多語言語音識別准對XLS-R進行評估,經過測試37種語言識別,發現XLS-R的表現優於此前的方案。而經過微調後,XLS-R可以在英語和21種其他語言之間實時語音互譯。

  Meta表示:我們發現,最大的語音模型包含20億個參數,與規模更小的模型相比,大規模模型的效果更好,因爲參數越多意味着包含更多種語言的數據,訓練效果更充分。目前,XLS-R翻譯法語、德語的准確性更高,其次是俄語、葡萄牙語等等。未來,Meta計劃讓XLR-R支持7000多種語言。他還談到Meta想要打造超級語音助手。

  05、結語

  2022年初,扎克伯格遭受重創,自從元宇宙大火後,扎克伯格成爲行走的元宇宙代言,而另一邊Meta的股市表現卻愁雲慘淡。今年2月3日,Meta公布其財報,其中披露的元宇宙部門虧損從2019年45億美元增加到2021年102億美元。當天收盤其股價暴跌26%,創下美股歷史最大跌幅,市值跌超2370億美元。

  顯然,人們對扎克伯格的“元宇宙美夢”還處於觀望狀態。而今日的活動中,扎克伯格完全從技術角度出發,刻畫了一套緊密圍繞元宇宙的前沿AI技術藍圖,以得到投資者的信任,不過華爾街會爲此买账嗎?Meta的技術藍圖、扎克伯格的虛擬未來世界,這些問題尚需要一些時間來一一解答。

標題:元宇宙這盤棋,扎克伯格用AI技術下

地址:https://www.coinsdeep.com/article/195.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

你可能還喜歡