比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > 非小號 > Info

XLS:在元宇宙里怎么交朋友?Meta發布跨語種交流語音模型 支持128種語言無障礙對話

Author:

Time:1900/1/1 0:00:00

改名Meta之后,Facebook的元宇宙愿景正在一點點實現。這一次,Facebook把目光投在了元宇宙社交上。

Meta發布語音處理模型XLS-R

近日,Meta正式發布XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R共支持128種語言。

Meta認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”

汽車品牌日產申請4個新的Web3商標,并在元宇宙中試銷:3月13日消息,日本汽車品牌日產近日在美國提交了四個與Web3相關的新商標,而其日本子公司正在元宇宙中試驗汽車銷售。

根據日產3月7日向美國專利商標局(USPTO)提交的商標申請,新申請涵蓋了其英菲尼迪(INFINITI)、Nismo和日產品牌,范圍涵蓋虛擬服+汽車、虛擬商品商店+NFT、NFT市場+交易+鑄造、元宇宙廣告服務等。

上周,3月8日,日產日本公司宣布將對其虛擬商店“日產Hype實驗室”進行為期三個月的“示范實驗”,以在元宇宙中“研究、咨詢、試駕和購買日產汽車”。 該實驗將于6月30日截止。顧客可以通過個人電腦或智能手機“一天24小時”訪問虛擬店面。客戶可以創建自己定制的虛擬形象,在特定的時間內,甚至可以與虛擬銷售人員互動。根據公告,客戶可以通過虛擬銷售辦公室訂購汽車并敲定購買合同。(Cointelegraph)[2023/3/13 13:00:14]

這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。

韓國虛擬偶像Yuna將在元宇宙平臺ZEPETO開演唱會:3月28日消息,經紀公司Humap Contents宣布,韓國虛擬偶像Yuna將于4月14日發布新歌,并在元宇宙平臺ZEPETO開演唱會。據悉,Humap Contents去年發行了Yuna的NFT。Yuna通過3D設計制作過程呈現出類似人類的外觀。(韓聯社)[2022/3/28 14:22:11]

而XLS-R作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。

值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta對XLS-R進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R在BABEL、CommonVoice以及VoxPopuli語音識別基準測試,CoVoST-2的外語到英文翻譯基準測試,以及VoxLingua107語言識別基準測試中都取得了不錯的成績。

韓國信用卡公司Shinhan Card組織員工在元宇宙中進行培訓:3月18日消息,韓國新韓金融集團的信用卡子公司Shinhan Card宣布,其所有員工都將前往Gather.town元宇宙接受業務運營中數據使用方面的培訓。據悉,韓國NH銀行、友利銀行、韓亞銀行、韓國國民銀行均已涉足元宇宙業務。此前報道,韓國新韓銀行推出其元宇宙平臺。(Forkast)[2022/3/18 14:04:49]

為了盡可能降低功能訪問門檻,目前,Meta與HuggingFace聯手發布了模型本體,并通過fairseqGitHubrepo全面開放。

試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

Alethea AI獲BSC增長基金投資,將在元宇宙、NFT生態系統等領域合作:12月30日,Alethea AI宣布獲得幣安智能鏈(BSC)近期推出的10億美元增長基金的投資,具體金額未披露。BSC將與Alethea AI在元宇宙合作伙伴關系、戰略NFT生態系統支持以及人工智能和NFT的聯合營銷和教育方面開展合作。

此前8月,Alethea AI獲得1600萬美元資金,旨在構建一個由其機器人居住的元宇宙。主要投資者包括NFT基金Metapurse、Crypto.com Capital、億萬富翁投資者馬克·庫班(Mark Cuban)、Dapper Labs、BITKRAFT、Galaxy Interactive、Sfermion、Multicoin Capital、LD Capital、Alameda Research、CMS Holdings、Gemini Frontier Fund等。[2021/12/30 8:14:32]

XLS-R工作原理

據介紹,XLS-R在wav2vec2.0訓練集上接受了超過43萬6千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型XLSR-53的10倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R的語言支持范圍擴展到128種,涵蓋的語種量達到前代模型的近2.5倍。

作為Meta打造的有史以來最大模型,XLS-R中包含超過20億個參數,性能遠高于其他同類模型。Meta表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。

Meta在四種主要多語言語音識別測試中對XLS-R做出評估,發現它在37種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL中選取5種語言,CommonVoice中選取10種語言,MLS中選取8種語言,以及VoxPopuli上選取14種語言。

BABEL上的單詞錯誤率基準測試結果。XLS-R較前代模型實現了顯著改進。

此外,Meta還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型,Meta同時在CoVoST-2基準測試的數個不同翻譯方向上對XLS-R進行了微調,使其能夠在英語與多達21種語言之間實現內容互譯。

在使用XLS-R對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據Meta介紹,XLS-R在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中BLEU準確率平均翻了一番。BLEU指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。

以BLEU指標衡量的自動語音翻譯準確率,其中較高值表示XLS-R從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。

Meta認為,XLS-R證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。

“XLS-R是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球7000多種語言,實現算法的持續更新。”Meta提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

Tags:XLS元宇宙METETAPIXLS價格元宇宙專業哪些大學DemeterChainMETAWEB3PA

非小號
區塊鏈:北大×安信:元宇宙2022 蓄積的力量

聲音 | 北大教授肖耿:隨著區塊鏈、數字監管技術不斷成熟,離岸城市群已經不需要物理的邊界:“2019新華網思客年會”23日在廣州舉行.

1900/1/1 0:00:00
比特幣:2022年加密市場慘烈開局 能否出現轉機?

2021年初,加密貨幣市場在機構采用和寬松的宏觀經濟趨勢的推動下勢如破竹。然而,一年后的今天,在不同的宏觀環境下,2022年1月對于大多數加密資產來說已經開始朝著相反的方向發展.

1900/1/1 0:00:00
MET:博茨瓦納政府將向議會提交虛擬資產法案

1月22日消息,博茨瓦納政府將向該國議會提交一份“虛擬資產法案”,此舉可能使博茨瓦納成為非洲首批制定加密貨幣法律的國家之一.

1900/1/1 0:00:00
ERG:Dan:可擴展性 互操作性和可采用性是Ergo的三大優勢

在上周五的AMA直播中,Dan向社區提供了多項計劃的最新消息。他告訴大家,他一直在努力解決有關錢包和錢包用戶體驗的問題.

1900/1/1 0:00:00
WEB:Signal 創始人:我的 Web3 初體驗

盡管我自認為是一名密碼學家,但我沒有覺得自己特別被"加密"(crypto)吸引。雖然我不認為我真的說過"離開我的草坪"(getoffmylawn)?這句話,但我更有可能點擊PepperidgeF.

1900/1/1 0:00:00
ETH:V神再次批評跨鏈橋方案

1月20日,在一檔線上采訪節目上,VitalikButerin再次強調跨鏈存在很大安全問題.他提到在單鏈中,您可以方便的恢復鏈,每個人都可以把資產恢復到初始狀態.

1900/1/1 0:00:00
ads