Meta(臉書)公布AI(人工智慧)語音模型，支援4000種語言-阿摩線上測驗

Hui Min

研一上

阿摩第 12 期

10851枚

打氣

送VIP

+好友

◄ 返回列表回覆

0人	【其它】Meta(臉書)公布AI(人工智慧)語音模型，支援4000種語言發表于: 2023/05/23

日期:2023年05月23日
時間:14:33(下午2點33分)
報導:中央社
地點:台北

臉書（Meta）今天公布，旗下大規模多語言語音模型，可辨識超過4000種口語表達的語言，辨識量是既有技術的40倍；文字語音互轉技術的應用範圍，從100種語言增加至1100種，且可用於AR(擴增實境)及VR(虛擬實際)。

世界上許多語言正面臨消失的危機，而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta(臉書)今天發布新聞稿指出，Meta(臉書)發表一系列的AI模型(人工智慧模型)，希望幫助用戶以自己習慣的語言，更輕鬆獲取資訊及使用電子裝置。

Meta(臉書)表示，公司研發的大規模多語言語音（Massively Multilingual Speech，簡稱MMS）模型，擴展文字轉語音及語音轉文字技術的應用範圍，從最初的100種語言，至今已可轉換超過1100種語言，超越過去的10倍。還能辨識超過4000種口語語言，是過去的40倍。

應用案例(例子)方面，從VR（虛擬實境）、AR（擴增實境）至訊息服務，不僅能使用偏好語言操作，更可理解每個人的聲音。

Meta(臉書)指出，將開源這項技術的原始碼及模型，讓研究社群能夠以現有的工作成果為基礎繼續開發，一同保存全球的語言，並拉近人們間的距離。

過去最大型的語音資料庫最多僅涵蓋100種語言，因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰，Meta(臉書)使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典，例如「聖經」，作為語言的文字訓練資料。

Meta(臉書)表示，聖經譯文有多種語言的公開錄音檔，作為大型多語言語音模型計畫的一部分，Meta(臉書)創造的資料集，蒐集超過1100種語言的「新約聖經」有聲讀物資料集，平均為每種語言提供32小時(1小時=60秒，60*32=1920秒)的語音訓練資料，後續又加入其他未標註的基督教有聲讀物後，可用的語言訓練資料已涵蓋超過4000種語言。

Meta(臉書)強調，將持續擴增大規模多語言語音模型的涵蓋範圍，以支援更多語言的轉換及辨識，並努力克服現有語音技術難以處理方言的挑戰。

資料來源: https://udn.com/news/story/6811/7184630?from=udn-ch1_breaknews-1-0-news

另外Google查詢電腦專有名詞(電腦術語): VR (虛擬實境)、MR(混合實境)、AR(擴增實境)

賣厝阿明／租屋族的消費者保護法，立法院三讀通過《租賃住宅市場發展及管理條例》三大重點一次搞懂

從莎草紙到電子紙「紙」的前世與今生(紙之發展歷史)

紐西蘭斥巨資採用電動熔爐！減少碳排放量相當於「30萬輛汽車」

研一上

阿摩第 12 期

【其它】Meta(臉書)公布AI(人工智慧)語音模型，支援4000種語言