日韩亚洲国产高清免费视频_国产精品2020观看久久_久久99精品福利久久久_我要看欧美精品一级毛片

 

Google翻譯支持的108種語言 平均每天翻譯1500億個單詞

發(fā)布時間:2020-06-04 16:11:23  |  來源:雷鋒網(wǎng)  

Google表示,在提高語言翻譯的質量方面,已經(jīng)取得了進展。在一篇博客文章中,該公司詳細介紹了新的創(chuàng)新技術,這些創(chuàng)新技術增強了Google翻譯(Google Translate)支持的108種語言(特別是數(shù)據(jù)貧乏的約魯巴語和馬拉雅拉姆語)的用戶體驗,該服務平均每天翻譯1500億個單詞。

自Google翻譯首次公開亮后的13年間,諸如神經(jīng)機器翻譯、基于重寫的范例和本地處理之類的技術使該平臺的翻譯準確性有了可量化的飛躍。

但是直到最近,翻譯的最新算法表現(xiàn)也落后于人類。Google之外的努力也說明了問題的難度,Masakhane項目旨在使非洲大陸上的數(shù)千種語言能夠自動翻譯,但它還沒有超出數(shù)據(jù)收集和轉錄階段。

共同的聲音(Common Voice是Mozilla發(fā)起的一個眾包項目,旨在為語音識別軟件創(chuàng)建免費的數(shù)據(jù)庫)自2017年6月推出以來,Mozilla為建立轉錄語音數(shù)據(jù)的開源集合所做的努力僅審查了40種聲音。

Google表示,其翻譯質量的突破并不是由單一技術推動,而是針對資源較少的語言、高質量源語言、總體質量、延遲和整體推理速度的技術組合。

在2019年5月至2020年5月之間,通過人工評估和BLEU(一種基于系統(tǒng)翻譯與人工參考翻譯之間相似性的指標)進行衡量,Google翻譯在所有語言中平均提高了5分或更多,在50種最低水平的翻譯中平均提高了7分或更多。

此外,Google表示,“翻譯”對機器翻譯聯(lián)想的功能變得更加強大,一種現(xiàn)象是,當給泰盧固語字符輸入“Shenzhen Shenzhen Shaw International Airport (SSH)”)時,AI模型會產(chǎn)生奇怪的翻譯“Sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh”。

混合模型和數(shù)據(jù)挖掘器

這些技術中的第一個是翻譯模型體系結構——一種混合體系結構,包含在Lingvo(用于序列建模的TensorFlow框架)中實現(xiàn)的Transformer編碼器和遞歸神經(jīng)網(wǎng)絡(RNN)解碼器。

在機器翻譯中,編碼器通常將單詞和短語編碼為內(nèi)部表示,然后解碼器將其用于生成所需語言的文本。

Google相關研究人員于2017年首次提出的基于Transformer模型在此方面比RNN更為有效,但Google表示其工作表明大部分質量提升僅來自于Transformer的一個組成部分:編碼器。

那可能是因為雖然RNN和Transformer都被設計為處理有序的數(shù)據(jù)序列,但是Transformers并不需要按順序處理序列。換句話說,如果所討論的數(shù)據(jù)是自然語言,則Transformer無需在處理結尾之前處理句子的開頭。

盡管如此,在推理時,RNN解碼器仍比“Transformer”中的解碼器“快得多”。意識到這一點,Google Translate團隊在將RNN解碼器與Transformer編碼器結合之前對RNN解碼器進行了優(yōu)化,以創(chuàng)建低延遲、質量更高,比四年前基于RNN的神經(jīng)機器翻譯模型更穩(wěn)定的混合模型進行替代。

自2006年成立以來,Google翻譯模型的BLEU得分

除了新穎的混合模型體系結構之外,Google還從數(shù)以百萬計的示例翻譯中(用于文章、書籍、文檔和Web搜索結果)編譯了用于編譯訓練集的數(shù)十年歷史的爬蟲。

新的翻譯器基于嵌入的14種主流語言,而不是基于字典的-意味著它使用實數(shù)矢量表示單詞和短語-更加注重精度(相關數(shù)據(jù)在檢索到的數(shù)據(jù)中所占的比例)想到(實際檢索到的相關數(shù)據(jù)總量的一部分)。

Google表示,在使用過程中,這使翻譯器提取的句子數(shù)量平均增加了29%。

有噪音的數(shù)據(jù)和轉移學習

另一個翻譯性能提升來自更好地處理訓練數(shù)據(jù)中噪聲的建模方法。觀察到有噪聲的數(shù)據(jù)(含有大量無法正確理解或解釋的大量信息的數(shù)據(jù))會損害語言的翻譯,因此Google翻譯團隊部署了一個系統(tǒng),該系統(tǒng)使用經(jīng)過訓練的模型為示例分配分數(shù)對嘈雜的數(shù)據(jù)進行調優(yōu),并對“干凈的”數(shù)據(jù)進行調優(yōu)。

實際上,這些模型開始對所有數(shù)據(jù)進行訓練,然后逐步對較小和較干凈的子集進行訓練,這是AI研究社區(qū)中稱為課程學習的方法。

在資源匱乏的語言方面,Google在翻譯中實施了反向翻譯方案,以增強并行訓練數(shù)據(jù),該語言中的每個句子都與其翻譯配對。(機器翻譯傳統(tǒng)上依賴于源語言和目標語言中成對句子的語料統(tǒng)計)在這種方案中,訓練數(shù)據(jù)會自動與合成并行數(shù)據(jù)對齊,從而目標文本是自然語言,但會生成源通過神經(jīng)翻譯模型。

結果是Google翻譯利用了更豐富的單語文本數(shù)據(jù)來訓練模型,Google表示這對于提高流利性特別有用。

帶有翻譯功能的Google Maps

Google翻譯現(xiàn)在還利用了M4建模,其中一個大型模型M4在多種語言和英語之間進行翻譯。(M4是于去年在一篇論文中首次提出,證明它在訓練了100多種語言中的250億對句子對之后,提高了30多種低資源語言的翻譯質量。)

M4建模使Google翻譯中的遷移學習成為可能,收集了包括法語、德語和西班牙語(有數(shù)十億個并行示例)的高資源語言進行訓練提升了表現(xiàn),從而可以應用于翻譯諸如約魯巴語、信德語和夏威夷語(僅有數(shù)萬個示例)的低資源語言。

展望未來

根據(jù)Google的說法,自2010年以來,翻譯每年至少提高了1個BLEU點,但是自動機器翻譯絕不能解決問題。Google承認,即使是其增強的模型也容易出錯,包括將一種語言的不同方言混淆,產(chǎn)生過多的直譯,以及在特定題材和非正式或口頭語言上的表現(xiàn)不佳。

微軟試圖通過各種方式解決這一問題,包括通過其Google翻譯社區(qū)計劃(Google Translate Community)來招募志愿者,通過翻譯單詞和短語或檢查翻譯是否正確來幫助提高低資源語言的翻譯質量。

僅在2月份,該程序與新興的機器學習技術相結合,就增加了翻譯,共有7500萬人使用了五種語言:Kinyarwanda、Odia(奧里亞語)、Tatar、Turkmen和Uyghur(維吾爾語)。

追求真正通用翻譯的并不只有Google。在2018年8月,F(xiàn)acebook公開了一種AI模型,該模型結合了逐詞翻譯,語言模型和反向翻譯的組合,在語言配對方面表現(xiàn)更好。最

近,麻省理工學院計算機科學與人工智能實驗室的研究人員提出了一種無監(jiān)督的模型,即可以從未明確標記或分類的測試數(shù)據(jù)中學習的模型,該模型可以在兩種語言的文本之間進行翻譯,而無需在兩種語言之間直接進行翻譯。

Google在一份聲明中以外交方式表示,它對“學術界和工業(yè)界”的機器翻譯研究表示感謝,其中一些通報了自己的工作。該公司表示:“我們通過綜合和擴展各種最新進展來實現(xiàn)(Google翻譯最近的改進)。

通過此更新,我們?yōu)樘峁┫鄬σ恢碌淖詣臃g而感到自豪,即使是在支持的108種語言中資源最少的情況下也是如此。”

關鍵詞: Google翻譯

 

關于我們 - 聯(lián)系我們 - 版權聲明 - 招聘信息 - 友鏈交換

2014-2020  電腦商網(wǎng) 版權所有. All Rights Reserved.

備案號:京ICP備2022022245號-1 未經(jīng)過本站允許,請勿將本站內(nèi)容傳播或復制.

聯(lián)系我們:435 226 40@qq.com

日韩亚洲国产高清免费视频_国产精品2020观看久久_久久99精品福利久久久_我要看欧美精品一级毛片

            欧美日韩一区二区三区四区五区| 国产女人18水真多18精品一级做| 国产精品久久久久久久久免费樱桃| 午夜伊人狠狠久久| 99re66热这里只有精品3直播| 亚洲欧洲制服丝袜| 欧美一区二区三区四区在线观看| 亚洲男人的天堂av| 国产很黄免费观看久久| 亚洲免费观看在线观看| 欧美一卡二卡三卡四卡| 一区二区三区在线播放| 国产成人精品网址| 洋洋av久久久久久久一区| 精品日韩欧美在线| 五月天一区二区三区| 久久久久久久精| 欧美亚洲国产一卡| 亚洲欧美日韩国产中文在线| 国产成人免费在线| 亚洲国产成人精品视频| 国产色产综合色产在线视频| 精一区二区三区| 亚洲三级视频在线观看| 精品播放一区二区| 免费观看在线综合色| 国产精品国产自产拍在线| 日韩一区二区三区免费观看| 亚洲一区二区三区视频在线播放 | 久久99精品国产| 中文字幕欧美一| 欧美成人精精品一区二区频| 日韩av电影免费观看高清完整版在线观看 | 欧美性猛交xxxxxxxx| 亚洲精品免费播放| 99国产精品久久久久久久久久久| 在线日韩一区二区| 亚洲精品久久久蜜桃| 91色porny| 欧美蜜桃一区二区三区 | 亚洲一区在线观看免费观看电影高清| 久久亚洲二区三区| 国产精品亚洲第一区在线暖暖韩国| 伊人夜夜躁av伊人久久| 国产欧美精品一区aⅴ影院| 国产精品亚洲а∨天堂免在线| 亚洲自拍偷拍av| 国产精品拍天天在线| 成人免费毛片a| 欧美日韩精品专区| 日本在线观看不卡视频| 亚洲视频你懂的| 亚洲国产成人私人影院tom| 成人av先锋影音| 欧美日韩国产美| 奇米影视在线99精品| 亚洲主播在线观看| 成人欧美一区二区三区黑人麻豆 | 国产美女视频91| 色婷婷亚洲婷婷| 亚洲成人av在线电影| 亚洲视频每日更新| 中文字幕在线不卡| 久久久久久久久久看片| 精品国产一区二区国模嫣然| 国产福利电影一区二区三区| 色婷婷久久久综合中文字幕| 亚洲国产一区二区a毛片| 国产精品不卡在线观看| 国产精品久久三区| 久久久久亚洲蜜桃| 久久综合视频网| 成人高清在线视频| 欧美一级黄色片| 国产激情偷乱视频一区二区三区 | 一区二区三区免费网站| 亚洲人精品午夜| 国产精品国产精品国产专区不片| 亚洲国产精品二十页| 久久这里只有精品6| 久久久久久久久久电影| caoporn国产一区二区| 日韩美女天天操| 国产一区二区美女诱惑| 欧美狂野另类xxxxoooo| 国产综合色精品一区二区三区| 91高清视频在线| 久久国产尿小便嘘嘘尿| 欧美专区在线观看一区| 日本伊人色综合网| 一本一道久久a久久精品| 日本欧美一区二区在线观看| 午夜天堂影视香蕉久久| 日本亚洲天堂网| 91福利资源站| 国产在线国偷精品产拍免费yy| 欧美三级资源在线| 国产综合一区二区| 欧美一区二区成人| 成人av先锋影音| 久久蜜桃av一区二区天堂| 久久久夜色精品亚洲| 国产精品午夜电影| 国产精品无码永久免费888| 国产精品短视频| 亚洲男人的天堂在线观看| 亚洲成人免费在线| 91国偷自产一区二区使用方法| 蜜桃91丨九色丨蝌蚪91桃色| 欧美色涩在线第一页| 国产精品亚洲第一区在线暖暖韩国| 日韩一区二区免费高清| 91丝袜美女网| 国产精品成人免费| 一区二区三区色| 热久久免费视频| 91精品国产色综合久久久蜜香臀| 不卡一区二区在线| 亚洲国产经典视频| 亚洲男人的天堂av| 日韩国产欧美在线播放| 欧美日本国产视频| 99在线热播精品免费| 国产欧美一区二区精品性| 国产精品国产三级国产aⅴ中文| 一区二区三区四区视频精品免费 | 91福利精品视频| 国产一区二区免费在线| 久久综合视频网| 中文字幕国产一区| 亚洲国产视频直播| 欧美亚男人的天堂| 99精品一区二区| 一区二区中文字幕在线| 亚洲福利一二三区| 国产成人综合亚洲网站| 久久久另类综合| 亚洲精品乱码久久久久久| 久久99精品久久只有精品| 欧美大白屁股肥臀xxxxxx| 中文字幕精品在线不卡| 性做久久久久久免费观看| 欧美区视频在线观看| 久久久精品国产免费观看同学| 亚洲女人小视频在线观看| 91国产视频在线观看| av在线播放一区二区三区| 亚洲丝袜另类动漫二区| 色94色欧美sute亚洲线路一ni| 成人app网站| 亚洲精品乱码久久久久久久久 | 亚洲高清在线精品| 91精品国产综合久久久蜜臀粉嫩| 久久一二三国产| 亚洲成人福利片| 日韩一二在线观看| **网站欧美大片在线观看| 免费av网站大全久久| 久久亚洲影视婷婷| 亚洲综合清纯丝袜自拍| 粉嫩蜜臀av国产精品网站| 国产精品初高中害羞小美女文| 日本高清不卡视频| 91视频观看视频| 婷婷丁香激情综合| 久久影院电视剧免费观看| 亚洲精品综合在线| 顶级嫩模精品视频在线看| 亚洲欧美色图小说| 884aa四虎影成人精品一区| 中文字幕乱码日本亚洲一区二区 | 亚洲超丰满肉感bbw| 99热这里都是精品| 午夜天堂影视香蕉久久| 日韩女优视频免费观看| 亚洲精品国久久99热| 粉嫩av一区二区三区| 亚洲一区二区精品视频| 日韩午夜中文字幕| 亚洲综合色网站| 99久久久久久99| 日韩二区三区在线观看| 国产欧美日韩视频在线观看| 在线亚洲高清视频| 欧美极品另类videosde| 精品写真视频在线观看| 亚洲免费观看在线视频| 欧美成人在线直播| 亚洲成va人在线观看| 久久精子c满五个校花| 狠狠色狠狠色综合日日91app| 中文字幕在线播放不卡一区| 制服丝袜亚洲播放| 一级特黄大欧美久久久| 久久综合九色综合欧美98| 麻豆91免费观看| 亚洲猫色日本管| 欧美精品一区视频| 欧美影院一区二区三区| 中文字幕亚洲欧美在线不卡|