Google神經機器翻譯系統
Google神經機器翻譯系統(英語:Google Neural Machine Translation,簡寫:GNMT),是Google開發的神經機器翻譯(NMT)系統,於2016年11月推出,它使用類神經網絡來提高Google翻譯的流暢度和準確性。[1][2][3]Google神經機器翻譯系統通過應用基於實例的(EBMT)機器翻譯方法來改進翻譯質素,系統會從數百萬個範例中學習。[2]翻譯系統提出的系統學習架構首先通過Google翻譯支援的一百多種語言進行了測試。[2]隨着大型端到端框架的發展,系統會隨着時間的推移學習,做出更好,更自然的翻譯。[1]GNMT能夠一次翻譯整句句子,而不是逐字翻譯。[2][4]
歷史
[編輯]谷歌大腦項目於2011年由Google研究員傑夫·迪恩,格雷戈·科拉多和斯坦福大學電腦科學教授吳恩達在Google X秘密實驗室成立。[5][6][7]吳恩達的工作令Google和史丹福大學取得了突破。[8]
2016年9月,Google研究團隊宣佈開發Google神經機器翻譯系統,同年11月,Google翻譯停止使用其自2007年10月以來一直使用的專有統計機器翻譯(SMT)技術,開始使用神經機器翻譯(NMT)。[1][9][10][11][12][13]
Google翻譯的NMT系統使用了一種能夠深度學習的大型人造神經網絡。[1][2][3]GNMT使用通過使用數百萬更廣泛的來源來推斷出最相關的翻譯,提高翻譯的質素。然後將結果重新排列並組成基於人類語言的語法翻譯。GNMT提出的系統學習架構通過Google翻譯支援的語言進行了測試。GNMT沒有創建自己的普遍語言,而是針對許多語言之間發現的共同點,因此心理學家和語言學家比電腦科學家對此更感興趣。[14]2016年,Google翻譯的其中八種語言開始嘗試使用此系統,包括英語,法語,德語,西班牙語,葡萄牙語,中文,日語,韓語和土耳其語。[15]2017年3月,增加了俄語、印地語和越南語。[16]同月,因谷歌翻譯社群的幫助下,添加了對希伯來語和阿拉伯語的支援。[17]2017年4月底,增加了9種印度語言的支援,包括印度語,孟加拉語,馬拉地語,古吉拉特語,旁遮普語,泰米爾語,泰盧固語,馬拉雅拉姆語和康納達語。[18]
零點(Zero-shot)翻譯
[編輯]GNMT系統改進了以前的Google翻譯系統,GNMT系統可以處理「零點翻譯」,即直接將一種語言翻譯成另一種語言(例如中文到日文)。以前Google翻譯會先將源語言翻譯成英文,然後將英文翻譯成目標語言,而不是直接從一種語言翻譯成另一種語言。[4]
參考文獻
[編輯]- ^ 1.0 1.1 1.2 1.3 Barak Turovsky, Found in translation: More accurate, fluent sentences in Google Translate, Google Blog, 2016-11-15 [2017-01-11], (原始內容存檔於2017-04-07)
- ^ 2.0 2.1 2.2 2.3 2.4 Mike Schuster, Melvin Johnson, and Nikhil Thorat, Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, Google Research Blog, 2016-11-22 [2017-01-11], (原始內容存檔於2017-07-10)
- ^ 3.0 3.1 Gil Fewster, The mind-blowing AI announcement from Google that you probably missed, freeCodeCamp, 2017-01-05 [2017-01-11], (原始內容存檔於2017-05-31)
- ^ 4.0 4.1 Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie. MT on and for the Web (PDF). 2010 [2016-12-01]. (原始內容 (PDF)存檔於2017-03-29).
- ^ Jeff Dean and Andrew Ng. Using large-scale brain simulations for machine learning and A.I.. 2012-06-26 [2015-01-26]. (原始內容存檔於2015-02-06).
- ^ Google's Large Scale Deep Neural Networks Project. [2015-10-25]. (原始內容存檔於2019-02-16).
- ^ Markoff, John. How Many Computers to Identify a Cat? 16,000. New York Times. 2012-06-25 [2014-02-11]. (原始內容存檔於2017-05-09).
- ^ Robert D. Hof. A Chinese Internet Giant Starts to Dream: Baidu is a fixture of online life in China, but it wants to become a global power. Can one of the world’s leading artificial intelligence researchers help it challenge Silicon Valley’s biggest companies?. Technology Review. 2014-08-14 [2017-01-11]. (原始內容存檔於2020-01-08).
- ^ Katyanna Quach, Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning, 2016-11-17 [2017-01-11], (原始內容存檔於2017-05-06)
- ^ Lewis-Kraus, Gideon. The Great A.I. Awakening. The New York Times. 2016-12-14 [2017-01-11]. (原始內容存檔於2017-05-05).
- ^ Le, Quoc. A Neural Network for Machine Translation, at Production Scale. Google Research Blog. Google. 2016-09-27 [2016-12-01]. (原始內容存檔於2017-05-11).
- ^ Google Switches to its Own Translation System (頁面存檔備份,存於互聯網檔案館), October 22, 2007
- ^ Barry Schwartz. Google Translate Drops SYSTRAN for Home-Brewed Translation. Search Engine Land. 2007-10-23 [2017-07-06]. (原始內容存檔於2017-05-21).
- ^ Chris McDonald, Commenting on Gil Fewster's January 5th article in the Atlantic, 2017-01-07 [2017-01-11], (原始內容存檔於2017-06-22)
- ^ Turovsky, Barak. Found in translation: More accurate, fluent sentences in Google Translate. The Keyword Google Blog. Google. 2016-11-15 [2016-12-01]. (原始內容存檔於2017-04-07).
- ^ Turovsky, Barak. Higher quality neural translations for a bunch more languages. Google. [2017-03-06]. (原始內容存檔於2017-03-07).
- ^ Novet, Jordan. Google now provides AI-powered translations for Arabic and Hebrew. 2017-03-30 [2017-07-06]. (原始內容存檔於2020-01-01).
- ^ Turovsky, Barak. Making the internet more inclusive in India. 2017-04-25 [2017-07-06]. (原始內容存檔於2020-11-11).
外部連結
[編輯]- The Advantages and Disadvantages of Machine Translation (頁面存檔備份,存於互聯網檔案館)
- Statistical Machine Translation(頁面存檔備份,存於互聯網檔案館)
- International Association for Machine Translation (IAMT) (頁面存檔備份,存於互聯網檔案館)
- Machine Translation Archive(頁面存檔備份,存於互聯網檔案館) by John Hutchins. An electronic repository (and bibliography) of articles, books and papers in the field of machine translation and computer-based translation technology
- Machine translation (computer-based translation)(頁面存檔備份,存於互聯網檔案館) – Publications by John Hutchins (includes PDFs of several books on machine translation)