美語口譯翻譯社Google翻譯(英語:Google Translate)是一項Google提供的翻譯文段及網頁的服務。[1]

與其他網站巴別魚美國線上雅虎使用SYSTRAN引擎不同的是,Google使用自己開發的翻譯軟體,大部分語言對採用統計機器翻譯技術,少部份語言採用Google神經機器翻譯系統

至2015年6月,Google翻譯稱每天需要處理超過1000億筆字詞;而全世界的人們翻譯最多的單詞是「你好嗎?」、「謝謝」,以及「我愛你」[2]

功能與局限[編輯]

Google翻譯提供即時翻譯功能(即時輸入即時翻譯),使用者可以在左邊的輸入欄位輸入文字,翻譯結果會即時在右邊的結果框顯示。將鼠標移到翻譯結果文字上可以看到其對應的原文。此外,Google翻譯亦提供朗讀功能(包括原文和譯文),使用者亦可檢視日文羅馬拼音漢字漢語拼音,甚至韓文拼音等等,功能可算全面。

與其他自動翻譯工具類似,Google翻譯亦有其自身功能侷限。雖然用戶可以通過其幫助來大致理解以外文書寫的文章大意,但Google翻譯服務無法提供準確的譯文,也不能提供可用於出版的內容,例如,它經常會不依據上下文來翻譯詞彙,而且會在翻譯時不遵守語法規則,這是因為其機器翻譯演算法與傳統的基於語法分析的演算法不同,採用的是基於統計分析的演算法。而Google翻譯的品質也與語種有關,當源語言是一種歐盟語言,而目標語言是英語時,往往品質較好。2010年的分析顯示,法語到英語的翻譯相對準確[3],2011年和2012年的分析顯示義大利語到英語的翻譯同樣相對準確[4]。然而,當所翻譯的文字較短時,其他規則法機器翻譯(rule-based machine translation)卻表現得更好,這在中文到英語的翻譯中尤為明顯[3]

世界各地Google翻譯朗讀使用的英語口音
  英國英語(女聲)
  美國英語(女聲)
  大洋洲口音(女聲)
  無Google翻譯服務

使用較廣泛的語言都有「朗讀」功能,對多中心語言而言,朗讀採用的口音取決於所在地區,例如:

方法[編輯]

Google翻譯採用的翻譯方法稱作「統計機器翻譯」,具體而言,採用的是基於Franz-Josef Och參加2003年美國國防部高級研究項目局(DARPA)的機器速度翻譯競賽時獲獎的研究成果。Och現在領銜Google機器翻譯小組。

根據Och的說法[5],若想要開發一個可用於翻譯一對全新語言對的統計機器翻譯系統,必須做好如下的資料基礎蒐集才能有保障:一個擁有百萬的單字數量級別的雙語文字語料庫(或者其平行庫集合),以及屬於這兩種語言的單語語料庫,各自得擁有十億以上的單字。然後,用於翻譯這一對語言的機器翻譯結果就會通過這些資料產生的統計模型而得出。

為了獲取這種海量容量的語言學資料,Google採用了聯合國文件作為語料庫內容來源。[6]由於同樣的一份聯合國文件通常會有屬於六種聯合國官方語言的譯本,因此,Google如今就擁有了一個相當於經人工翻譯了兩百萬單字的七種語言的語料庫。

而這一點很可能就是Google翻譯之所以一開始專注的是開發英語阿拉伯語中文之間的翻譯系統,而非英語和日語或英語和德語這兩對語言之間的翻譯系統的原因。因為阿拉伯語和中文屬於聯合國六種官方語言,而日語、德語不是。

Google的專員卓坤婷曾積極參加在日本舉行的國內會議,在會場上向專家徵集英日兩種語言之間的雙語語料庫。[7]

翻譯語言[編輯]

目前Google支援翻譯103種語言。

2008年5月以前(按開始提供的時間順序排列)[編輯]

2008年9月25日開始[編輯]

2009年1月30日開始[編輯]

2009年6月19日開始[編輯]

2009年8月25日開始[編輯]

2010年1月25日開始[編輯]

2010年5月13日開始[8][編輯]

2010年9月25日開始[編輯]

2012年2月22日開始[編輯]

2012年9月開始[編輯]

2013年4月開始[編輯]

2013年5月開始[編輯]

2013年12月開始[編輯]

2014年12月開始[編輯]

2016年2月開始[編輯]

正在開發的語言[編輯]

這些語言還沒有被Google翻譯支援,但在翻譯社群中有提供。[11]

整合[編輯]

瀏覽器[編輯]

劃取翻譯功能是現代瀏覽器的重要基礎功能,翻譯的整合意味著打破文化壁壘,Opera和Firefox的翻譯外掛模組亦是利用Google翻譯API作為擴充功能程式的核心外部介面。不過當下許多瀏覽器廠商,在瀏覽器大戰背景下,出於激烈競爭,已經做出了一站式服務,例如Windows10中內建的MicrosoftEdge,微軟專門為此客製了瀏覽器外掛模組版的微軟必應翻譯。

字典軟體[編輯]

開發者可以利用Google提供的API,對軟體整合聯網翻譯功能。這些軟體通常是通過整合翻譯功能,實現對原有用途的用戶需求滿足,所完善而來。例如閱讀軟體、線上資料搜尋時整合的WebJS小程式,由於資訊科技的普遍應用和入口之爭以及成熟度,目前已不再有著壟斷地位,也就不存在增加翻譯功能需要收費或是插廣告,除非是態度問題,否則一般會作為硬性標準。

掌上翻譯程式/電子詞典[編輯]

當今智慧型手機和平板電腦平台上,亦有很多基於Google翻譯而衍生成的翻譯軟體。不但在今日動則幾十M的軟體膨大趨勢下做到了體積小巧,而且可以下載離線字典呼叫,甚至可以翻譯螢幕上光標停按的部分。

現狀[編輯]

由於2014年5月31日起,Google所有服務(各個IP段)在中國被大規模干擾至今,[12]但因為其域名字尾為中國國家頂級域名 .cn,而不是 .hk,所以Google翻譯成為仍然能正常工作的服務。

2017年3月29日起,中國大陸用戶可以直接使用Google翻譯(手機版)而不需要使用代理。在此之前,翻譯需使用代理而無法直接翻譯,但下載離線翻譯包後可使用離線翻譯進行翻譯。[13][14]

非建設性用途[編輯]

可以用德語展現Bbox口技。

參見[編輯]

參考資料[編輯]

  1. ^ Google Translate. Google. [2009-01-24]. 
  2. ^ 世界滿溫情~Google日翻1千億字 翻最多的竟是我愛你. ETtoday新聞雲. 2015-06-24 [2015-06-27]. 
  3. ^ 3.0 3.1 Comparison of online machine translation tools. (原始內容存檔於2011-02-10). 
  4. ^ Microsoft Bing Translator and Google Translate Compared. (原始內容存檔於2013-11-07). 
  5. ^ 於2005年機器翻譯峰會上的主旨演講
  6. ^ http://www.reuters.com/article/technologyNews/idUSN1921881520070328?feedType=RSS%20target=
  7. ^ Google was an official sponsor of the annual Computational Linguistics in Japan Conference ("Gengoshorigakkai") in 2007. Google also sent a delegate from its headquarters to the meeting of the members of the Computational Linguistic Society of Japan in march 2005, promising funding to researchers who would be willing to share text data.
  8. ^ Five more languages on translate.google.com. Google. 2010-05-13 (英語). 
  9. ^ Veni, Vidi, Verba Verti. Google. 2010-09-30 (英語). 
  10. ^ Tutmonda helplingvo por ĉiuj homoj. Google. 2012-02-22 (英語). 
  11. ^ Translate Community: Help us improve Google Translate!. 
  12. ^ Google透明度報告(資訊公開報告). Google. 2014-05-31. 
  13. ^ 不翻牆也能用了 Google翻譯最佳化了中國用戶體驗
  14. ^ 等了八年!Google這項重磅服務今天終於可以用了!

外部連結[編輯]