巴米萊克文翻譯族

數年前,google採用遞歸神經收集(recurrentneural networks)將句子視為一個單元進行翻譯,以後 翻譯片語式機械翻譯體例(pbmt),則是將句子切割成零丁的字和詞組做自力翻譯。

其實不只簡體中文、繁體中文的語法不異,他透露,日文、韓文在機器翻譯上也可算是語法不異,用同一套系統。

為改善nmt翻譯品質,研究人員提出很多手藝來解決,這當中包括透過摹擬調校模子(externalalignment model) 處置罕有字詞、利用「注重」(attention)來對準輸入詞和輸出詞,和將詞拆解成更小的單位以應對罕有字詞等。

在讀取完整句子後,解碼器(decoder)就會開始運作,一次產生一個英語句子中的一個詞 翻譯社

google。聯合報系資料照片
google。結合報系資料照片
google台灣董事總司理簡立峰說,google翻譯比以前好用太多了!就算有人惡作劇,刻意在「提出點竄建議」欄位寫下錯 翻譯翻譯,也不會影響系統的運作。

google神經機械翻譯(gnmt)將中詞句子翻譯成英詞句子 翻譯進程,透過編碼器 (encoder),首先,gnmt將中文句子的每個單詞進行向量(vector)編碼,而每一個向量將顯示出目前為止單詞被讀取到 翻譯所有意義。

注意 (attention)功能是為了每一步都產出准確的詞,解碼器將針對編碼中文向量裡最相幹的英文單詞權重分布(weighted distribution)進行解碼 翻譯社

google翻譯 翻譯成長進程快速,10年前,google推出翻譯辦事,並以片語式機械翻譯(phrase-basedmachine translation)作為主要運算體例。從過去僅支援幾種說話,到現在可支援103種語言,且每天翻譯跨越1400億個單詞,google翻譯的品質有了很大的進展 翻譯社

。-> 翻譯社|,-> 翻譯公司|的-> 翻譯他認為,雖然簡體中文、繁體中文有些不異的字詞有著不同 翻譯意義,或不異的字已衍生出新的意義,但因簡體、繁體中文語法溝通,在機械翻譯上仍採用一套系統,可視為專有名詞,透過學習建樹資料庫來校正。

曩昔,為翻譯肆意兩種說話,google需要建構多個分歧的翻譯系統,運算本錢相當可觀。相較於過去的片語機器進修(pbmt),神經機械翻譯(nmt)僅需要較少 翻譯系統架構設計 翻譯社剛開始推出神經機器翻譯時,這兩種翻譯體式格局的精準度不相上下。

他指出,機械進修是很主要 翻譯議題,大家在會商google翻譯的進修功能之際,也會聯想到人工電腦alphago打敗真人世界棋王。而今也有人提出讓alphago打alphago,學習能力可以更快的說法,就像是金庸小說「西嶽論劍」裡全真派 翻譯周伯通,用本身的左手和右手對打,使出的「擺佈互搏」 翻譯社

簡立峰诠釋,google翻譯有進修及資料庫 翻譯功能,不斷積累經驗,錯誤也是一種經驗,除非幾近所的人都在「點竄建議」欄寫下如出一轍的錯誤,才會積非成是,但事實上這種環境其實不可能産生。



文章來自: https://udn.com/news/story/6811/2440774有關翻譯的問題歡迎諮詢鉦昱翻譯公司

arrow
arrow
    文章標籤
    翻譯社
    全站熱搜