谷歌翻譯是目前世界上使用最廣泛的翻譯產(chǎn)品,支持90種語(yǔ)言之間的翻譯,包括阿拉伯語(yǔ)、英語(yǔ)、法語(yǔ)、德語(yǔ)、漢語(yǔ)和西班牙語(yǔ)等所有流行語(yǔ)言。據(jù)《紐約時(shí)報(bào)》報(bào)道,目前web、iOS、Android等各種平臺(tái)的月活躍用戶已經(jīng)超過5億,僅Android中的Google Translation Application(非預(yù)裝應(yīng)用)下載安裝量就達(dá)到1億。
在機(jī)器翻譯領(lǐng)域,主要有三類翻譯技術(shù),即“基于規(guī)則的”、“基于統(tǒng)計(jì)的”和混合的。其中,谷歌屬于“統(tǒng)計(jì)型”,可以通過用戶直接搜索的翻譯結(jié)果、網(wǎng)頁(yè)內(nèi)容的爬行翻譯等多種渠道獲取大量語(yǔ)料庫(kù)資源進(jìn)行深度學(xué)習(xí),從而逐漸獲得一種理解兩種語(yǔ)言之間如何匹配的能力,并將這種能力作為服務(wù)提供給用戶。
顯然,谷歌翻譯的服務(wù)水平已經(jīng)達(dá)到了一個(gè)新的水平。如果把自己安裝了谷歌翻譯的手機(jī)當(dāng)成一個(gè)人,其實(shí)ta已經(jīng)成為了一個(gè)翻譯效率高的電子翻譯器。然而,谷歌翻譯之前并沒有給很多人留下很好的印象。比如那些出現(xiàn)在交通標(biāo)志、超市甚至廁所上的可笑翻譯,往往被吐槽為“谷歌翻身”的結(jié)果。人們不禁感嘆:谷歌這么強(qiáng)大的公司,連一臺(tái)電腦都翻不過來?
一位前谷歌翻譯團(tuán)隊(duì)科學(xué)家告訴記者,即將發(fā)布的新翻譯產(chǎn)品谷歌背后的研發(fā)遠(yuǎn)比預(yù)期復(fù)雜。
過去,谷歌翻譯功能背后的主要技術(shù)是機(jī)器翻譯。后來隨著安卓和iOS操作系統(tǒng)的發(fā)展,移動(dòng)終端支持語(yǔ)音輸入,引入了語(yǔ)音識(shí)別?!皺C(jī)器翻譯和語(yǔ)音識(shí)別在技術(shù)上是分開的產(chǎn)品,背后使用了許多自然語(yǔ)言處理(NLP)和‘深度學(xué)習(xí)’的基礎(chǔ)技術(shù)。”專家說。
專家認(rèn)為,從目前媒體報(bào)道和業(yè)內(nèi)了解到的信息來看,全新的Google Translation是一款集機(jī)器翻譯和語(yǔ)音識(shí)別于一體的產(chǎn)品?!皬募夹g(shù)角度來說,谷歌早就應(yīng)該可以推出這個(gè)功能了(編者按:指語(yǔ)音識(shí)別和實(shí)時(shí)翻譯),但是到現(xiàn)在還沒有出來,可能還有一些其他的考慮??偟膩碚f,這兩種技術(shù)的集成需要大量的優(yōu)化,而不是簡(jiǎn)單的拼湊?!?
也即意味著,新版Google翻譯是Google的機(jī)器翻譯技術(shù)和語(yǔ)音識(shí)別技術(shù)進(jìn)行了系統(tǒng)性的整合之后投產(chǎn)的結(jié)果,將能夠代表Google在自然語(yǔ)言處理方面的深度學(xué)習(xí)所取得的進(jìn)展,以及其商業(yè)化能力。提到的前谷歌科學(xué)家指出,在他任職期間(兩年前),谷歌的翻譯技術(shù)已經(jīng)處于行業(yè)領(lǐng)先水平。近兩年來,谷歌在深度學(xué)習(xí)方面取得了突出的進(jìn)步,因此有理由(相對(duì)安全)相信谷歌基于深度學(xué)習(xí)的翻譯服務(wù)背后的技術(shù)仍能代表行業(yè)最高水平。
當(dāng)然,人們可能對(duì)谷歌翻譯技術(shù)有多強(qiáng)大沒有太多的認(rèn)知。他們能感知到的是,他們不應(yīng)該把干貨變成混賬貨。