博鰲開(kāi)幕,為何再次引發(fā)AI替代人類(lèi)的虛驚
機(jī)器翻譯產(chǎn)品早在 2010 年就開(kāi)始出現(xiàn),但更多的應(yīng)用主要是在旅游、社交、商業(yè)等 C 端場(chǎng)景,而會(huì)議同傳仍然是該領(lǐng)域的至高挑戰(zhàn)。
創(chuàng)立了 17 年的博鰲亞洲論壇第一次使用 AI 同傳,不僅是這個(gè)年度國(guó)際頂尖論壇所做出的重要改變,也是“騰訊同傳”一次不小的考驗(yàn)。以至于馬化騰在朋友圈也對(duì)準(zhǔn)備上崗博鰲的騰訊同傳不無(wú)關(guān)切,“新嘗試,多包涵。”
據(jù)騰訊公司 QQ 瀏覽器及“騰訊翻譯君”負(fù)責(zé)人李學(xué)朝接受知曉程序?qū)TL時(shí)介紹,從 4 月 9 日,騰訊同傳正式投入使用于博鰲亞洲論壇開(kāi)幕前各場(chǎng)分論壇的情況來(lái)看,騰訊同傳可以在嘉賓自由多語(yǔ)發(fā)言切換的情況下,完成翻譯結(jié)果;使用過(guò)程中也發(fā)現(xiàn)一些壞的例子,團(tuán)隊(duì)已及時(shí)進(jìn)行修復(fù),符合對(duì) AI 同傳的預(yù)期。
然而,此前的小試牛刀之后,也會(huì)在今天迎來(lái)大考。博鰲亞洲論壇今天上午正式舉行開(kāi)幕儀式,作為開(kāi)幕式同傳支持之一,騰訊同傳將與人工同傳一起,為會(huì)議提供雙語(yǔ)紀(jì)要服務(wù)。
李學(xué)朝告訴知曉程序,此次騰訊同傳主要采用“現(xiàn)場(chǎng)投屏”、“小程序”2 種模式?,F(xiàn)場(chǎng)參會(huì)的他國(guó)領(lǐng)導(dǎo)人、政要以及國(guó)際友人可以通過(guò)會(huì)場(chǎng)大屏幕實(shí)時(shí)觀看演講文字版;而遠(yuǎn)程觀看這場(chǎng)開(kāi)幕式的用戶(hù),則可以掃描騰訊同傳小程序碼,獲取會(huì)議的中英文雙語(yǔ)演講內(nèi)容,并可“點(diǎn)擊聽(tīng)譯文”收聽(tīng)演講。
銜枚疾走的“騰訊翻譯君”
騰訊人工智能同聲傳譯解決方案由 2 個(gè)部分組成:“騰訊翻譯君”+“微信智聆”。
李學(xué)朝介紹說(shuō),博鰲亞洲論壇上實(shí)際的同傳實(shí)現(xiàn)原理是,微信智聆把人聲識(shí)別為文字,騰訊翻譯君再把文本翻譯成目標(biāo)語(yǔ)言,再通過(guò)語(yǔ)音合成進(jìn)行播報(bào)。
其中“微信智聆”團(tuán)隊(duì)早在 2011 年就開(kāi)始成立;相較而言,“騰訊翻譯君”要晚的多,這個(gè)由 MIG 內(nèi)部孵化的團(tuán)隊(duì)成立時(shí)間為 2016 年。騰訊翻譯君與微信智聆合體為騰訊同傳則是在 2017 年。
伴隨著騰訊的潛心布局,翻譯領(lǐng)域的技術(shù)變革也正迅疾發(fā)生。2016 年初,騰訊開(kāi)始研發(fā) AI 翻譯產(chǎn)品,當(dāng)時(shí)整個(gè)行業(yè)都在采用的是 SMT 的統(tǒng)計(jì)機(jī)器翻譯技術(shù),其背后的核心算法是基于短語(yǔ)的機(jī)器翻譯,錯(cuò)誤率較高。
技術(shù)的奇點(diǎn)出現(xiàn)在 2016 年底。谷歌在機(jī)器翻譯方面取得重大突破,所發(fā)布的神經(jīng)網(wǎng)路機(jī)器翻譯系統(tǒng)(Google Neural Machine Translation),簡(jiǎn)稱(chēng) GNMT,實(shí)現(xiàn)了迄今為止機(jī)器翻譯質(zhì)量的最大提升。
正是看到這一突破,騰訊翻譯君團(tuán)隊(duì)很快調(diào)轉(zhuǎn)走向,采用了 NMT 技術(shù)。翻譯君團(tuán)隊(duì)基于神經(jīng)網(wǎng)絡(luò)算法和騰訊的數(shù)據(jù)開(kāi)發(fā)了 TNMT 算法。不僅在騰訊內(nèi)部勝出,也很快確立了自己的核心優(yōu)勢(shì)。
如今,“騰訊翻譯君”已經(jīng)支持 15 個(gè)語(yǔ)種,每天翻譯請(qǐng)求超過(guò) 4 億。而在博鰲亞洲論壇之前,騰訊同傳已經(jīng)有近百場(chǎng)的實(shí)戰(zhàn),其中包括 VMWARE 中國(guó)女性發(fā)展論壇、2018 年騰訊年會(huì)、2018 微信公開(kāi)課 Pro、騰訊媒體 + 峰會(huì)等。會(huì)議現(xiàn)場(chǎng)中文語(yǔ)音識(shí)別準(zhǔn)確率平均可達(dá) 97%,翻譯可接受度超過(guò) 92%。
一直以來(lái),同聲傳譯的難點(diǎn)已經(jīng)被行業(yè)所共知。李學(xué)朝對(duì)知曉程序說(shuō),在大型會(huì)議之前,騰訊是不能拿到發(fā)言稿的,這需要騰訊同傳完全擬人化地應(yīng)對(duì)現(xiàn)場(chǎng)的各種狀況。
比如說(shuō),在 2018 年年初騰訊年會(huì)上,馬化騰就臨場(chǎng)決定使用沒(méi)有經(jīng)過(guò)準(zhǔn)備的騰訊同傳?!暗褂媒Y(jié)果出來(lái)后,大家對(duì)翻譯君和微信智聆這套同傳方案更有了底氣?!崩顚W(xué)朝說(shuō)。
不過(guò)到了博鰲亞洲論壇,現(xiàn)場(chǎng)情況的復(fù)雜性對(duì)騰訊同傳又提出了更高要求。針對(duì)論壇專(zhuān)業(yè)度高、覆蓋度廣的特殊場(chǎng)景,騰訊翻譯君還通過(guò)定制化術(shù)語(yǔ)支持、領(lǐng)域自適應(yīng)等技術(shù)進(jìn)一步優(yōu)化翻譯結(jié)果。微信智聆也專(zhuān)門(mén)針對(duì)博鰲論壇嘉賓的國(guó)家、地區(qū)語(yǔ)言特征進(jìn)行專(zhuān)項(xiàng)優(yōu)化訓(xùn)練,并通過(guò)工程優(yōu)化實(shí)現(xiàn)多人、多語(yǔ)種會(huì)話的并行識(shí)別,保證現(xiàn)場(chǎng)的識(shí)別準(zhǔn)確率。
不過(guò),李學(xué)朝告訴知曉程序,雖然騰訊翻譯君已經(jīng)支持 15 個(gè)語(yǔ)種,但此次博鰲亞洲論壇還僅使用中英雙語(yǔ)翻譯。
“騰訊同傳”的進(jìn)擊之道
在博鰲,騰訊成為業(yè)界首個(gè)創(chuàng)新支持同傳雙語(yǔ)內(nèi)容多渠道查看和回放的 AI 同傳服務(wù),包括會(huì)議現(xiàn)場(chǎng)投屏、小程序查看、語(yǔ)音收聽(tīng)、會(huì)議紀(jì)要回放等。
而騰訊同傳小程序也是在本屆論壇初次亮相。
李學(xué)朝說(shuō),在翻譯君上線之初,主要的切入點(diǎn)是旅游場(chǎng)景下的個(gè)人用戶(hù)市場(chǎng)。為個(gè)人消費(fèi)者提供文本翻譯、語(yǔ)音翻譯、拍照翻譯、口語(yǔ)跟讀測(cè)評(píng)等多類(lèi)型翻譯服務(wù),并能通過(guò)手機(jī) App、微信公眾號(hào)、微信小程序、PC 網(wǎng)頁(yè)版等渠道使用。
隨著機(jī)器翻譯和翻譯需求的井噴,越來(lái)越多的領(lǐng)域開(kāi)始浮現(xiàn)出對(duì)在線化、智能化、效率化的翻譯要求。翻譯君從剛開(kāi)始的口語(yǔ)、旅游等,逐漸擴(kuò)展到微信、QQ、“王者榮耀海外版”(Arena of Valor)等社交領(lǐng)域,以及 QQ 瀏覽器、QQ 郵箱,甚至延伸到金融、教育、硬件等各個(gè)行業(yè)。
相比較其他產(chǎn)品,騰訊翻譯君的快速拓展,仍然體現(xiàn)了騰訊的平臺(tái)優(yōu)勢(shì),以及騰訊團(tuán)隊(duì)對(duì)于線上場(chǎng)景的理解?!皳碛羞^(guò)硬的技術(shù)產(chǎn)品之后,我們也充分利用好騰訊強(qiáng)大的平臺(tái),公司有很多用戶(hù)場(chǎng)景和需求可以滲透進(jìn)去。所以,我們能夠不斷地從平臺(tái)接入騰訊翻譯,因?yàn)槲覀儤I(yè)務(wù)在出海,可以逐漸找到更多落地的場(chǎng)景?!崩顚W(xué)朝表示。
而對(duì)于最重要的兩個(gè)移動(dòng)平臺(tái),App 與小程序,騰訊翻譯君采取了分別不同的運(yùn)營(yíng)策略。比如,口語(yǔ)跟讀是時(shí)下翻譯應(yīng)用很重要的使用場(chǎng)景,騰訊翻譯君觀察到這點(diǎn)后,在 app 內(nèi)設(shè)置雙語(yǔ)海報(bào)、口語(yǔ)學(xué)習(xí)等功能內(nèi)容,從而提高了玩家黏性。
至于小程序,更多是在微信生態(tài)內(nèi),以其無(wú)需下載、即用即走的特點(diǎn)為翻譯君帶來(lái)更大的訪問(wèn)量、更多的體驗(yàn)用戶(hù),主要突出最核心的實(shí)用功能——翻譯。李學(xué)朝告訴知曉程序,目前,騰訊翻譯君小程序主要為個(gè)人用戶(hù)所使用;而在博鰲亞洲論壇正式啟動(dòng)上線的騰訊同傳小程序,則服務(wù)于會(huì)議需求,對(duì)接給 B 端,并提供給對(duì)會(huì)議感興趣的參會(huì)者與遠(yuǎn)程參會(huì)者。
而在企業(yè)級(jí)客戶(hù)服務(wù)對(duì)接方面,李學(xué)朝也表示,騰訊同傳現(xiàn)在主要有兩種方式。第一種是線下服務(wù)器的模式,采取專(zhuān)門(mén) VIP 式的服務(wù),由翻譯君團(tuán)隊(duì)和微信團(tuán)隊(duì)的技術(shù)人員到現(xiàn)場(chǎng)支持。第二種是云服務(wù),聯(lián)合騰訊云共同提供。當(dāng)用戶(hù)和公司有需求的時(shí)候,通過(guò)騰訊云可以體驗(yàn)和滿足。
AI 與人工同傳,是交戰(zhàn)還是交融?
事實(shí)上,伴隨著騰訊同傳在博鰲亞洲論壇的首日亮相,有關(guān)翻譯準(zhǔn)確率的問(wèn)題也引發(fā)了行業(yè)關(guān)注。對(duì)此,騰訊方面回應(yīng)稱(chēng),由于各種“新奇”的語(yǔ)料知識(shí)、專(zhuān)業(yè)名詞、五湖四海的英語(yǔ)流派熔于一爐,再加上話筒噪聲、回聲等環(huán)境音的干擾,的確對(duì)騰訊同傳構(gòu)成較大挑戰(zhàn)。
“騰訊同傳還在學(xué)習(xí)和成長(zhǎng)之中,對(duì)于一些專(zhuān)有名詞倒裝句,以及中英文流利切換的嘉賓演講,還需要繼續(xù)加強(qiáng)學(xué)習(xí)?!彬v訊同傳不是做替代者,而是行業(yè)的賦能者。
至于網(wǎng)傳由于現(xiàn)場(chǎng)翻譯效果不佳, 4 月 9 日下午,騰訊在海淀希格瑪大廈緊急招募人工同傳補(bǔ)位的消息,知曉程序向騰訊同傳求證,得到回應(yīng)稱(chēng),這完全是一個(gè)烏龍。
騰訊同傳告訴知曉程序,所謂的邀請(qǐng)人工同傳,并非為騰訊同傳團(tuán)隊(duì)用于現(xiàn)場(chǎng) AI 同傳,而是服務(wù)于騰訊新聞團(tuán)隊(duì)做閉門(mén)采訪等專(zhuān)業(yè)報(bào)道。而且,本次會(huì)議的多數(shù)場(chǎng)次本來(lái)就采用了 AI 同傳與人工同傳互相配合的形式,并無(wú)再次邀請(qǐng)的必要。
李學(xué)朝也認(rèn)為,“語(yǔ)言是一種交流工具,機(jī)器翻譯與人工翻譯各有其擅長(zhǎng)的應(yīng)用場(chǎng)景和服務(wù)。”比如,機(jī)器翻譯可以每天提供億級(jí)翻譯次數(shù)、有對(duì)新領(lǐng)域的定制術(shù)語(yǔ)快速掌握的能力,這是人工翻譯難以復(fù)制的;而翻譯員所能整合的人際了解、模糊語(yǔ)義的掌握等,這些是機(jī)器翻譯短期內(nèi)不容易達(dá)到的。
畢竟,AI 所習(xí)得的僅僅是“智能”,而人類(lèi)擁有的卻是“智慧”。
提交
2024年斯凱孚創(chuàng)新峰會(huì)暨新產(chǎn)品發(fā)布會(huì)召開(kāi),以創(chuàng)新產(chǎn)品矩陣重構(gòu)旋轉(zhuǎn)
禹衡光學(xué)亮相北京機(jī)床展,以創(chuàng)新助力行業(yè)發(fā)展新篇章
從SCIMC架構(gòu)到HyperRing技術(shù),機(jī)器人控制技術(shù)的革新
漢威科技用智慧化手段為燃?xì)鈴S站構(gòu)筑安全防線
DSP應(yīng)用市場(chǎng)的大蛋糕,國(guó)產(chǎn)廠商能吃下多少?