4月22日-24日,,首屆數(shù)字中國建設(shè)峰會在福州舉行,。隨著會議的進(jìn)行和企業(yè)最新成果的發(fā)布,,記者發(fā)現(xiàn)在大屏幕上會不斷呈現(xiàn)出發(fā)言內(nèi)容的中英雙語字幕,,隨著發(fā)言內(nèi)容的逐漸完整,,屏幕上顯示的字幕也會根據(jù)語境自動完善,。
據(jù)工作人員介紹,,在現(xiàn)場擔(dān)任機(jī)器同傳工作的“機(jī)器人”來自搜狗公司,,通過機(jī)器同傳,嘉賓演講內(nèi)容可以實(shí)時以中英文字幕顯示在屏幕上,。它能讓參會者無需佩戴同傳耳機(jī),,而是通過字幕就能直觀的接收有效信息。并且“機(jī)器人”可以識別方言,,降低由于普通話不標(biāo)準(zhǔn)而導(dǎo)致的分享內(nèi)容的折損,,讓參會人員最大限度的理解發(fā)言內(nèi)容。
搜狗AI事業(yè)部總經(jīng)理張博告訴經(jīng)濟(jì)日報-中國經(jīng)濟(jì)網(wǎng)記者,,2011年,,搜狗開始研究語音識別技術(shù),至今已有7年,,搜狗采取“雙引擎”戰(zhàn)略,,不斷加大人工智能技術(shù)、產(chǎn)品和服務(wù)的研發(fā)投入,。
全球首家商用機(jī)器同傳系統(tǒng)
據(jù)了解,,2016年11月,搜狗的機(jī)器同傳在第三屆世界互聯(lián)網(wǎng)大會“移動互聯(lián)網(wǎng)論壇”亮相,,成為全球首個商用機(jī)器同傳,。
從首次亮相開始,搜狗同傳不斷升級,。張博表示,,在產(chǎn)品化的過程中,為了達(dá)到實(shí)時的效果,,搜狗在速度和精度上做了很多嘗試,,比如使用了GRU作為搜狗同傳的神經(jīng)元結(jié)構(gòu),使其可以在性能保持不變的前提下,,降低運(yùn)算復(fù)雜度,,在層數(shù)和參數(shù)量上也做了一定的精簡。在提升翻譯效果方面,,針對實(shí)體詞,、集外詞、對齊效果的處理上也做了很多研發(fā)工作,。目前,搜狗同傳語音識別的準(zhǔn)確率可以達(dá)到97%,支持最快400字每分的高速聽寫,,翻譯的準(zhǔn)確率可以達(dá)到90%,。方便了參會者更好地理解發(fā)布者所講述的內(nèi)容。
先進(jìn)的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)
張博介紹,,搜狗還支持語音實(shí)時翻譯技術(shù)SNMT(Sogou Neural Machine Translation),,即搜狗同傳翻譯系統(tǒng),集成了語音識別,、機(jī)器翻譯,、語音合成等先進(jìn)技術(shù),運(yùn)行同傳翻譯時,,屏幕上會實(shí)時顯示出語音識別出的中文或英文,,同時也會實(shí)時翻譯成對應(yīng)的英文或中文,此外,,還可實(shí)現(xiàn)男,、女聲或某特定個人的聲音輸出翻譯后的語言。
目前,,市面上一些機(jī)器同傳系統(tǒng)在實(shí)際操作中會出現(xiàn)大面積單詞無意義重復(fù),、大小寫及字符混亂、中英夾雜翻譯混亂,、帶口音普通話無法識別等現(xiàn)象,。“搜狗作為全球首家商用機(jī)器同傳,,兩年多的時間里已經(jīng)積累了無數(shù)場同傳的實(shí)戰(zhàn)經(jīng)驗(yàn),,通過技術(shù)創(chuàng)新基本上克服了以上出現(xiàn)的所有問題,為機(jī)器同傳技術(shù)的大規(guī)模商用做了有益探索,�,!睆埐⿲�(jīng)濟(jì)日報-中國經(jīng)濟(jì)網(wǎng)記者表示。 (經(jīng)濟(jì)日報-中國經(jīng)濟(jì)網(wǎng)記者王婉瑩)