4月22日-24日,,首屆數(shù)字中國建設(shè)峰會在福州舉行,。隨著會議的進行和企業(yè)最新成果的發(fā)布,,記者發(fā)現(xiàn)在大屏幕上會不斷呈現(xiàn)出發(fā)言內(nèi)容的中英雙語字幕,,隨著發(fā)言內(nèi)容的逐漸完整,,屏幕上顯示的字幕也會根據(jù)語境自動完善,。
據(jù)工作人員介紹,,在現(xiàn)場擔任機器同傳工作的“機器人”來自搜狗公司,,通過機器同傳,,嘉賓演講內(nèi)容可以實時以中英文字幕顯示在屏幕上,。它能讓參會者無需佩戴同傳耳機,而是通過字幕就能直觀的接收有效信息,。并且“機器人”可以識別方言,,降低由于普通話不標準而導致的分享內(nèi)容的折損,讓參會人員最大限度的理解發(fā)言內(nèi)容,。
搜狗AI事業(yè)部總經(jīng)理張博告訴經(jīng)濟日報-中國經(jīng)濟網(wǎng)記者,,2011年,搜狗開始研究語音識別技術(shù),,至今已有7年,,搜狗采取“雙引擎”戰(zhàn)略,不斷加大人工智能技術(shù),、產(chǎn)品和服務(wù)的研發(fā)投入,。
全球首家商用機器同傳系統(tǒng)
據(jù)了解,2016年11月,,搜狗的機器同傳在第三屆世界互聯(lián)網(wǎng)大會“移動互聯(lián)網(wǎng)論壇”亮相,,成為全球首個商用機器同傳。
從首次亮相開始,,搜狗同傳不斷升級,。張博表示,在產(chǎn)品化的過程中,,為了達到實時的效果,,搜狗在速度和精度上做了很多嘗試,比如使用了GRU作為搜狗同傳的神經(jīng)元結(jié)構(gòu),,使其可以在性能保持不變的前提下,,降低運算復雜度,在層數(shù)和參數(shù)量上也做了一定的精簡,。在提升翻譯效果方面,,針對實體詞、集外詞,、對齊效果的處理上也做了很多研發(fā)工作,。目前,,搜狗同傳語音識別的準確率可以達到97%,支持最快400字每分的高速聽寫,,翻譯的準確率可以達到90%,。方便了參會者更好地理解發(fā)布者所講述的內(nèi)容。
先進的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)
張博介紹,,搜狗還支持語音實時翻譯技術(shù)SNMT(Sogou Neural Machine Translation),,即搜狗同傳翻譯系統(tǒng),集成了語音識別,、機器翻譯,、語音合成等先進技術(shù),運行同傳翻譯時,,屏幕上會實時顯示出語音識別出的中文或英文,,同時也會實時翻譯成對應(yīng)的英文或中文,此外,,還可實現(xiàn)男,、女聲或某特定個人的聲音輸出翻譯后的語言。
目前,,市面上一些機器同傳系統(tǒng)在實際操作中會出現(xiàn)大面積單詞無意義重復,、大小寫及字符混亂、中英夾雜翻譯混亂,、帶口音普通話無法識別等現(xiàn)象,。“搜狗作為全球首家商用機器同傳,,兩年多的時間里已經(jīng)積累了無數(shù)場同傳的實戰(zhàn)經(jīng)驗,,通過技術(shù)創(chuàng)新基本上克服了以上出現(xiàn)的所有問題,為機器同傳技術(shù)的大規(guī)模商用做了有益探索,�,!睆埐⿲�(jīng)濟日報-中國經(jīng)濟網(wǎng)記者表示。 (經(jīng)濟日報-中國經(jīng)濟網(wǎng)記者王婉瑩)