原標題:用智能語音實現“溝通無障礙”——(引題)

科大訊飛“智”顯身手(主題)

“你好,歡迎來到北京冬奧會。”在冬奧村,名叫“愛加”的志愿者隨時提供咨詢服務。與其他冬奧會志愿者不同,“愛加”是虛擬人,會中英日俄法西6種語言,不管是冬奧賽事、賽程查詢,還是交通、文化、旅游問答,都能快速回應。

這是科大訊飛助力北京2022年冬奧會的代表產品之一。作為北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商,科大訊飛圍繞實現“溝通無障礙”,在北京、張家口賽區提供了翻譯機、穿戴式翻譯耳機等產品,為參加奧運會的人員提供語音識別、機器翻譯等服務。

“奧運精神是更高、更快、更強、更團結,科大訊飛希望用科技力量讓世界更美好。在冬奧賽場上,我們將通過技術實現溝通無障礙。”科大訊飛高級副總裁杜蘭說。

提供智能化服務

做好面向全球的跨語言服務、多語種信息發布和傳播,是辦好冬奧會的基本保障之一。科大訊飛董事長劉慶峰介紹,憑借機器翻譯和多語言語音轉換技術,科大訊飛圍繞“人和人之間溝通無障礙、人和組織之間溝通無障礙、人和賽事之間溝通無障礙”三大方向,加速應用場景落地。

基于智能語音新一代人工智能開放創新平臺,科大訊飛研發定制了多語種智能語音及語言服務平臺,提供面向冬奧場景定制優化的語音識別、語音合成、機器翻譯、自動問答等功能,支持60個語種語音合成、69個語種語音識別、168個語種機器翻譯和3個語種交互理解。

針對冬奧會特定的場景需求,科大訊飛構建了中英日俄法西6個語種的冬奧知識問答系統,知識范圍包括冬奧常識、項目信息和人物信息等。同時,依托虛擬形象作為載體,融合手勢、視線等多模感知交互技術,實現人與機器“同理共情”。“聽障人士聽不見比賽結果,但可以看見屏幕上同步的多國字幕;視障人士看不見文字,但可以‘聽’得見文字。”劉慶峰說。

科大訊飛打造的智能服務機器人平臺也在首鋼園應用落地,在語言翻譯、導航、酒店入住、賽事查詢、旅游觀光等環節,為運動員、賽事服務人員提供智能化、個性化服務。

應用多項新技術

要實現冬奧場景下溝通無障礙并非易事,要保證語種足夠全、翻譯足夠準、反應足夠快。比如,多語種語音語言技術涉及60種語音識別、合成、翻譯等相關技術的研發,一些小語種語言體系復雜、數據資源稀缺。

對此,科大訊飛聯合中國科學技術大學開展端到端建模,以及無監督、自監督訓練技術的研發工作。在語音識別上,提出了基于形態聚類的分組端到端統一建模技術,相比基線獨立建模平均錯誤率下降14.18%;在語音合成上,提出基于聽感量化編碼的多語種統一建模和遷移學習方法,實現多語種多話者端到端語音合成聯合建模。

“我們推出的雙屏翻譯機,重點語種翻譯準確率不低于95%,平均每句翻譯響應時間不超過0.5秒。”科大訊飛AI研究院副院長劉俊華說。

不少參賽運動員表示:“北京冬奧會提供的雙屏翻譯機,讓來自不同國家和地區的運動員可以隨時隨地實現無障礙交流,翻譯得既準確又流暢,幾乎沒有出現卡頓情況。在拉進彼此距離的同時,也為大家提供充分溝通學習的機會。”

智能問答是當前人工智能領域研究的熱點方向,面臨口語化歧義性、意圖理解識別準確度、對知識內容覆蓋度等問題,在多語種研發過程中,由于語言人才不足,在知識構建和語言現象分析方面更為困難。

據介紹,科大訊飛采用系統組合方案,提高通用技術水平,提出基于片段語義提取和查詢圖構造的語義理解方案,減少對數據依賴,并利用多語種預訓練模型和自有機器翻譯模型,實現6個語種間的數據對齊,最終將6個語種交互的成功率均提升到85%以上。

為保障冬奧期間相關產品穩定性,科大訊飛技術團隊在產品上實現自動切換功能以應對突發情況,并提供全天候服務應對措施。

滿足多語種需求

“借助北京冬奧會這一契機,企業品牌影響力和品牌價值都得到大幅提升。”在劉慶峰看來,冬奧會不僅是企業展示技術的窗口,更是加速技術成熟的機遇期。

為服務冬奧會,科大訊飛拓展了多語種相關方向,系統性研發了多語種的語音識別、語音合成、機器翻譯、圖文識別等技術,推動公司轉型升級。劉慶峰表示,未來,他們將向全球提供70個語種的語音交互、智能翻譯能力,并形成整體解決方案。希望通過多語種語音語言核心技術創新和產業應用落地,滿足國家和市場對多語種翻譯的需求,讓中國聲音、中國故事傳得更遠。

“冬奧會猶如最前沿科技應用的‘試驗田’,企業研發的新科技將在冬奧會后,應用到城市管理、智能制造等多個領域。”劉俊華說,企業將進一步拓展海外市場,陸續推出海外版本的訊飛翻譯機、錄音筆等智能硬件。(經濟日報記者 李芃達 中國經濟網記者 馬常艷)

標簽: 科大訊飛 語音 溝通 障礙 冬奧