11月28日,百度首席技術官王海峰透露,百度大腦語音能力日均調用量超過100億次。同日,百度大腦語音引擎發(fā)布、升級了14項產品和內容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板及3個場景解決方案,升級了語音自訓練平臺、呼叫中心語音解決方案等。

王海峰表示:“AI技術的進化和產業(yè)賦能正向循環(huán),相互促進,AI在應用場景中不斷進化。百度的語音技術基于深度學習和產業(yè)應用,已應用到百度App,百度地圖、小度音箱,百度輸入法等百度產品,更通過AI開放平臺賦能眾多產業(yè)伙伴。百度大腦語音能力每天的調用量已經超過100億。”

據悉,百度大腦開放平臺已開放228項AI能力,擁有超過150萬開發(fā)者。針對智能硬件設備,百度大腦發(fā)布了基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板,以及智能家居、智能車載、智能IoT設備3個端到端軟硬一體遠場語音交互場景解決方案。

在語音識別領域,百度大腦升級了短語音識別、實時語音識別能力,發(fā)布了音頻文件轉寫能力,升級了可零代碼提升業(yè)務術語識別率的語音自訓練平臺,以及呼叫中心語音解決方案。針對語音合成,百度大腦發(fā)布了6個在線語音合成精品音庫和5個離線語音合成精品音庫,對語音能力,助力智能硬件、互聯網、呼叫中心等領域進行了智能化升級。

除了升級產品,百度語音首席架構師賈磊介紹了基于復數CNN網絡的語音增強和語音識別一體化端到端建模技術,該方法拋棄了數字信號處理學科和語音識別學科的各種先驗假設,直接端到端進行一體化建模。相較于傳統基于數字信號處理的麥克陣列算法,新技術的錯誤率降低了超過30%。目前該方法已經被集成到百度最新發(fā)布的百度鴻鵠芯片中。

百度大腦目前已開放了云、端、芯包含語音識別、語音合成等全棧語音引擎能力,并應用于金融、政務、文娛等多種行業(yè)和場景。

創(chuàng)維AIoT研究院產品經理李凱表示,大屏IoT的行業(yè)痛點在于信息檢索難和設備控制操作復雜。通過增加語音交互能力,創(chuàng)維和百度重構了整個AIoT設備生態(tài)的交互體驗,在電視方面的合作成果已落地在10個電視芯片型號、2500萬臺電視上。在下一代遠場語音方案中,百度鴻鵠語音芯片為創(chuàng)維產品帶來了高性價比硬件、整合優(yōu)化的軟件算法等價值,雙方將基于百度鴻鵠芯片展開多項產品合作。

瓴岳科技信貸運營總監(jiān)宋力介紹,依托百度大腦呼叫中心實時語音識別等AI服務,瓴岳科技打造了降本提效的智能機器人,智能機器人、智能語音質檢的應用,讓瓴岳科技的貸后人力投入降低61.47%。

北京子杰寶貝科技有限公司項目經理肖云峰說:“我們開發(fā)的智能錄入系統,在百度大腦語音自訓練平臺進行語音識別模型訓練,識別率從80%提升至95%以上。該系統有效降低了醫(yī)護人員的工作強度,提升了臨床護理效率。”

在農業(yè)領域,從業(yè)者也遇到了農業(yè)作物專業(yè)詞匯語音識別率低的問題。華智生物信息技術主任龍曉波表示,得益于百度大腦語音自訓練平臺,公司的農業(yè)結構化性狀數據語音識別準確率從71.09%提升至98.75%,采集一個測試田地性狀信息從300人工時降低到160人工時,工作效率提升了一倍。

善行智能聯合創(chuàng)始人黃小瑰介紹,基于百度大腦語音等技術打造的小Q智能導盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助。

據悉,百度大腦推出了“因AI而聲”公益計劃,將為提供公益性服務的公司或組織,提供語音技術免費、專屬語音技術支持等福利。

標簽: 百度大腦 語音能力