
提到百度旗下的解密智能音箱小度,你可能會想到他曾在春晚登臺,百度背后以及在真人秀《向往的音箱
重慶外圍(外圍模特)電話微信199-7144-9724誠信外圍,十年老店生活》里聰明智慧的樣子。只要我們對著他喊“小度,小度小度”,術和他就會立馬應和我們,解密并且回應我們的百度背后任何請求。
根據市場研究機構Strategy Analytics最新發布的音箱《2019 Q2全球智能音箱的報告》,小度以470萬臺的小度出貨量位列國內第一;而在全球范圍內,他的術和出貨量僅次于亞馬遜和Google。
小度的解密背后有何技術在做支撐,我們評價一款智能音箱的百度背后好壞其標準是什么?雷鋒網(公眾號:雷鋒網)了解到,一般情況下,音箱
重慶外圍(外圍模特)電話微信199-7144-9724誠信外圍,十年老店我們評價智能音箱的小度好壞主要看三個方面,分別是術和聽清、聽懂和滿足。
在聽清方面,其是指把用戶的聲波轉化成正確的文字,一般稱為語音識別或者喚醒。在內外噪音的干擾之下,機器要能夠準確地識別用戶的指令。這部分小度可以通過引入百度語音首創的流式多級的截斷注意力模型(SMLTA),大大提升ASR效果。
我們比較熟悉的ASR技術(Automatic Speech Recognition,語音識別),是將聲音轉化為文字,可類比于人類的耳朵;而TTS技術(Text-To-Speech,語音合成),是將文字轉化為聲音(朗讀出來),類比于人類的嘴巴。大家在Siri等各種語音助手中聽到的聲音,都是由TTS來生成的,并不是真人在說話。
關于SMLTA,據公開信息,其是使用CTC(一種語音識別算法)的尖峰信息對連續語音流進行截斷,然后在每一個截斷的語音小段上進行當前建模單元的注意力建模;這樣把原來的全局的整句Attention建模,變成了局部語音小段的Attention的建模;同時,為了克服CTC模型的不可避免的插入刪除錯誤對系統造成的影響,該算法引入一種特殊的多級Attention機制,實現特征層層遞進的更精準的特征選擇;最終,這種創新的建模方法的識別率不但超越了傳統的全局Attention建模,同時還能夠保持計算量、解碼速度等在線資源耗費和傳統CTC模型持平。這也是第一次有公開報道,局部的Attention建模,有可能超過全局的Attention建模。
在聽懂方面,其是指得到這個字符串之后是不是能理解用戶的需求到底是什么,能夠準確的給出響應,或者給出引導。比如小度在獲得模糊需求(不清晰指令)的時候,它會嘗試分析和校對自己的指令,以便更準確地滿足用戶的需求。其結合百度NLP的知識增強語義表示模型ERNIE,核心理解算法升級為超大數據預訓練深度模型。
在7 月 30 日,百度發布了 ERNIE的優化版本——ERNIE 2.0 自然語言理解框架。它可以通過持續的多任務學習,逐步學習和建立預訓練任務。該框架支持增量引入詞匯 (lexical)、語法 (syntactic) 、語義 (semantic) 等 3 個層次的自定義預訓練任務,并通過多任務學習對其進行訓練,實現全面捕捉訓練語料中的詞法、語法、語義等潛在信息。而且每當引入新任務時,該框架在遞增地訓練分布式表示的同時,還會記住先前任務的信息。
最后在滿足方面,用戶要的越寬泛越多,我們是不是能給得越多?這是滿足的部分。在滿足用戶需求方面,融合百度全網搜索能力與大規模精準用戶畫像,從直接滿足進化為個性化助手。
智能音箱的滿足能力,這里主要看兩點,設備的知識完備程度和技能服務生態。百度智能生活事業群組(SLG)首席技術官朱凱華表示,
“對于小度來說,其依靠百度生態中的知識圖譜和搜索請求,以及網頁內容支持,其知識完備程度較好;此外在技能服務生態方面,小度助手的開放平臺上,已經擁有了33000多名的開發者,并且已經累積了2400+的線上技能。”
在軟硬一體結合方面,小度采用了全雙工免喚醒技術,雷鋒網了解到,關于該技術的應用有三個必要條件:
軟件和硬件結合。即Hardware Designed for Software,就是硬件構建的時候,需要為軟件的特征進行專門制作;
語音識別和語義理解結合。是指能夠做端到端的識別和理解,整個體驗的串聯,需要整個部分深度的整合和優化;
完善的技術儲備和解決方案。比如小度,其所有技術百度都 In house 具備,能夠深度整合。
朱凱華表示,在智能音箱這個行業里面,很重要的一點需要Designed for software,就是硬件構建的時候,需要為軟件的特征進行專門制作。小度在設計的一開始,就對它的聲學效果要有非常高的要求,在高噪音的環境下,也可以準確喚醒。這個前提是對于硬件整個聲學結構的要求很高,而小度則是從硬件設計伊始就是已經做好了準備。語音識別需要和語義理解完全結合起來,能夠做端到端的識別和理解。整個體驗的串聯,需要整個部分深度的整合和優化,而這也正是百度的獨特優勢。相比于其他產品往往在各個階段都是采買了不同提供方的技術相比,百度完善一體的技術儲備和解決方案,為小度的整體體驗,做到了強大的后盾支撐。