智能音箱如何識別方言?
導讀:盡管機器學習使語音識別技術的音箱發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方佛山南海找小姐全套按摩包夜服務電vx《749-3814》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達問題就是有地域歧視性。
自從IBM的音箱Shoebox和Worlds of Wonder的玩具娃娃Julie doll發布以來,語音識別技術一直在不斷地發展。何識到2018年底,別方Google Assistant支持超過30種不同的音箱語言。
高通也開發了一款可以識別單詞和短語的何識語音識別系統,其準確率高達95%。別方此外,音箱微軟的何識智能語音客服比人工呼叫服務更加準確高效。
然而,別方盡管機器學習使語音識別技術的音箱佛山南海找小姐全套按摩包夜服務電vx《749-3814》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方問題就是有地域歧視性。
華盛頓郵報最近進行的一項研究結果顯示,谷歌和亞馬遜研發的流行智能語音助手識別非美國本地口音的準確率要比美國本地口音低30%。
像IBM和微軟這樣的公司都會通過Switchboard語料庫來降低語音助手的出錯率。但是事實證明,語料庫也無法徹底解決語音助手的口音識別問題。
“數據是混亂的,因為數據反映了人性,”埃森哲的全球責任AI監理Rumman Chowdhury說,“這就是算法最擅長之處:尋求人類行為模式。”
算法偏差表示機器學習模型對數據或者設計產生偏見的程度。很多新聞報道都對面部識別系統(尤其是亞馬遜網絡服務的圖像識別Rekognition)產生了不小的偏見。

而且,算法偏差還會出現在其他方面,比如預測被告是否會在未來犯罪的自動化系統以及谷歌新聞等app背后的內容推薦算法。
微軟以及包括IBM、高通和Facebook在內的AI行業領導者已經開發出自動化工具,用于檢測并減少AI算法中產生的偏差,但很少有人能夠提出口音識別問題的具體解決方案。
真正提出解決方案的只有兩家公司。一個是Speechmatics,另一個便是Nuance。
解決口音差距問題
Speechmetrics是一家專門研究企業語音識別軟件的劍橋科技公司,它于12年前就開始實施了一項雄心勃勃的計劃,旨在開發比市場上任何產品更準確全面的語言識別系統。
該公司最初是研究統計語言建模和循環神經網絡。它開發了一種可以處理內存輸出序列的機器學習模型。2014年,它利用一個十億字節的語料庫加速其統計語言建模的發展,從此邁出了第一步。
到了2017年,它又邁向了另一個里程碑:與卡塔爾計算研究所(QCRI)合作開發了阿拉伯語言文字轉換服務。
“我們已經發現我們需要開發一款語音識別系統,只需一種模式便能適用于所有語言,不再有口音問題,并且它識別澳大利亞口音的準確度和轉錄蘇格蘭口音一樣高?!盨peechmatics首席執行官Benedikt vonThüngen說。
他們在今年七月成功研發了一款這樣的語音識別系統Global English。它擁有40多個國家的數千小時的語音數據和數百億單詞,支持所有英語口音的語音文本轉換功能。
此外,Global English的建立還離不開Speechmatic的Automatic Linguist,這是一種人工智能框架,通過利用已知語言中識別的模式來學習新語言的語言基礎。
“假設你一邊要和美國人交談,另一邊還要和澳大利亞人交流,而且這個美國人曾經住在加拿大,所以有加拿大口音,這時大多數的語音識別系統都會很難識別這種帶有不同口音的語言,但是我們的語音識別系統就完全不用擔心這個問題?!盨peechmatics公司產品副總裁Ian Firth在一次采訪中說。
在測試中,Global English在識別特定的口音方面表現的比谷歌的Cloud Speech API和IBM的Cloud還要出色。Thüngen表示,在高端領域中,它的準確率比其他產品還要高23%到55%。
Speechmatics并不是唯一一家想要解決口音識別問題的公司。
總部位于馬薩諸塞州柏林頓的Nuance表示,它將采用多種方法,確保其語音識別系統能夠識別將近80種語言,并且準確率都一樣高。
在其英國語言模型中,它收集了20個特定方言區域的語音和文本數據,包括每種方言獨有的單詞(比如使用單詞“cob”特指面包卷)及其發音。因此,這款Nuance的語音識別系統便能識別出“Heathrow”的52種不同表達方式。
如今,Nuance語音識別系統又有了新的發展。更新版本的Dragon是Nuance研發的定制語音文本轉換軟件組合,其機器學習模型可根據用戶的口音在幾種不同的方言中自動切換。
與沒有方言自動切換功能的舊版本相比,新版本的語音識別系統識別帶有西班牙口音的英語的準確率要高22.5%,識別美國南部方言的準確率要高16.5%,識別東南亞英語的準確率要高17.4%。
數據越多越好
歸根結底,語音識別的口音問題是由于數據不足產生的。語料庫的質量越高,語言模型越多種多樣,那么至少從理論上來說語音識別系統的準確率越高。
在華盛頓郵報的研究中,Google Home智能語音助手識別美國南部語言的準確率要比識別美國西部語言的準確率低3%。而亞馬遜的Echo識別美國中西部語言的準確率要低2%.
亞馬遜的一位發言人告訴華盛頓郵報,隨著更多的用戶用不同的口音說話,Alexa的語音識別能力會不斷提高。并且,谷歌在一份聲明中表示,他們將通過擴大自己的數據庫,不斷改進Google Assistant的語音識別技術。
隨著使用語音識別系統的用戶越來越多,它們的功能會進一步提升。根據市場研究公司Canalys數據顯示,到2019年之前,將近1億智能語音系統在全球銷售。并且,在2022年之前,大約55%的美國家庭都會擁有一個智能語音系統。
不要指望有徹底解決口音問題的方案?!鞍船F在的技術發展,你不可能研發出準確率最高并且適用于全世界用戶的語音識別系統,”Faith說?!澳隳茏龅淖詈玫氖虑楸闶潜WC這些語音識別系統能夠準確識別那些正在使用它們的用戶的口音。”
自從IBM的音箱Shoebox和Worlds of Wonder的玩具娃娃Julie doll發布以來,語音識別技術一直在不斷地發展。何識到2018年底,別方Google Assistant支持超過30種不同的音箱語言。
高通也開發了一款可以識別單詞和短語的何識語音識別系統,其準確率高達95%。別方此外,音箱微軟的何識智能語音客服比人工呼叫服務更加準確高效。
然而,別方盡管機器學習使語音識別技術的音箱佛山南海找小姐全套按摩包夜服務電vx《749-3814》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達發展突飛猛進,如今這些語音識別系統還是何識不夠完美,最嚴重的別方問題就是有地域歧視性。
華盛頓郵報最近進行的一項研究結果顯示,谷歌和亞馬遜研發的流行智能語音助手識別非美國本地口音的準確率要比美國本地口音低30%。
像IBM和微軟這樣的公司都會通過Switchboard語料庫來降低語音助手的出錯率。但是事實證明,語料庫也無法徹底解決語音助手的口音識別問題。
“數據是混亂的,因為數據反映了人性,”埃森哲的全球責任AI監理Rumman Chowdhury說,“這就是算法最擅長之處:尋求人類行為模式。”
算法偏差表示機器學習模型對數據或者設計產生偏見的程度。很多新聞報道都對面部識別系統(尤其是亞馬遜網絡服務的圖像識別Rekognition)產生了不小的偏見。

而且,算法偏差還會出現在其他方面,比如預測被告是否會在未來犯罪的自動化系統以及谷歌新聞等app背后的內容推薦算法。
微軟以及包括IBM、高通和Facebook在內的AI行業領導者已經開發出自動化工具,用于檢測并減少AI算法中產生的偏差,但很少有人能夠提出口音識別問題的具體解決方案。
真正提出解決方案的只有兩家公司。一個是Speechmatics,另一個便是Nuance。
解決口音差距問題
Speechmetrics是一家專門研究企業語音識別軟件的劍橋科技公司,它于12年前就開始實施了一項雄心勃勃的計劃,旨在開發比市場上任何產品更準確全面的語言識別系統。
該公司最初是研究統計語言建模和循環神經網絡。它開發了一種可以處理內存輸出序列的機器學習模型。2014年,它利用一個十億字節的語料庫加速其統計語言建模的發展,從此邁出了第一步。
到了2017年,它又邁向了另一個里程碑:與卡塔爾計算研究所(QCRI)合作開發了阿拉伯語言文字轉換服務。
“我們已經發現我們需要開發一款語音識別系統,只需一種模式便能適用于所有語言,不再有口音問題,并且它識別澳大利亞口音的準確度和轉錄蘇格蘭口音一樣高?!盨peechmatics首席執行官Benedikt vonThüngen說。
他們在今年七月成功研發了一款這樣的語音識別系統Global English。它擁有40多個國家的數千小時的語音數據和數百億單詞,支持所有英語口音的語音文本轉換功能。
此外,Global English的建立還離不開Speechmatic的Automatic Linguist,這是一種人工智能框架,通過利用已知語言中識別的模式來學習新語言的語言基礎。
“假設你一邊要和美國人交談,另一邊還要和澳大利亞人交流,而且這個美國人曾經住在加拿大,所以有加拿大口音,這時大多數的語音識別系統都會很難識別這種帶有不同口音的語言,但是我們的語音識別系統就完全不用擔心這個問題?!盨peechmatics公司產品副總裁Ian Firth在一次采訪中說。
在測試中,Global English在識別特定的口音方面表現的比谷歌的Cloud Speech API和IBM的Cloud還要出色。Thüngen表示,在高端領域中,它的準確率比其他產品還要高23%到55%。
Speechmatics并不是唯一一家想要解決口音識別問題的公司。
總部位于馬薩諸塞州柏林頓的Nuance表示,它將采用多種方法,確保其語音識別系統能夠識別將近80種語言,并且準確率都一樣高。
在其英國語言模型中,它收集了20個特定方言區域的語音和文本數據,包括每種方言獨有的單詞(比如使用單詞“cob”特指面包卷)及其發音。因此,這款Nuance的語音識別系統便能識別出“Heathrow”的52種不同表達方式。
如今,Nuance語音識別系統又有了新的發展。更新版本的Dragon是Nuance研發的定制語音文本轉換軟件組合,其機器學習模型可根據用戶的口音在幾種不同的方言中自動切換。
與沒有方言自動切換功能的舊版本相比,新版本的語音識別系統識別帶有西班牙口音的英語的準確率要高22.5%,識別美國南部方言的準確率要高16.5%,識別東南亞英語的準確率要高17.4%。
數據越多越好
歸根結底,語音識別的口音問題是由于數據不足產生的。語料庫的質量越高,語言模型越多種多樣,那么至少從理論上來說語音識別系統的準確率越高。
在華盛頓郵報的研究中,Google Home智能語音助手識別美國南部語言的準確率要比識別美國西部語言的準確率低3%。而亞馬遜的Echo識別美國中西部語言的準確率要低2%.
亞馬遜的一位發言人告訴華盛頓郵報,隨著更多的用戶用不同的口音說話,Alexa的語音識別能力會不斷提高。并且,谷歌在一份聲明中表示,他們將通過擴大自己的數據庫,不斷改進Google Assistant的語音識別技術。
隨著使用語音識別系統的用戶越來越多,它們的功能會進一步提升。根據市場研究公司Canalys數據顯示,到2019年之前,將近1億智能語音系統在全球銷售。并且,在2022年之前,大約55%的美國家庭都會擁有一個智能語音系統。
不要指望有徹底解決口音問題的方案?!鞍船F在的技術發展,你不可能研發出準確率最高并且適用于全世界用戶的語音識別系統,”Faith說?!澳隳茏龅淖詈玫氖虑楸闶潜WC這些語音識別系統能夠準確識別那些正在使用它們的用戶的口音。”
(責任編輯:熱點)
推薦文章
-
米哈游《崩壞:星穹鐵道》確認參展2024ChinaJoy銀河冒險開啟
米哈游《崩壞:星穹鐵道》確認參展2024ChinaJoy銀河冒險開啟2024-07-24 09:58:46編輯:柒柒 玩家
...[詳細]
-
備受諦視標兩次元衰典“次元の醉覺”早會于上周六熾熱召開,派趣科技以一艘“英王喬治五世號戰列艦”吸足了兩次元同好的視家。借此,《戰艦少女》也公布了其史上最大年夜范圍的“2.0版本”更新——除疑似第三艘“
...[詳細]
-
北京時候8月2日,網易戰世嘉頒布收表兩邊展開耐暫計謀開做,網易做為獨家收止商,將Creative Assembly開辟的《周齊戰役》Total War系列游戲引進中國。正在圓才結束的計謀公布會上,參與
...[詳細]
-
《青丘狐傳講》2月3日開啟賀歲測試,同名漫繪或即將暴光。3D MMO足游《青丘狐傳講》將于2月3日開啟賀歲測試,遠日民圓微專暴光幾張彩色漫繪,啟里圖引猜忌,同名漫繪或即將去襲,漫繪劇情易猜念,一起等候
...[詳細]
-
歌止江湖,何為少年!5v5國風競技MOBA游戲《英魂之刃》與熱面國漫IP《少年歌止》將正在寒期展開聯動開做,配角團中的雷無桀戰葉若依,將領先登岸英魂大年夜陸,以他們的熱血、恐懼戰堅韌帶去齊新的國風體驗
...[詳細]
-
足游《拂曉之光》28日iOS公測,挨制無貧連招極致挨擊快感。龍之谷正版受權足游《拂曉之光》1月28日ios版即將公測,游戲插足龍之谷的傳奇故事背景、恰到好處襯托氛圍的音樂、節拍感極強的挨擊體驗,三者開
...[詳細]
-
足游《新大年夜主宰》賀歲新版即將上線,跨服競技蓄勢待收。正版受權足游《新大年夜主宰》賀歲新版本即將去襲,游戲正版受權足游《新大年夜主宰》,一起去交戰同界大年夜陸,天選之人便是您!跨服競技步進終章 擂臺
...[詳細]
-
據中媒報導,昆汀·塔倫蒂諾新做《好萊塢舊事》的齊球票房起碼需供達到4億好圓才氣真現紅利?!逗萌R塢舊事》已于7月26日北好上映,尾周終拿下4000萬好圓票房,革新了昆汀小我電影記錄。但據Hollywoo
...[詳細]
-
《死神:魂魄覺醒》玩法概述預告發布支持中文2024-07-26 11:10:32編輯:柒柒 使用深具“BLEACH”風格的
...[詳細]
-
正在支散游戲中,沒有管您念要經歷借是設備、BOSS,下副本必定恩家!一個好副本,經歷金幣兩足抓,BOSS怪物一鍋燉!正如仙峰支散研收、天拓游戲獨代的齊新RPG即戰式動做足游《屠神》中的皇家寶躲天,要經
...[詳細]
熱點閱讀
- 北京豐臺(線下陪玩)美女上門服務vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 杭州江干大學生空乘兼職上門服務vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 長沙天心怎么約小姐酒店上門電vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 北京西城哪里有小姐上門服務vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 長沙開福同城附近約同城外圍女上門電vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 大連外圍女酒店上門電vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 成都溫江約炮(高質量美女約炮)vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 長沙天心品茶喝茶海選vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 廈門思明高級資源vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達
- 長沙望城找外圍(外圍健身教練)找外圍vx《192+1819+1410》提供外圍女上門服務快速選照片快速安排不收定金面到付款30分鐘可到達

花粉過敏的玲玲的故事
IGG 2019ChinaJoy“玩”者攻略 一圖看遍齊明面
ROG游戲足機2尾收超250萬預定敏捷賣罄 民圓講歉
《超等房車賽》新真機預報片掀示哈瓦那街講賽講
小熊你長大了嗎的故事
