於以色列Yokneam Illit和中國安徽合肥--(BUSINESS WIRE)--(美國商業資訊)-- 作為人機交流(HMC)光學傳感器的主要供應商—VocalZoom,其產品可以帶來一種更自然、更個性化的、安全的聲控體驗。今天該公司宣布,它已經與科大訊飛簽署了一項協議,將VocalZoom的人機交流(HMC)光學傳感器與科大訊飛的「語音雲」智能語音技術平台相結合、並進行性能測試;該平台是在中國應用最為廣泛的解決方案,擁有數以百萬計的用戶。初步結果顯示,通過向用戶耳機和汽車信息娛樂解決方案中加入VocalZoom傳感器,科大訊飛的自動語音識別(ASR)功能可以平均得到50%的改善,尤其在嘈雜的噪音環境中得到更多的改善。
科大訊飛高級研究員王海坤(Haikun Wang)表示,「根據全球主要基准測試的標准,科大訊飛已能提供最好的聲控解決方案,惟當前面臨的最大挑戰是在噪音環境中的性能表現。我們相信VocalZoom的技術可以為我們提供穩定的基礎,有助研究取得突破。」他續指,「我們已經在多個場景中測試了VocalZoom傳感器,其中包括在駕駛時,將車窗保持打開狀態的噪音環境下,以及在狂風噪聲的環境下,技術的性能改善相當顯著。」
使用虛擬助理和汽車語音控制的人機交互的關鍵是這台機器是否可以完成人們指定的任務,並且足夠快速、准確地滿足用戶需求。即使是最新的降噪法,如今的聲學麥克風在這種控制水平下仍舊不能達到足夠的聲音隔離效果,特別是在嘈雜的環境中。VocalZoom多功能人機交流(HMC)傳感器通過收集人在談話時的其他數據來解決這個問題,例如人在說話時嘴巴、嘴唇、臉頰和喉嚨附近的面部皮膚的震動等數據。通過將VocalZoom光學人機交流(HMC)傳感器集成到聲控解決方案中,並令它著重針對這些領域,可以捕足、測量面部震動數據,並將其轉換為一個獨立的、近乎完美的參考信號。系統可以通過這個信號進行運作,而不受噪音水平的影響。
「能夠與科大訊飛合作,顯著提高最為廣泛使用的自動語音識別(ASR)平台的性能,我們感到非常興奮。」 VocalZoom銷售和業務發展副總裁Rammy Bahalul如是說。「隨著我們不斷探索將兩種技術融合到語音控制和身份驗証的革命性解決方案中,VocalZoom 和科大訊飛打算在本月完成聯合測試。我們通過使用更小、更時尚的耳機以及在各種各樣的應用程序中的其他解決方案來共享更好的聲控體驗。」
VocalZoom和科大訊飛已經測試了一個解決方案的性能,即在多個不同噪音級別的場景中以及結合音樂、汽車噪音和其他干擾因素的移動汽車內部,對兩家公司的技術相結合的解決方案進行了測試。自動語音識別(ASR)性能已經被提高至一個幾乎完美的級別,而之前在同樣的高強度噪聲環境中,理想的聲控性能幾乎是不可能的。
關於VocalZoom
VocalZoom提供的人機交流(HMC)傳感器可以在如今日益頻繁的移動互聯世界中為客戶提供自然的、個性化的、安全的語音控制的用戶體驗。該傳感器可以在任何環境中提供准確和可靠的語音控制和生物識別身份驗証功能、無論噪音程度大小。應用程序包括移動安全支付、耳機、手機、訪問控制、智能家居解決方案、以及汽車免提聲音控制等。欲了解更多資訊,請瀏覽www.Vocalzoom.com或可上LinkedIn參閱更多詳情。
關於科大訊飛
科大訊飛是一家國家級高新技術企業,成立於1999年。其致力於研究和開發智能語音和語言技術、人工智能、硬件和軟件應用程序等領域,為政府、教育部門、金融機構和其他領域提供專業服務。科大訊飛於2008年在深圳証券交易所上市 (股票代碼:002230)。科大訊飛的智能語音和人工智能技術代表了世界頂尖水平,如語音合成、語音識別、語音評估以及自然語言處理。科大訊飛已經佔據了中國語音產業70%以上的市場份額。同時,科大訊飛為整個行業中的2,000多家公司提供語音核心技術,推出了全球第一個「科大訊飛語音雲」平台,為移動互聯網行業提供智能語音交互功能 (目前擁有超過80,000個項目合作伙伴,終端用戶超過7億)。促進了智能語音和人工智能技術在教育、移動電話、汽車、家電等行業中的應用,為數以百萬計的家庭提供了相關服務。欲了解詳情,請瀏覽http://ifytek.com/en/index.html。