VocalZoom与科大讯飞携手打造中国最普及的语音识别系统在噪音环境方面取得突破性进展

新闻头条:

  • 早期测试显示:VocalZoom的光学传感器能将科大讯飞的声控平台的自动语音识别(ASR)性能平均显著提高50%以上。
  • 最明显的性能增强体现在最高噪音级别环境中,例如:将车窗保持打开状态时驾驶汽车所产生的噪音。
  • 很多公司正在探索将VocalZoom的传感器技术与科大讯飞的“语音云”结合起来,而“语音云”是中国领先的移动云和嵌入式应用程序的智能语音平台。

于以色列Yokneam Illit、和中国安徽合肥--()--(美国商业资讯)--作为人机交流(HMC)光学传感器的主要供应商--VocalZoom,其产品可以带来一种更自然、更个性化的、安全的声控体验。今天该公司宣布,它已经与科大讯飞签署了一项协议,将VocalZoom的人机交流(HMC)光学传感器与科大讯飞的“语音云”智能语音技术平台相结合,并进行性能测试;该平台是在中国应用最为广泛的解决方案,拥有数以百万计的用户。初步结果表明,通过向用户耳机和汽车信息娱乐解决方案中加入VocalZoom传感器,科大讯飞的自动语音识别(ASR)功能可以平均得到50%的改善,尤其在嘈杂的噪音环境中得到更多的改善。

科大讯飞高级研究员王海坤(Haikun Wang)表示“根据全球主要基准测试的标准,科大讯飞已经成为最好的声控解决方案,但是当前面临的最大挑战就是在噪音环境中的性能表现。我们相信VocalZoom的技术可以为我们在性能改善方面取得突破性进步奠定基础。” 他续指 “我们已经在多个场景中测试了VocalZoom传感器,其中包括将车窗保持打开状态以及狂风噪声的环境下,在驾驶的汽车内部所产生噪音的场景,而相应的性能改善是相当可观的。”

使用虚拟助理和汽车语音控制的人机交互的关键是这台机器是否可以完成人们指定的任务,并且足够快速、准确地满足用户需求。即使是最新的降噪法,如今的声学麦克风在这种控制水平下仍旧不能达到足够的声音隔离效果,特别是在嘈杂的环境中。VocalZoom多功能人机交流(HMC)传感器通过收集人在谈话时的其他数据来解决这个问题,例如人在说话时嘴巴、嘴唇、脸颊和喉咙附近的面部皮肤的震动等数据。通过将VocalZoom光学人机交流(HMC)传感器集成到声控解决方案中,并令它着重针对这些领域,可以捕足、测量面部震动的数据,并将其转换为一个独立的、近乎完美的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。

“能够与科大讯飞合作,显著提高最为广泛使用的自动语音识别(ASR)平台的性能,我们感到非常兴奋,” VocalZoom销售和业务发展副总裁Rammy Bahalul如是说。“随着我们不断探索将两种技术融合到语音控制和身份验证的革命性解决方案中,VocalZoom 和科大讯飞打算在本月完成联合测试。我们通过使用更小、更时尚的耳机以及在各种各样的应用程序中的其他解决方案来共享更好的声控体验。”

VocalZoom和科大讯飞已经测试了一个解决方案的性能,即在多个不同噪音级别的场景中以及结合音乐、汽车噪音和其他干扰因素的移动汽车内部,对两家公司的技术相结合的解决方案进行了测试。自动语音识别(ASR)性能已经被提高至一个几乎完美的级别,而之前在同样的高强度噪声环境中,理想的声控性能几乎是不可能的。

关于VocalZoom

VocalZoom提供的人机交流(HMC)传感器可以在如今日益频繁的移动互联世界中为客户提供自然的、个性化的、安全的语音控制的用户体验。该传感器可以在任何环境中提供准确和可靠的语音控制和生物识别身份验证功能,无论噪音程度大小。应用程序包括移动安全支付、耳机、手机、访问控制、智能家居解决方案、以及汽车免提声音控制等。欲了解更多信息,请访问www.Vocalzoom.com或在领英LinkedIn关注VocalZoom。

关于科大讯飞

科大讯飞是一家国家级高新技术企业,成立于1999年。其致力于研究和开发智能语音和语言技术、人工智能、硬件和软件应用程序等领域,为政府、教育部门、金融机构和其他领域提供专业服务。科大讯飞于2008年在深圳证券交易所上市(股票代码:002230)。科大讯飞的智能语音和人工智能技术代表了世界顶尖水平,如语音合成、语音识别、语音评估以及自然语言处理。科大讯飞已经占据了中国语音产业70%以上的市场份额。同时,科大讯飞为整个行业中的2,000多家公司提供语音核心技术,推出了世界上第一个“科大讯飞语音云”平台,为移动互联网行业提供智能语音交互功能(目前拥有超过80,000个项目合作伙伴,终端用户超过7亿)。促进了智能语音和人工智能技术在教育、移动电话、汽车、家电等行业中的应用,为数以百万计的家庭提供了相关服务。欲了解更多信息,请访问http://ifytek.com/en/index.htmlhttp://ifytek.com/en/index.html

Contacts

VocalZoom公关小组
Kelly Poffenberger
714-553-9071
kellyp@magnetprgroup.com

科大讯飞
Zhumei Wang
+ 86-551-65339092
zmwang4@iflytek.com

Contacts

VocalZoom公关小组
Kelly Poffenberger
714-553-9071
kellyp@magnetprgroup.com

科大讯飞
Zhumei Wang
+ 86-551-65339092
zmwang4@iflytek.com