离线中英混合语音识别准确率超98%!百度输入法带你体验“有网没网一样准”
【慧聪通信网】近日,AI实力强劲的百度输入法又向业内投下一颗“重磅炸弹”——业界首发“离线中英自由说”功能。这项基于中英文SMLTA模型的创新功能,让用户在弱网甚至无网络环境中,依然可以顺畅地进行中英文语音混输,且识别准确率和有网络时一样优秀,准确率超过98%。百度输入法在此前推出的“在线中英自由说”功能基础上,借助AI技术赋能对语音输入进行了又一次重大升级,大幅提升了用户交互效率,全感官输入2.0再迎重磅升级。
(百度输入法离线中英自由说功能)
据了解,百度输入法此次推出的“离线中英自由说”功能已经在V9.3.5版本中全新上线。除支持中英文夹杂的离线混合输入之外,还可精准识别离线状态下的英文整句、中文整句输入。例如用户不便打字正在用语音输入一段话,可一走进地铁,语音识别却跟不上。而百度输入法的离线中英自由说功能就能很好地解决这个问题,它支持用户在地铁、电梯、高铁或隧道这类弱网甚至断网的环境下,依然可以自如流畅地语音录入,且无需进行中英文手动切换。此外,“离线中英自由说”依旧支持流式识别,即语音输入可以跟随用户的话音逐字实时上屏,满足用户对语音识别实时性和流畅性的高需求,真正让用户实现了“随时随地随心说”。
一直以来,离线的语音输入就是行业一大难题,由于传统的离线中英文混合识别计算资源有限,需要限制模型的体积,因此极大限制了离线识别系统的性能。而百度输入法的离线中英文语音识别系统,针对性地采用中英文混合建模技术,提出基于低帧率、低比特的中英文SMLTA模型,其中采用神经网络语言模型替换传统的N元语言模型,大大减少了离线识别模型的体积。与此同时,基于SMLTA的离线中英文语音识别系统还是首个基于Attention的端到端离线语音识别模型的产品部署,大幅提升了离线中英文语音识别系统的性能。
在AI技术加持下,百度输入法的语音输入能力不断突破,在创新功能、用户使用频次、体验满意度等方面始终领跑行业。今年年初线上交流需求爆发,百度输入法便捷、高效、准确的语音输入功能便成为特殊时期人们的沟通首选,自1月25日春节假期以来,日均语音请求量破10亿次大关,并且“扛住”了高流量和用户高标准的双重“高压”,持续为用户提供不卡顿、不出错的语音输入服务。此后艾媒咨询发布的《2020中国第三方手机输入法市场疫期专题报告》也表明,百度输入法在行业内拿下用户日均语音输入次数、满意度等多个行业第一。百度输入法深谙用户对于多语种、多环境下语音输入的需求与痛点,不断降低着语音输入的使用门槛,自然也收获了用户和行业的广泛认可。
从“中文识别”到“中英自由说”,从“在线状态”到“离线环境”,百度输入法对AI技术的应用,不仅提升了手机输入法的智能化程度,也极大改善了人机交互效率。当语音输入日渐主流,用户习惯加速养成,对于手机输入法厂商而言既是机遇也是挑战,相信百度输入法还将加码AI技术的应用,驱动语音输入继续升级迭代,持续优化“全感官输入2.0时代”的AI输入体验。