据第二次全国残疾人抽样调查数据,我国听障人士约2780万。中国聋协主席杨洋表示,80%以上听障人士可使用口语沟通。为解决听障人士沟通困难的问题,中国聋协打造了无障碍工作平台,通过引入语音转文字、实时字幕等数字技术,让听障人士更好的参与社会交往和自我提升。
智能语音,即智能语音技术,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。智能语音技术的研究是以语音识别技术为开端,可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。
语音识别是将语音转换为文本的技术。语音识别主要步骤为:语音搜集、降噪、特征提取、语音大数据训练、数据解码、文本转换。目前语音识别的技术已普遍较为成熟,准确率可达95%,未来准确度的进一步提升将会使人们从偶尔使用语音识别技术到普遍通用。
自1956年“人工智能”提出至今,该行业已经取得了跨越式的发展,尤其是随着近几年智能化技术的普及,再智能化操作系统实现用户界面交互后,智能语音的交互也被广泛引入,并成为智能化行业更为前端的领域之一。事实证明语音就是最自然的信息交流方式,未来其对话的本能也将随着人工智能的进一步蔓延而成为人机交互最主要的沟通方式。而且相对于其他交互方式而言,语音交互更具有便捷性,可以大大节省人机互动的时间。在现实生活中,当我们专注于界面交互体验时,往往无法在同一时间做其他的事情,但实际上,我们往往并不在同一时间只专注于同一件事情的。那么,语音交互的应用就能够帮助用户实现在同一时间内处理多项任务。
在用户人群方面,语音交互的适用范围更广,向老龄人群、低龄人群、身体残障人群渗透扩散的优势非常明显。例如老年人视力下降、手指也不够灵活,低龄儿童还不能掌握手写等能力也不适合长时间看电子屏幕等等。可以说,语音识别将使人机交互能够以人类最熟悉的方式进行,其优势以及价值一旦发挥出来,那么天然的交互入口起到导流作用,将对更多垂直应用服务市场产生巨大的影响。未来的语音交互一定会过渡到多个中心,最终变成去中心化,即不仅一个设备而是所有的设备都具备语音交互能力,并凌驾于搜索引擎、浏览器等其他应用入口之上,形成一个以语音交互技术为核心的全新应用生态链。