【行业】智能语音赛道-风口已至,全面开花(74页)
智能语音是人工智能的重要入口,是人工智能三大核心基础技术之一。人工智能是计算机科学领域的最重要的前沿领域,其包含研究、开发用于模拟、延伸和扩展人的智能的理方法、技术及应用系统等,核心的三大基础技术是机器视觉、智能语音和机器学习。 其中智能语音占据重要地位,就市场份额而言,2019年智能语音占据我国人工智能22%的份额,仅次于已经实现大规模商用的机器视觉。
智能语音:即声音信息的人机交互。定义:智能语音即声音信息在人机间的交互。人类大脑皮层每天处理的信息中,声音信息占20%,是沟通最重要的纽带。人机语音交互流程:声音信号的前端处理、将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波。本质:智能语音/人机对话的本质是对声音特征和文本的分类模拟。人的听觉形成过程:1)外耳中耳将声能转变为机械能;2)内耳再转为生物电信号;3)听觉中枢加工、分析的结果。机器听觉模拟过程:1)麦克风列阵拾音器;2)语音识别;3)语义理解三个环节接力配合,实现声音信号、音频信号、电信号、特征向量、解码为文字理解的过程。
时间轴:经历三阶段发展,智能语音技术于近年步入落地期。1980s-2010为起步期:语音识别开始从孤立词识别系统向大量词汇连续语音识别系统发展;2011-2015为变革期:微软DNN(深度神经网络)的出现使识别错误率第一次大幅降低,降幅约90%,技术与产品开始大发展2016至今为落地期:机器语音识别准确率第一次达到人类水平,约95%,智能语音技术进入落地期,智能语音助手、智能音箱相继落地。


