10.3969/j.issn.1674-2117.2021.21.028
带你了解语音识别技术
语音识别技术又称ASR技术(Automatic Speech Recognition),指机器自动将语音转成文字.语音识别技术属于人工智能方向的一个重要分支,涉及许多学科,如信号处理、计算机科学、语言学、声学、生理学、心理学等,是人机自然交互技术中的关键环节.
语音识别技术诞生半个多世纪以来,由于缺乏突破性进展,在技术上存在较大缺陷,一直处在实验室研究阶段,没有在实际应用中得到认可.2009年是一个转折点,深度学习和人工神经网络的兴起,使得语音识别技术在常见词汇场景下识别率超过了95%,这意味着语音识别技术具备了与人类相仿的语言识别能力.但不可否认的是,即使到现在,语音识别技术还是存在着很多不足,如对强噪声、超远场、强干扰、多语种、大词汇等场景下的语音识别还有很大的提升空间.
2021-11-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
75-79