核心技术

声纹识别技术 自动语音识别技术 自然语言理解技术

声纹识别技术

声纹识别技术是通过提取人的声音所蕴含的个性特征识别说话人的身份,与指纹识别、人脸识别、虹膜识别、指静脉识别等,归属生物特征识别技术。

声纹属于行为特征,在语音交互过程中被动态识别,相较指纹、虹膜等静态生物特征,具有成本低廉、低隐私性、无需记忆、迅速快捷、安全可靠、可检测真实意图和可远程识别等优势,有效降低了静态生物特征一次采样可永久仿冒的风险。

声纹识别通常包含如下模块:

(1)从待识别的语音中提取声纹特征;

(2)将待测语音中提取的声纹特征与预先训练出来的某个或某些声纹模型进行匹配或比对,来判断话者的身份。

声纹识别技术(VPR)的应用范围很广泛,声纹识别技术可广泛地应用于公共安全、国防安全、防恐反恐、出入境控制、金融交易、电子商务以及个性化服务等领域。



自动语音识别技术

自动语音识别(Automatic Speech Recognition 简称"ASR")技术的目标是让计算机能够“听写”出不同人所说出的连续语音,也就是俗称的“语音听写机”,是实现“声音”到“文字”转换的技术。非特定人、大词汇、连续语音的ASR技术包括声学模型和语言模型两个模块。声学模型用以从声音信号中识别出“音”,而语言模型用以把音转换成“字”。

自动语音识别通常有以下几种分类:

(1) 特定人和非特定人;

(2) 小词汇量、中词汇量和大词汇量;

(3) 孤立词、连续方式命令和连续语音



自然语言理解技术

在自动语音识别技术让计算机能“听写”人类的语言时,自然语言理解(Natural Language Understanding 简称"NLU")技术则让计算机能够“理解”人类的语言。

自然语言理解技术可以在两个方面有比较显著的应用:

(1) 基于文本的对话。系统的输入和输出都是文本而不是语音。可以用在诸如Internet等上面进行智能查询、信息获取等。

(2) 基于语音的对话。系统的输入和输出都是自然语音。可以用在诸如电话、手机、无线通讯等没有键盘可以输入文本的地方,进行智能查询、信息获取等。



地址:北京市海淀区双清路77号院4号楼9层
邮编:100084
电话:+86-10-8289-3532
传真:+86-10-8289-6692

版权所有@北京得意音通技术有限责任公司 2002-2017. 京ICP备 05032314号 京公网安备