设为首页 | 加入收藏 | 日文版
公告:  
 文章正文

说话人识别系统

2009-03-31 点击数:1559

一、项目介绍

电话身份认证系统集成了基于声纹的身份认证技术和语音识别技术,通过一个电话语音对话系统与用户交流,在人机语音对答的过程中在后台进行用户的身份认证。一个电话身份认证系统的硬件结构框图如图一所示。在进行身份认证的过程中用来进行判定的信息有两种:一种是用户的声纹特征,即每个人的声音与其他人的不同之处,另一种是用户的资料信息,即系统可能会提问一些用户注册过的个人资料,进一步确保登录者确是声称的用户。

电话身份认证技术有着许多独到的优势:,通过固定电话或是移动电话,用户可以登录访问远程数据库得到自己感兴趣的讯息,不再受时间和空间的限制;第二,电话身分认证技术在用户端只要利用用户电话而不需要额外添加任何硬件设备,降低了推广成本;第三,声纹认证是一种非常方便自然的认证技术,它的登录过程采用语音界面使得用户与系统的交流非常自然流畅易学易用;第四,电话身份认证通过人机对话进行认证,其过程对用户来说是透明的,从而在一定程度上抑制了恶意攻击和伪装登录。总之,近年来语音技术的高速发展使得声纹认证技术日趋成熟,由于语音这一媒介自身特殊的优势,通过声纹进行身份认证的技术正在迅速走向实用化,凸现出巨大的市场潜力。其系统组成:

特征提取--根据人的发音和听觉原理,提取语音信号中说话人独特的性质,并将其数字量化表示。采用有MFCC特征;在特征域中做PCA变换(特征选择)。当说话人说不同的话时,分布的状态会有所不同。

训练模块--模型建立采用的是高斯混合模型(GMM)。GMM通过对多个时间段的音频特征谱构造高斯模型,并用期望最大(EM)算法优化,寻找最优分布组合,以更确切地表征说话人的个人特征。

识别模块--语音中说话人信息在短时内较为平稳,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。根据这个原理,把预处理和特征提取模块提取声纹特征谱向量,带入到模型库中进行匹配和概率打分,将模型概率匹配打分带入到判别准则中进行打分归一化,概率打分较大时即可进行身份确认和检验。

二、合作方式

面议。