UMS中的TTS/ASR技术研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lygwzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以作者参与“中鸿讯统一消息服务系统(ZHX-UMS)”设计与开发工作为背景,在讨论有关UMS的体系结构、关键技术和实现方法等方面问题的基础上,重点讨论了文本-语音转换技术(TTS)和自动语音识别技术(ASR)的现状及其在UMS系统中的应用与开发。 本文反映的工作可以概括为两大部分:ZHX-UMS系统的总体规划设计和与TTS/ASR相关技术的研究与开发。在总体规划设计中,本论文首先从消息服务系统的发展历程出发,分析了从分离的消息服务系统向统一消息服务系统进化的必然性以及后者在技术上的优势,探讨了UMS的应用前景,从而论证了ZHX-UMS项目开发的合理性和使用价值。在分析、总结了国外UMS在体系结构特点的基础上,本项目组提出了ZHX-UMS的3层体系结构,本文也较为详细的讨论了这一结构,作为对相关系统研究与开发的基础。 作者在论文中反映的工作重点是对与TTS/ASR相关技术的研究,并以此为基础实现了相关子系统,与其他同学一道共同完成了ZHX-UMS样机系统的开发工作。论文从UMS所涉及的各种语音技术出发,引出了本文讨论的重点——TTS/ASR技术;分析了TTS/ASR技术的基本结构、基本要素、性能评价指标,以及该技术所使用到的语法规则;针对ZHX-UMS对TTS/ASR技术应用需求以及在设计中必须考虑的关键问题,结合开发实践提出了自己的看法与体会。 本文第4章重点讨论了ZHX-UMS中与TTS/ASR相关模块开发问题,较详细地介绍了模块功能的实现;第5章进一步讨论如何以面向对象的方法为基础对模块进行封装(封装成ActiveX控件),以解决模块间通信的问题和与其他子系统间的信息交换问题。 ZHU-UMS的开发环境为Windows NT,与TTS/ASR有关的开发,借用了微软公司的语音开发包Microsoft Speech SDK。 尽管目前的ZHX-UMS还只是一个试验样机系统,由于时间关系也尚未对系统进行严格的功能和性能测试,系统本身还有待改进和优化,但该项工作已经为后期的开发和产品化,取得了有益的经验,奠定了良好的基础。
其他文献
数据库加密是保证数据存储安全的行之有效的重要手段,其效率高低决定了它是否具有广泛的应用范围.基于对提高密文数据库密文查询效率的各种方法的研究,特点是针对密文索引技
网格系统是一种可以将地理区域不同,系统架构各异的各种资源通过高速互连网络连接起来在一定范围内实现协同计算和资源共享的环境。而网格任务调度则是网格系统中最核心的部分
随着计算机技术的不断进步,特别Internet技术的迅速普及,使得基于WEB的数据库应用已经广泛深入到包括网上办公、网上购物、电子商务等各行各业中,WEB数据库应用的开发技术也随之
该文主要研究了基于统计的主动形状模型和主动外观模型的特征提取方法.主动形状模型来源于一组标有特征点图像的训练样本.在特征提取时,首先给出特征的一个初始估计,通过搜索
蓝牙技术是一种低成本、低功耗、短距离的无线连接技术.蓝牙技术基于无线电缆的概念,实现了设备间的无线连接和接入数据网的功能,可以组成一个特定的个人域网络.基带协议是蓝
为了适应不断出现的实时业务和流式多媒体应用等的要求,IETF提出了保持目前Internet统计利用的特性、同时用灵活的机制实现应用QoS要求的区分服务模型.将多协议标记交换(MPLS)
一种新的基于分布式代理的网络入侵检测系统DA-NIDS参照了CIDF(通用入侵检测框架)入侵检测模型,将入侵检测系统中的功能部件划分为相对独立的组件,组件之间采用统一的方式进
该文对数据仓库和OLAP的理论技术做了深入的研究,运用新兴的数据库技术和数据分析方法,探索开发智能化信息分析和决策支持工具的解决方案,主要研究内容如下:◆总结了数据仓库
灰箱演算是一种用于描述移动系统及其交互的形式化方法.该文以灰箱演算的一个变体--鲁棒灰箱演算(ROAM)作为研究对象,从操作语义、类型系统、进程等价性和表达能力等方面对其进
近些年来,随着电子电路的高速化和大规模集成化,布尔代数作为描述数字电路的逻辑行为的工具,越来越显示其不足.布尔过程论就是在这种情况下产生的,这一概念是在1994年由中科院计算