语音合成技术的发展历程与理论研究

来源 :电脑迷 | 被引量 : 0次 | 上传用户:shajia0902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 近年来,语音合成技术中的波形拼接算法被广泛地运用在各个国家的技术前沿。大多数的实验研究结果表明波形拼接算法具有可靠的实用性,所以在市场中已经具有许多语音合成产品,这些产品对人们的日常生活和工作的各个方面有很大的影响。
  关键词 语音合成 发音 自然度 时域波形 语音库
  中图分类号:TN912 文献标识码:A
  1语音合成技术的发展历程
  随着语音合成的要求越来越高,语音学家对语音合成的研究技术不断更新。早期研究利用合成语音的参数方法,以提高它的LSP,LPC和其他言语参数。这些都反映在越来越多和越来越严格的语音合成系统应用,现在不仅对语音合成有连贯性的要求,而且还有更高的需求。
  上世纪60年代TTS英文版系统被成功研制。在80年代,我国也开始研究中文TTS。中国科技大学,社会科学院,中国科学院,清华大学等所有单位都在TTS的研究领域中不懈努力奋斗。不仅如此,在中国台湾的著名大学,如台湾大学和台湾交通大学也开始在语音系统领域中研究。甚至一些研究成果已成为产品在现实中使用。同时,在世界主要国家也已经开发相应的产品。
  上世纪80年代后期和,科学家就开始对修改语音合成技术的时域波形进行研究,即PSOLA(基音同步叠加)技术。其主要特点是:在衔接语音波形段,首先按照上下文,根据拼接单元与PSOLA算法调整的韵律特征,合成波形不仅保持主音发音段的功能,并能与环境做出韵律特征的拼接单元,从而获得可懂度和自然度很高的合成语音。PSOLA技术有了很大的发展和广泛的应用。为了提高合成语音的质量,人们开发了语音波形拼接技术,该技术主要用于一些语音信号的参数如音高,而不是语音参数波形。这项技术能合成出更加自然的语音。
  在上世纪90年代,比LPC语音合成技术和共振峰技术更优越的技术已经诞生,利用该项技术合成的中文与英文显得更加自然,并已经被广泛应用于商业领域。近年来,人们在研究通过数据库建立的语音合成算法。只要应用数据库就可以进行基本的语音单元合成,可以更方便的进行语音信号的拼接合成。对于确定合成语音质量,语音库中起着非常重要的作用。多种感情的语音单元是各种情况下语音数据库的唯一入口,从而合成了一种任意语句。因此,语音数据库的容量必须足够大。这种合成语音的自然度将有较大的升级。
  现在,随着语言学的不断发展,语音合成技术已经从最初对语音内容清晰度和连贯性的要求,逐渐演变成对语音的自然特性的高度追求。如何将合成后的语音显得自然是科学家们越来越关注的话题,但现在的语音技术仍不能满足人们的需求,因此,目前众多产品制造商正在对语音合成自然度不断创新。所以。语音合成在未来具有更大的商业市场和机会。世界各个主要国家都对语音合成技术做了集中的大量研究,技术已经达到了一个较高的水平,虽然我国现在语音合成技术较为弱后,但在不久的将来,随着国家对语音技术的重视程度将会不断提高,人们对语音的自然度要求就会有更高的重视程度,中国将有越来越多的企业和部门从事语音合成技术的研究。我国将在语音合成方面将会和国外长期竞争,并会在这样一个良性的竞争中获得更加先进的技术。
  2语音合成技术的理论
  语音合成技术已越来越多地在现代社会中得以应用,大大提高了人民的生活质量。如电话号码查询,计算机应用,旅行的火车与飞机班次语音查询等。
  语音合成是利用语音处理技术来建立数字语音模型,模型首先通过激励信号,在人体器官中传递声音,随后发出声音。语音合成技术可以根据不同的规则分为不同的类型,如信道模型参数法,语音参数法和波形拼接法。波形拼接法是衔接语音信号和易懂的语音信号,从而合成信号强度和自然度高的语音信号。
  LPC技术是将时域中的信号在保证传输率的基础上,来完善时域波形的技术处理方法。LPC技术的优点和缺点非常清晰,它具备简洁和易于处理的算法,然而它仅仅是一个简单的解码语音信号,只能实现一定程度上的语音连接。同时,波形拼接技术的最大特征是利用一些语音波形的数据来存储所有相关的语音信息,所以对语音自然度的提升将起到很大的作用。但要合成单音节或充满感情的语句有在有些情况时是很难妥善处理的,如果单独的音节或词在充满感情的语句中进行处理,显然其综合素质将受到一定的影响。
  上个世纪末,科学家们提出了一个语音波形拼接的有效方法,即基音同步叠加技术(PSOLA),可以解决上述问题,给语音处理技术带来了一股新鲜血液。该技术主要是对语音信号的持续时间,强度,频率,时间等参数进行控制。而这些语音信号参数的改善对语音信号处理非常重要。所以LPC技术与PSOLA技术在控制韵律词的修饰方面有更多的优点,通过该项技术合成的语音在自然度等各方面比其他合成方法都更要出色。
  参考文献
  [1] 陈静,李薇,崔忠伟,刘霞.?语音合成技术的研究及其发展[J].中国科技信息.2007(14).
  [2] 党建成,周晶.?语音合成技术及其应用[J].计算机与信息技术.2007(06).
其他文献
摘 要 随着我国经济的快速发展,对教育的形式在不断的进行革新,现代化的教育与互联网技术进行有机的结合,从而使得现代教学更加的便捷和生动。互联网技术成为现代教学的一大帮手,改变了传统的教师“说教”的模式,从而增强了课堂的视听效果。文章主要从互联网技术对现代教育的影响以及应用两个方面进行了阐述,结合现代教育的实际发展情况,从而不断的提升教育的主动性和技术性。  关键词 互联网 现代教育 应用  中图分
摘 要 随着世界信息技术和国内市场经济的不断发展,计算机网络技术在人们的平时生活中得到了全面的普及和应用,但是21世纪新信息技术的发展步伐依然在不断加快,原来的计算机网络信息安全体系已经不能完全适应市场的需求,本文简单阐述了计算机安全防范技术,通过建模对其展开研究和分析,希望为我国计算机信息安全事业的发展提供一些借鉴性的参考。  关键词 计算机系统 安全技术 建模分析  中图分类号:TP393 文
石油天然气在国内广泛应用,石油天然气在人民生活和国家经济发展中起着越来越重要的作用.但在运输过程中,由于油气管道输运的都是易燃、易爆、易挥发和易与静电聚集的流体,极
摘 要 发现网络新词在中文信息处理方面具有非常重要的作用和意义。本文提出了一种基于质子串分解的网络新词抽取方法。首先,从网络上下载语料;然后,使用分解得到质串;并 在其基础上,进一步使用改进的检验方法结合质子串分解方法抽取具有复杂结构的合串并比较验证新词;实验结果显示,该算法有效地提高了网络新词抽取的精确度。  关键词 网络新词 质子串分解 互信息 F-MI  中图分类号:TP391.1 文献标识
用毛细管区带电泳(CZE)对酪蛋白磷酸肽(CPP)进行了分离和测定。研究出的适宜电泳操作条件为:工作电压30KV、柱温25℃、毛细管长度50cm、内径70μm、进样量5sec(气压进样)、紫
目的 观察单侧输尿管梗阻(UUO)大鼠模型中金属蛋白酶组织抑制剂1(TIMP-1)在肾小管间质中的表达部位、动态变化及其与肾小管问质损害的关系。方法 制备UUO大鼠模型,采用免疫组
摘 要 随着计算机在人们生活中的普及,使得计算机的各项技术已经与人们的生活工作息息相关,而且计算机的发展在一定程度上代表了世界经济发展的脚步,到目前为止,计算机技术的快速发展,使计算机的图形技术和图像技术在日常生活和工业生产中得到了很好的运用,该技术的发明为人们的生产生活带来了很多的便利,而且通过图形图像技术的进一步发展应用,为人们带来的生活福音将会越来越多。  关键词 计算机技术 计算机图形 图
期刊
多核处理器当前风头正劲.在整个业界,到处是多核处理器的新闻.最新的半导体工艺已经为芯片设计者提供了足够数量的晶体管,足以制造出实用化的多核处理器,各种设计的数量激增,
摘 要 中国在80年代末开始对神经网络研究,主要开展了一些基础性的应用工作领域。人工神经网络的可塑性,自适应性和自组织性使得其具有很强的自学习能力与并行处理能力,保证了其能够快速处理问题。为了满足实时分布式存储的需求,它具有更好的鲁棒性和容错性。因此,人工神经网络已被广泛应用于模式识别,系统识别,图像处理,自动控制等领域。  关键词 神经网络 控制系统 控制科学 模型 机器人  中图分类号:TP1