论文部分内容阅读
电话是当前人们使用最为平常的通讯工具之一。Internet网的出现为人们提供了空前巨大的信息资源,如何用电话来使用Internet资源就显得非常重要。语音浏览器就能提供更易为人们所接受的网络浏览模式,从而拓展了Internet的发展空间。VoiceXML语言是XML语言在语音浏览器方面的应用。 本文首先介绍了语音合成技术、文语转换系统的组成及其实现过程,自动语音识别技术、自动语音识别系统的组成及其实现过程,语音应用程序开发语言——VoiceXML的发展情况、目标、VoiceXML引擎的工作过程、VoiceXML的基本元素,提出了开发语音用户界面的一些原则。 在此基础上,本研究设计了一个符合VoiceXML规格与技术的交互式语音浏览系统,我们以主从服务规划三层结构来设计:前端使用者、中端代理服务器与后端提供资源文件的网页数据库。前端使用者可利用电话网络来存取信息;而中端主要由一可将VoiceXML网页剖析并转为语音的代理服务器(Agent)构成;后端则为符合VoiceXML语法的网页数据库。 在本雏形系统中,我们在后端的网页数据库设计了三种应用网页,分别为:天气预报、图书订购、电影信息。此外,除了让使用者过电话按键输入控制信息外,我们还运用隐马可夫模型来开发语音识别模块来识别关键词,以方便使用者运用自然语音输入来使用本系统。 本研究利用代理者的结构,设计了一个交互式的语音浏览的原形系统,我们相信这样一个运用语音技术整合因特网与电话网络的系统,是一个有实用价值并且值得继续深入研究的系统。