基于本体的电话内容文本分类研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:wj3852
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网的迅速发展,促使其访问方式的多元化发展。人们已经不再满足于仅仅通过计算机浏览器浏览因特网,越来越多的人希望可以使用电话,手机等通讯设备浏览网页。相对于表达能力有限的图像和文字,人们更倾向于使用自然语言交流。因此友好的语音交互越来越受到人们的青睐。VoiceXML建立在XML规范基础之上,是一种语音数据交换标准。给用户提供了通过语音工具访问网络资源的平台。VoiceXML作为一种语音数据的交换标准,它能够与数据库,以及其他建立在XML标准之上的其他数据文档进行无缝数据交换,从而把因特网和电话网紧密的结合起来。VoiceXML语音网关把用户文档提交给服务器,随着用户提交的信息量的增长,服务器在处理这些海量文档时,面临巨大压力,迫切的需要对信息进行自动分类,再对每个类别的文档分别处理。以往仅通过关键字本身对信息进行检索和分类,准确率和效率不是很理想,因为计算机不能理解关键字所蕴含的语义信息。为了能够更好地获得语义信息,在此引入本体的概念。可以借助本体来描述和分析关键字的语义。通过本体建模可以表达更深层次的语义信息。传统检索算法所采用的只是基于语法层面上字、词的简单匹配,而缺乏对知识的表示、处理和理解等能力。解决这些问题的关键在于把信息检索从基于关键字的语法匹配提升至基于知识(或上下文)层面的语义匹配。本体是一种知识表示工具,在实际应用中可能需要根据规则进行逻辑推理。本体的推理是指把隐含在显示定义和声明中的知识提取出来。本体是对共享概念模型的规范说明,是对知识的一种描述,如果要把本体应用在语义分析上就必须使用规则,在规则上进行推理。谓词逻辑是知识推理的重要表现手段。可以在本体表示知识库的基础上构建规则库,用来分析文本的语义信息。文中使用OWL语言来描述领域知识,使用规则系统来表示推理规则。目前编辑和开发本体的工具很多,本文采用了美国斯坦福大学的Protégé3.2.1作为构建本体的平台。在这个平台上我们模拟构建了一个学校后勤管理的部分本体。并在该本体的基础上构建规则集合,用来对文本信息进行推理。为了解决文本自动分类的问题,本文提出了基于本体的电话内容的分类。本体是一种能在语义和知识层次上描述知识模型的建模工具,被人们应用到文本分类中,提高了分类的精度和速度。
其他文献
粮食干燥过程是一个复杂、时变、非线性、大滞后的工业过程,使粮食干燥过程自动控制的实现难度加大,因此,粮食干燥过程控制技术,控制模型的建立、实现及应用等成为研究的热点
学位
近年来,随着人脸识别技术应用在商业领域的范围不断扩大,人脸识别相关技术的发展得到了空前的重视,逐渐成为图像识别和理解领域的研究热点。人脸识别技术是模式识别、计算机
近年来,随着物流行业的高速发展,RFID(Radio Frequency Identification,射频识别)技术在移动应用领域的发展需求对传统RFID应用的适应性、灵活性及高可靠性提出了挑战。借鉴R
安检图像是一种典型的X射线图像,由于X射线的成像原理以及行李箱包的复杂性,安检图像存在内容丰富,边缘复杂,容易受到噪声干扰等特点,给工作人员识别危险物品带来困扰。安检
随着计算机技术、企业信息化的发展和新软件开发框架(面向服务框架,SOA)的标准不断完善,利用SOA框架开发新型的客户关系管理(CRM)系统已成为业界的关注热点。利用SOA架构下的
机会网络是一种异于传统网络的网络体系结构,它以“存储-携带-转发”的工作模式,利用节点移动带来的通信机会实现数据传输。然而,由于网络拓扑变化快,使得机会网络存在消息传
多Agent系统中的合作与协调问题是一个极具价值的重要研究课题。Agent在交互过程中可能存在多种混杂特性,然而以前的研究中很少系统地研究如何促进具有混杂特性的多Agent系统
随着云计算、移动互联网的快速发展以及穿戴式设备的兴起,企业服务器规模越来越大,客户端设备趋于微型化、个性化。大型分布式软件系统呈现出数据海量、节点众多、系统异构、
基于划分的分布式模型是一种利用了数据局部性以增强系统性能和可靠性的分布式架构。利用这种架构开发出来的系统已经在实践中证明了它所具有的对于一般分布式架构的优势。在