论文部分内容阅读
自然语言是人们日常使用的语言,是人类知识的载体,也是人类交流的重要工具。而人类要想与日益普遍使用的计算机更好地交流,通过自然语言显然是一种重要方式。随着Internet的迅速推广,汉语在Web上的生成也面临更新的要求:跨平台、功能强、快速、准确等等。另外,最好还要拥有与其他自然语言生成系统兼容的生成机制,并具有一定的可移植性。基于XML的可移植汉语生成技术就是为这个目的开发的。本文针对XML的特点并结合汉语生成的研究现状,在总结国外相关工作的前提下,提出了基于XML的汉语生成方法,并着重研究复杂单句的生成。该方法以XML树传递内部信息,使用XSL构造汉语句子生成格并实现XML树之间的转换。同时在生成过程中利用语义分析的结果,使得生成复杂句子的能力和生成句子的质量更高。本文最后提出了一个基于XML的汉语生成模型。此模型具有一定可移植性,依托不同领域的知识库仅要对其作少量修改便能在该领域工作。