基于词汇化模型的汉语句法分析

来源 :电子与信息学报 | 被引量 : 110次 | 上传用户:huangmajun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以处理大规模真实文本为目标,把句法分析分解为分词/词性标注、短语识别两个部分。首先提出了一个一体化的分词/词性标注方法,该方法在隐马尔科夫模型(HMM)的基础上引入词汇信息,既保留了HMM简单快速的特点,又有效提高了标注精度;然后应用中心驱动模型进行短语识别,这是一个词汇化的英文句法分析模型,该文将其同分词/词性标注模型结合进行汉语句法分析。在公共的测试集上对句法分析器的性能进行了评价,精确率和召回率分别为77.57%和74.96%,这一结果要明显好于目前唯一可比的工作。
其他文献
把元杂剧《冤报冤赵氏孤儿》重新搬上越剧舞台,是需要一点勇气的,还要冒失败的风险.自1955年伏尔泰将它改编成《中国孤儿》,在巴黎剧院连演190场以来,它已成为名震中外的戏曲
完全性房间阻滞伴左房逆传常见于心脏瓣膜病、心肌炎、冠心病等。本例心房颤动第一次射频消融术后恢复为窦性心律时仅呈一度房室阻滞(AVB),—年半后房颤复发再行射频消融术,术