论文部分内容阅读
传统基于知识的词义消歧方法对所有词性的多义词均采用统一窗口大小作为消歧上下文,没有考虑固定窗口中影响消歧的噪音问题,消歧效果不佳,为此提出一种上下文边界可变的中文词义消歧模型。通过分词性的调整消歧上下文边界,尽可能保证选取的上下文中各词语和多义词存在语义联系,达到消减噪音目的。通过构建多义词义项搭配库,进一步细化词语间语义相关度计算。实验结果表明,使用该方法比SemEval-2007最好成绩高出8.6个百分点。