论文部分内容阅读
机器翻译漏译错误有语用、语法层面的,也有词语层面的,后者占比较大。本文从机器翻译译后和机器翻译应用两个角度总结漏译的语言学应对策略。从词、短语和句子三个层级入手,采用本地语料库和机器翻译数据的语境交叉确认策略确定漏译的词语,采用词向量语境关联搭配策略降低机器翻译漏译数量。在两项实验中,与词语漏译评测强相关的BLEU值以及人工评测的结果都显示,在语言学干预语料库因素和词向量语境因素后,漏译比例大幅减少,相关词语错译和语序错误也同步减少。