词对齐相关论文
近年来,系统融合成为机器翻译领域的一个研究热点。系统融合研究如何充分利用各种不同机器翻译系统的优势来提高翻译的性能。目前......
长期以来,机器翻译系统都是以词为语言翻译的基本单位。人类自然语言中词的使用非常灵活,在机器翻译处理中有很大的歧义性,这是导致机......
在自然语言处理的诸多领域的研究中,双语语料库的重要作用逐渐显现出来。在不同的应用中,需要不同粒度的双语对齐的语料库和相应的双......
随着互联网的迅猛发展和信息的国际化,对于不同语言文本内容的理解和传播成为了人们的强烈需求。机器翻译这个古老的课题在这样的......
机器翻译是采用计算机技术来完成现实生活中各种语言间的互相翻译,是自然语言处理的一个重要方向。近年来,基于语料库的机器翻译方......
随着深度学习的快速发展,基于神经网络的蒙汉机器翻译质量也有很大改善。本文针对机器翻译技术,对蒙汉机器翻译展开研究。由于蒙汉......
近年来,随着生物医学实验方法的变革,相关实验数据和文献资料呈现指数级的增长,如何从规模庞大的科学文献数据中快速有效地抽取出......
双语词对齐是自然语言处理技术中一项重要的工作,词对齐目的是在句子级互相翻译的两种语言文本中找出词汇级的对应映射关系,词对齐......
对齐的双语语料在机器翻译、词义消歧和双语词典编撰等领域都非常有用,语料对齐的单位由大到小有篇章、段落、句子、短语、词等不......
跨语言交流的需求越来越大,如何低成本、高效率的解决不同语言之间的交流障碍便成了一个难题。针对该问题,机器翻译便应运而生。目......
这篇论文的工作专注于提高基于层次短语的翻译模型的重排性能。主要包括三个方面:一是提出了一个新颖的方法来裁剪已有对齐模型中......
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息......
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词......
描述了一个基于统计机器翻译的汉维词对齐系统。系统处理过程分为两个模块:预处理和词对齐。预处理过程包括汉文文本预处理和维吾......
期刊
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并......
本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行......
中文分词是计算机翻译和搜索引擎技术等的一个瓶颈,目前国内外对汉语分词的研究仍远不如人意,本文对汉语分词歧义做了探讨和分析,......
基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐......
词对齐是统计杌器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBMmodels获得的正反双向词对齐的基础上,确定出正反双向对......
对齐错误率(Alignment Error Rate,AER)是目前通用的词对齐评价标准。近年来的研究表明,AER虽然在一定程度上能够反映词对齐的质量,......
在传统的机器翻译(machine translation,MT)与计算机辅助翻译(computer aided translation,CAT)中,译员与翻译引擎之间的交互受到很大......
韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的......
描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处......
提出了一种基于句子级对齐的双语语料库的英汉词对齐方法.它建立在句对的集合表示形式的基础上,通过最小求交模型实现词对齐.使用......
词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出......
本文引用各种例子,对汉语分词歧义类型进行分析,论述了汉语行文语法改革的必要性和改革方法,然后对汉语语法改革后的中文信息处理......
针对专利文献句子偏长的特点,将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来生成子句......
文本蕴含技术在自然语言处理中得到了广泛应用,但存在词对推理能力差的问题(例如,句对中出现反义词对无法判断反义关系等)。重点研......
针对汉语—维吾尔语的统计机器翻译系统中存在的语义无关性问题,提出基于神经网络机器翻译方法的双语关联度优化模型。该模型利用......
汉英词典作为沟通中文与英语两种不同语言的桥梁,是中国与世界交流的工具。在信息时代飞速发展的今天,双语词典的自动构建技术在机......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
词汇对齐(Word Alignment)是指在源文和对应的译文中刻画词汇互译关系的过程。由于词汇的对译关系是刻画其他翻译关系的基础,所以......
随着互联网的蓬勃发展,跨语言交流日益频繁,传统的基于人工的语言翻译己不能满足互联网中海量的、实时的翻译需求,机器翻译的研究......
对于跨语言的统计自然语言处理研究来说,双语语料库可谓是研究工作的基础。双语语料库的规模、覆盖面、质量等直接影响一个统计模......
词对齐是机器翻译领域中的一项基础性课题,已经应用到很多领域中。针对词对齐中翻译歧义和位置歧义问题,提出一种基于锚点词对的通用......
蒙古语属于小语种,蒙古语到汉语机器翻译相关研究进展缓慢。所以,实现高质量的蒙汉机器翻译对我国少数民族地区信息化发展有着重要......
翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对......
为加强对越南政治、经济和文化等方面新闻事件的了解,提出一种基于依存树的越南语新闻事件元素抽取方法。分析越南语的语法特点,发......
该文针对大陆、香港和台湾地区(简称大中华区)存在同一种语义但采用不同词语进行表达的语言现象进行分析。首先,我们抓取了维基百......
计算机翻译是人工智能的重要研究课题,目前已有不少计算机翻译软件系统研制成功并投入实际使用,取得了一定的效果,但依然存在较多......
提出了一种单语句法分析指导的双语语料库结构对齐方法 该方法以统计的双语模型———反向转换文法为基础 ,通过把英语句法分析知......
身处全球化时代,各个国家和民族间的联系日益紧密,各个语种之间的翻译也理所当然变成了一种迫切的需求。人工翻译虽然可以实现准确......
统计机器翻译的核心是双语平行语料库,需要对大量的平行语料库进行统计分析,从而构建出翻译模型。双语词对齐是统计机器翻译系统中......
维吾尔语丰富而复杂的形态结构往往对维汉词对齐产生不良影响.如果将词尾丢弃只保留词干,虽然可以解决数据稀疏问题,但同时丢掉词......