自动分词相关论文
为了对公共资源电子交易平台运行过程中产生的大规模结构化或非结构化的电子数据进行分析和利用,充分挖掘公共资源交易数据的价值,并......
智能问答是一种针对自然语言处理的高级信息检索形式,基于大量的语料数据库,选择构建合适的数据模型,从而实现人机之间的对话,精准......
建立中古汉语语料库分词规范,需要考虑多方面因素:如何借鉴现代汉语分词规范的既有规则;覆盖大部分中古词汇现象,符合中古词汇具体......
中文信息处理的众多应用领域,诸如机器翻译、自然语言理解等,都面临着一个同样的基础性问题,即分词问题.本文主要讨论了基于网格的......
2005年,教育部语言文字信息管理司开始和国内若干高校陆续联合建设语言资源监测中心,其中包括与北京语言文化大学共建的平面媒体语......
大规模的标注语料库是语料库语言学发展的重要基础.随着许多科学研究的进一步开展,我们对语料的加工质量提出了更高的要求.本文采......
计算机的人名自动识别一直是个比较复杂的问题.见诸报道的多数是统计方法识别中文姓名.本文通过分析称谓语与人名的分布关系,拟在......
专名识别是中文自动分词的重要任务.本文分析了目前流行的基本语料库和统计语言模型(SLM)的专名识别方法中存在的问题,同时以人名......
本文介绍了2003年"中文与接口技术"汉语自动分词与词性标注一体化评测的一些基本情况,主要包括评测的内容、评测方法、测试试题......
随着中文网络的快速发展,对于网络中海量中文数据的实时处理成为一个引人关注的话题,而中文文本的自动分词技术是中文信息处理系统......
机器翻译是最具综合性和实用性的自然语言处理工程,机译软件的汉英翻译质量首先取决于汉语分析能力.我们测试了两个流行的商用机译......
本文提出了一种面向机器翻译的中文分词自适应方法。该方法综合利用中文单语语料库和中英双语平行语料库,自动获取目标领域的分词......
在自然语言的智能处理领域中,相较于现代汉语,古汉语的研究由于可用有效标注资源有限、种类欠缺,使得古汉语自然语言处理技术的发......
科技文献抄袭现象伴随着科学技术的发展时有发生,这严重损害了文献原作者,也对科技文献的严肃性提出了挑战。本文利用分词技术提取......
本文讨论了书面汉语的人工辅助分词和自动分词,并以汉语语言学为依据归纳了用汉语词素构词的类型。就书面汉语自动分词的复杂性和依......
本文探讨了情报检索数学模型的研究进展以及汉语文献自动分词和信息压缩存储的若干方法.
This article explores the research pro......
本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统CSAIS2.1的主要思路、基本算法及其基本结构
This article int......
古籍文本检索目前大多局限于篇、章及目录,即使是全文检索一般也是基于单汉字的检索,由于没有现成的古籍词表可用,古籍文本的标引......
中国中文信息学会主办的全国性学术创刊物——《中文信息学报》创刊已整整五年了,它是随着中文信息处理事业的发展而成长起来的。......
关于语文信息技术工作的昆明宣言我们是参加云南省文字信息处理学术会的来自全国各地和海外的代表,为了促进我国语文现代化和中文信......
随着计算语言学研究方法与观念的更新和发展,特别是语料库语言学的兴起,作为语言学研究的得力工具与基础性设施的语料库研制已引......
短语作为句子的一个层次,其结构的研究在自然语言理解中,尤其是汉语理解中占有重要的位置。本文介绍的是一种基于统计信息的分析汉语......
本文介绍了一个计算机实现的汉语文-语转换系统,它以词为单位,将文本按句子输出,可保持自然语言的韵律。为了改善合成语音的自然度和可......
分析了汉语姓名在各种类型汉语文本中的分布情况、汉语姓名组成的复杂性和自动识别姓名的难点,提出了自动识别姓名的策略和规则。
......
语言学界应该读,读得懂凌雪典《语言文字应用》创刊五年来,我一直是订户和积极的读者。我高兴地亲身感受到其学术水平不断提高,因而学......
StandardizationandUnificationofChineseCharactersintheInformationEra(2)层次越高,表示一个汉字所用的符号越少,表示全部汉字所用......
最近看到几期贵刊,很高兴,为贵刊在艰难的环境下坚持语文现代化方向感到鼓舞。 关于中文的改革问题,在国际联网杂志《华夏文摘》......
1.会议概况 由新加坡举办的中文电脑国际会议(International Conference on Chinese Computing,简称ICCC)起源于1986年8月。国立......
有关汉语分词的几点意见进明由于汉语在书写上,词与词之间没有空格,是连着写的,而汉语里的语素、词、词组并无不同的标记,界限相当模糊......
浅谈汉语分词的标准孙宏林分词是汉语信息处理中的一项基础工程。解决汉语分词问题,意义重大,但困难重重,所以“分词问题已成为当前......
文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开......
中文信息处理专题研究6语义研究特邀主持人:北京语言文化大学语言信息处理研究所教授张普主持人的话语义研究是目前汉语信息处理研究......
词典编纂工作计算机化可明显提高效率和质量,因而需要借鉴国外的有益经验,并结合国内的实际情况,实现词典编纂的计算机化。 我们旨在......
无论在自然语言处理还是在机器翻译中 ,自动分词都是一个重要的环节。本文讨论传统的切词方法中 ,歧义的形式 ,以及消歧处理方法
......
汉语文本的自动分词是汉语信息处理中最为基础的研究,自动分词的分词精度直接制约着其他汉语语言工程项目的进展和水平。歧义字段......
“互联网+”时代,形象逐渐超越实物成为旅游者消费关注的焦点,游客更倾向于购买口碑好的、形象好的商品。本文以网络游记为数据来......
2010年9月17日至18日,由国家语言资源监测与研究中心主办的语言资源监测与服务论坛(2010)在北京举行。我国语言学及语言信息处理学界......
本文将藏文传统文法和日常用语作为基础,文本中出现的大量虚词作为查找目标,结合语料库初探不自由虚词校对的算法,准确的将文本中......
211工程三期重点学科建设项目语言科技创新及工作平台建设成果主持:董志翘成员:廖强、汪祎、李斌助研:赵家栋、李明龙、张春雷、周......
藏文信息处理技术随着对语言文字信息处理研究工作的不断深入,逐步从字信息处理转向语言信息处理。与汉语、日语等语种的信息处理......
在信息多元化时代,社会生活中的热点事件层出不穷,随之而来的是新概念、新词语的大量出现。新词发现是自然语言处理领域的核心问题之......