论文部分内容阅读
在当今世界经济发展环境下,企业间的竞争实际上是知识产权的竞争。专利是知识最集中的载体,因此有效检索和利用专利信息成为企业了解竞争对手,跟踪行业技术发展趋势,提高自身自主创新能力和核心竞争力的重要途径。但是目前专利信息检索系统大都是基于关键字匹配进行检索,检索结果在准确性和全面性上都不尽如人意。为此,本文提出了构建专利领域本体,通过基于专利领域本体的查询扩展,实现语义上的检索,提高专利信息检索的查全率和查准率。
本文的主要工作内容如下:
1、首先对专利信息检索系统的研究现状进行了研究,然后对本体在信息检索中的应用现状和本体构建方法进行了学习和研究。最后,根据本体在实现概念检索上的特点,确立了构建领域本体库,并将领域本体应用于专利信息检索中的目标。
2、通过文本挖掘的方式构建领域语料库,提出了在领域语料库的基础上构建领域本体的方法,建立燃料电池专利语料库和专利本体库。
3、将基于领域本体的查询扩展技术应用于专利信息获取过程,利用WordNet语义词典与Dbpedia数据集以及构建的专利领域本体库,实现了对检索表达式的语义扩展,从概念层次认识与处理用户的检索请求,使得检索表达式更加准确和全面,以提高了检索的查准率和查全率;
4、构建了基于专利领域本体的专利信息检索原型系统,包括专利信息检索、本体库的更新和本体库的维护三个组成部分。以美国专利商标局USPTO(The US Patent and Trademark Office)网上专利文献数据库为信息源,实现了基于燃料电池专利本体的相关专利文献检索,证明本文所述方法在提高专利信息检索的准确性和全面性上的有效性。