初等数学知识图谱的构建以及表示方法的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:a53479051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和大数据的快速发展,全球每时每刻都在产生海量的,结构化或者非结构化的数据,这些数据格式多样化,有图片,文本,音频,视频等等。由于数据的多样化以及数据表示的多样性,大数据不经过结构化处理在许多情况下将无法有效的应用。本文重点研究多源异构的非结构化、半结构化初等数学领域数据如何表示为结构化数据,并依据数学领域知识图谱构建的方式构建初等数学概念知识图谱。然后将构建完成的概念知识图谱应用到纯数学文本题目的理解中,构建初等数学题目知识图谱用于推理系统,解答初等数学基本问题。知识图谱的存储形式是以三元组的形式存储,应用于图神经网络以及图上的推理算法不是十分契合,采用Trans E算法将知识图谱中的三元组数据训练成为词向量,词向量可以运用在根据头实体和关系预测尾实体、图推理等方面。综上介绍,本文主要完成了以下几个工作:(1)制定初等数学知识的表示形式。完成了实体结构表示、关系结构表示、以及数学领域的知识特征性表示,如命题的表示,二元关系与多元关系的相互转换等。(2)构建初等数学概念知识图谱。构建完成的概念知识图谱包含了实体551个,基本关系561条,三元组204763条。(3)通过图嵌入模型将概念知识图谱中的三元组数据训练成为词向量,词向量模型可用于根据首实体和关系预测尾实体。(4)基于初等数学概念知识图谱,结合自然语言理解生成题目知识图谱,题目知识图谱可运用于推理系统。题目知识图谱生成系统可用于任意数学题目文本到知识图谱的转换,通过测试了函数、数列、几何等模块各100个题目,实体正确率均在90%以上,关系正确率均在90%以上。
其他文献
当今经济全球化、区域间市场一体化的趋势依然没有改变,国际间投资和贸易的交流与合作依然是世界各国促进经济发展最有效的手段之一。中国始终坚持提升对外开放水平,构建良好营商环境,因此在吸引外商投资方面,就必须坚持包容开放的精神,推动投资自由化,促使外商投资能够在中国市场充分发挥其应有的作用,拉动经济持续增长,推动产业转型升级。建立和完善我国的外商投资国家安全审查是为引进外商投资设立底线,使得即能充分利用
胚胎干细胞有独特的能力,能自我更新,无限增殖,并分化或发育成多种类型的细胞和组织。胚胎干细胞应用到临床领域的关键问题是如何从其他类型的细胞中鉴定和分离出ES细胞。作为细胞的“身份证”,特异标志分子在胚胎干细胞识别和确定中发挥了重要作用。本论文中将从噬菌体肽库中筛选出的针对猕猴胚胎干细胞的特异多肽的DNA序列连接到pGEX-KG表达载体上,以便获得GST-peptides融合蛋白。同时,抽提大量培养
1906年1月,李叔同在日本编辑出版了综合性期刊《音乐小杂志》作为中国近代音乐期刊的起步,截至目前我国的音乐期刊发展道路已走过115年。1949年新中国的成立,使我国的社会制度发生了较大变革,文化思潮也随着社会环境的改变有了新的发展方向。上海作为当时国内现代化的城市,奥斯邦将中国第一座广播电台建立在上海并开始播音,这注定上海是近代中国广播事业最发达的城市。《广播歌选》作为曲谱类期刊,以广播为载体,
随着信息技术的发展和人们对生活便利性的追求,大量依靠生物特征构建的识别系统正在逐步取代传统的密钥验证,其中声纹具有特定性和相对稳定性的生物特征,在越来越多的认证系统中被使用。而随着语音合成技术的发展,使得人们可以利用计算机生成与自然人说话语音十分类似的合成语音,这一技术在提高自动语音应答服务质量的同时,也给基于声纹识别的说话人认证系统的安全性带来挑战。犯罪分子可以轻易的获取用户的个人语音信息,通过
在知识表示领域,数据稀疏性是大规模知识图谱普遍需要解决的难题。对此,研究者建立了一个连续的向量空间,将知识图谱三元组进行向量化嵌入到其中,从而实现了对实体和关系的分布式表示。现有模型在训练过程中采用生成负样本的方法主要是随机采样,通过此方法生成的大多数负样本质量较差,对于知识表示的健壮性增强并不明显。本文在现有的面向知识图谱的表示学习相关原理和技术的基础上,将现有知识表示模型结合到生成对抗网络中提
随着经济的发展,物流运输活动在社会经济活动中的作用也日益提升。企业采购,居民家庭的牛奶、报纸运输,邮递服务,城市垃圾的回收等生产、服务活动都将我们的生活和物流运输紧密联系在一起。另一方面,在现实生活中,物流运输活动常常会遇到各种不确定因素,例如天气变化、交通拥堵、不确定的需求和服务时间等等,均给物流运输管理带来了极大的挑战。本文以物流运输中的车辆路径问题为研究背景,考虑带有随机顾客需求的情况,建立
文本验证码出现早,可扩展性强,被广泛使用。然而,随着深度学习技术的发展,文本验证码的安全性受到越来越大的挑战。因此,为增强文本验证码面对深度学习模型时的反识别能力,论文提出两类适用于不同场景的基于深度学习的文本验证码反识别算法,这两类算法能在不影响人眼识别成功率的前提下最大化提升原有文本验证码的反识别能力。第一,研究计算资源受限情况下如何尽可能提升文本验证码反识别能力的问题。深度神经网络对对抗样本
智能交通系统中,道路运动障碍物的检测跟踪一直都是一个重点的研究内容。由于行车过程中车载摄像头运动导致背景运动,使得视频中存在运动的障碍物与背景两个相互独立的运动导致目标检测和后续跟踪困难。对于在汽车辅助驾驶系统中,道路上运动障碍目标的检测时由于车载摄像头运动引起的背景复杂以及对检测跟踪结果的实时性准确性等技术要求,提出一种有效的解决方案。该论文主要工作有:(1)目标检测问题上,将视频图片帧进行感兴
胚胎干细胞是从胚胎发育早期的囊胚的内细胞团内分离出来的一类细胞。胚胎干细胞的基本特性是能够自我更新和具有全能性。自我更新是指在特定的培养条件下,胚胎干细胞具有无限增殖的能力。全能性是指其能分化为体内源自三个胚层的所有类型的细胞。它的这些基本特征使其在理论研究以及人类疾病的治疗方面具有多种重要应用。研究表明,在胚胎干细胞表面存在特异的分子,可以作为胚胎干细胞分离、鉴定以及纯化的标志物。然而,目前已经
近年来,目标检测算法不断推陈出新,检测速度与识别精度都有了很大的提升。单阶段的检测模型形成了一个相对固定的算法框架,但模型本身存在一些缺点和不足。首先,单阶段目标检测模型采用人为设定参数的方法生成检测边框,容易出现检测边框泛化性差的问题,造成模型在不同数据集的模型性能差异很大。同时,模型的检测边框在回归过程中,边框回归损失值并不能很好的反应出边框回归效果的真实好坏。具有相同回归损失值的边框的回归效