【摘 要】
:
随着人工智能的发展,基于机器学习、深度学习的主观题自动评分方法取得了较好的效果,但仍离不开教师的人工评分,并且对每道试题需要采集大量的考生答案训练对应的评分模型,局限性较大,难以投入到实际应用中。而基于匹配的自动评分方法,通过计算标准答案与考生答案的匹配程度进行评分,虽然可以评阅新题,但需要对词形、语义、句法等复杂特征进行人工设计与计算,并缺乏学科背景知识的支撑,评分准确度与机器学习、深度学习的自
论文部分内容阅读
随着人工智能的发展,基于机器学习、深度学习的主观题自动评分方法取得了较好的效果,但仍离不开教师的人工评分,并且对每道试题需要采集大量的考生答案训练对应的评分模型,局限性较大,难以投入到实际应用中。而基于匹配的自动评分方法,通过计算标准答案与考生答案的匹配程度进行评分,虽然可以评阅新题,但需要对词形、语义、句法等复杂特征进行人工设计与计算,并缺乏学科背景知识的支撑,评分准确度与机器学习、深度学习的自动评分方法相差较大,效果不理想。本课题以地理学科为背景,根据学科特点,设计并实现了面向地理学科的关键词提取及文本相似度计算,并融入到了主观题自动评分中,达到了令人满意的效果,并有良好的应用性。本文主要研究内容和成果如下:(1)通过提取地理学科知识信息,建立了地理词典GEO-Dict,解决了中文分词和词性标注对地理学科词语识别不准确的问题;并将GEO-Dict引入到Word2vec模型中训练词向量,构建了地理语料库,作为承载地理知识的基础资源;针对同义词词林对地理学科同义词识别不准确的问题,构建了地理同义词词库,对比同义词词林,地理同义词词库可以更有效的识别地理学科同义词语。(2)研究并分析了现代汉语词性类别及含义,结合词性标注,设计并实现了关键词提取及权重分配算法,能有效提取地理学科评分关键信息;在文本相似度计算中融入了地理语料库、同义词词林和地理同义词词库,实现了面向地理学科的词语相似度和语句相似度,更适用于计算地理答案之间的文本相似度。(3)收集并整理了陕西省和北京市两地区高中考试数据,作为自动评分数据集;设计并实现了基于Word2vec和基于地理学科文本相似度的随机森林评分模型;在基于匹配的自动评分方法中融入了学科背景知识,提出了结合学科同义词与词向量的相似度评分模型,实验结果表明,该模型与随机森林评分模型取得了较好效果,并与教师评分趋势基本一致,评分准确率达到了88.82%。(4)设计并实现了主观题自动评分系统,可以在网上自动阅卷、教师课堂授课和学生课下练习等教育教学过程中调用自动评分服务接口,实现主观题自动评分。在系统中共收录了218道地理高考及模拟试题进行测试,结果表明,该系统能正常提供自动评分服务。综上,本文实现的地理主观题自动评分模型,取得了较好的效果,实现的主观题自动评分系统,能正常对外提供自动评分服务,具有一定的应用价值。
其他文献
光伏扶贫新思路是国家支持贫困县发展的重要举措之一。长阳县作为国家级贫困县,在国家脱贫攻坚号召下,制定多项战略进行脱贫致富,其中光伏扶贫就是其中关键的一项。光伏发电属于一种绿色环保型的项目,相对于其他扶贫项目而言,在保护当地环境的前提下,收益更为稳定,能够给长阳县贫困居民带来更多的效益,从而实现绿色脱贫目标。国网长阳县供电公司是承担光伏扶贫项目的重要主体,加上政府及当地居民支持,光伏扶贫项目能产生较
王塘南是阳明后学的杰出代表,也是江右王门主静思潮的集大成者。塘南认为“知道者以性为宗”,故其学以“透性为宗,研几为要”。他在坚持阳明“即体即用”原则的同时也贯彻了主静思潮“致虚守静”、“用工夫以复本体”的独特学路,不仅对治了“见在良知”说的流弊,也补救了聂双江“寂感二分”、“格物无工夫”的疏漏,使江右王学达到了一个新的高度。因此,研究和梳理王塘南思想对理解江右王门主静思潮、晚明王学的发展乃至明清之
连续玻璃纤维增强热塑性管道是以玻纤带作为增强层、以高分子聚合物作为基体材料的新型复合管道,它实现了两种材料特点的融合,具有生产成本低、耐腐蚀性好、耐压能力强、铺设方便及使用寿命长等优异性能。该新型复合管道可实现盘卷,施工方便,在油气输送等领域能够发挥出重要作用,具有较大的市场应用空间。PVC-RTP又称连续玻璃纤维增强热塑性聚氯乙烯复合管,是以改性聚氯乙烯(PVC)为基体材料,以本课题组研制的连续
“富煤少气”是我国的现状,实现煤炭资源转变为天然气是符合我国能源战略要求的,而作为煤制天然气关键步骤的甲烷化一直是研究热点。传统固定床存在反应器散热困难、受热不均匀等问题。而流化床反应器具有较高的热容量,在反应过程中床层温升小,适用于甲烷化反应。本文基于CPFD方法对流化床反应器内的整体流动规律、传热及甲烷化过程进行了研究。首先针对流化床反应器,基于CPFD数值模拟方法建立了流化床模型,深入研究了
信息技术是人类历史上发展最快,应用最广泛的高新技术。信息技术是最强的“催化剂”,它对传统产业进行了优化和改造,有效地提高了传统产业的生产率,并优化了产业结构,促进了工业结构向高科技的快速过渡。随着经济的飞速发展,竞争日益激烈,各个行业、企业都在向信息化、自动化运营发展模式转型。ZM公司作为早期煤炭行业的重点企业,也面临传统产业的优化转型,信息化发展也变得更加重要。ZM公司应做好信息化发展战略规划,
目的探讨CT增强对胆囊癌淋巴结转移的诊断价值。方法回顾性分析28例胆囊癌患者的CT影像及病理资料,记录病灶及淋巴结的CT表现特征,对转移与非转移淋巴结的长径、短径、长径/短径采用独立样本t检验,对于其他胆囊原发灶的表现情况(胆囊癌形态、病变位置、胆管有无扩张、T分期、有无肝床转移)及淋巴结特征(淋巴结的形态、强化方式)进行卡方检验或Fisher精确检验,将人口学特征(年龄、性别)及其他相关因素进行
新疆哈密是大规模可再生能源电力传输至内地的重要枢纽地区,独特的地理环境使得哈密地区风、光等自然资源极其丰富。目前哈密地区风电场与光伏电场规模位居世界前列,其规模还在持续增长。哈密地区电能通过大容量、长距离输电的形式输送至内地,高压直流线路相较于交流线路在电能损耗与投资成本上更具有优势。由于哈密地区独特的地理环境,火电厂与水电厂相对较少,使得哈密地区中新能源电场的无功调节措施,主要通过加装电容器以及
在世界纯电动汽车的发展浪潮下,中国纯电动汽车产业蓬勃发展。一方面得益于国家政策的引导和推动,另一方面受益于各项关键技术的相继突破。但是随着新能源汽车补贴逐步退坡以及动力电池技术短期内仍无法突破瓶颈的发展状况,中国纯电动汽车行业将步入技术挑战、动力转换、结构调整的新阶段。整车控制器作为纯电动汽车最为核心的部件之一,其控制策略的优劣是决定整车性能的重要因素。而驱动控制策略又是整车控制中最基本也是最重要
众所周知,持久性的应激暴露是引发焦虑症等精神疾病的重要原因。这与其导致大脑杏仁核区过度兴奋密切相关。近年的研究已充分表明,杏仁核内的投射神经元在基因表达、结构连接以及生理功能等方面表现出高度的异质性。不同投射神经元通过与不同脑区形成突触联系,并在杏仁核的相关功能中发挥不同乃至截然相反的功能。揭示不同类别杏仁核神经元在焦虑症等精神疾病发生中的作用及具体机制,对于全面了解疾病的发病机制、乃至开发高效精
实体关系抽取技术是自然语言处理领域中的一个基础任务。主要体现为关系抽取是知识图谱,智能问答的上游任务,能够为其提供结构化知识,语义理解和关系推理等支持。有监督的关系抽取任务是依赖大规模数据集完成的,但大型数据集的构建费时费力。虽然基于远程监督的关系抽取模型能够将知识库与非结构化文本对齐来自动生成大量训练数据,减少模型对人工标注数据的依赖;但是同时也会引入大量噪音,引入误判。所以在关系抽取任务上,少