基于意图识别的客服机器人框架设计与关键技术研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:xyc76821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聊天机器人是自然语言处理领域的一个重要研究方向,旨在让用户能用自然语言的方式与机器进行沟通。基于常见问答对的问答系统,是聊天机器人的一种重要实现方法,通过比较用户的问题与问答对中问题的相似程度,快速地返回一个准确而简洁的答案,其中全面而准确的问答对是问答系统的基础,也是发展瓶颈。在客服领域,大量且真实的人工客服数据为问答系统的使用提供非常合适的应用场景,而且准确且高效的问答系统也为企业节约了客服成本,提高了客服效率。本文以母婴行业的电商客服为背景,主要做了以下几方面的工作:首先,本文针对传统基于常见问答对的问答系统(Frequently Asked Questions,FAQ)框架的不足,在传统FAQ框架的基础,加入意图识别模块,设计了一个新的客服机器人框架。然后,本文针对客服机器人框架中的三个关键技术,关键词自动抽取,意图识别和语义相似度计算,结合本文的实际应用场景,进行了深入的研究。设计了多种关键词特征,利用XGBOOST(eXtreme Gradient Boosting)算法构建了一个关键词自动抽取模型;设计了一个意图分类模板和多种意图识别特征,利用Softmax算法建立一个多分类模型进行意图识别;设计了多种语义相似度特征,基于XGBOOST算法构造语义相似度计算模型。最后,对本文所建立的三种模型进行了实验和评估。本文提出的关键词自动抽取方法相比传统的无监督方法和有监督方法准确率都有大幅提高;意图识别的平均准确率为78.4%;在不同相似性阈值的情况下,基于关键词自动抽取模型的语义相似度计算模型相比基于TF-IDF(Term Frequency–Inverse Document Frequency)的语义相似度计算模型准确率都有提高。将这三种模型用于本文提出的客服机器人框架和传统的FAQ框架,实验结果证明,本文提出的框架比传统的FAQ框架准确率更高。
其他文献
非法经营罪从投机倒把罪演化而来。面对大量的经济失范行为,条文规定较为抽象的非法经营罪逐步沦为新的“口袋罪”。在最高司法机关及地方司法机关的共同作用下,一方面,非法
在全面提升学生素质的教育理念和教育目标的指导下,顺应高中生健康成长需要的心理健康教育已经在各地中学逐步开展。从目前各地中学的开展情况看,要有效做好高中生的心理健康教
作为教师我们要平等的对待每一位学生,他们都是需要爱的,教师的爱如阳光洒满孩子们的心间,多给学生些宽容和信任,让每个孩子得到更好的成长。
数学思想是指人们对数学理论和内容的本质的认识,数学方法是数学思想的具体化形式,它是实践数学思想的具体操作和过程,实际上两者的本质是相同的,差别只是站在不同的角度看问题。
供销合作社在服务“三农”的实践中,越来越认识和感受到发展农村现代流通是实现农业现代化的必由之路,是建设新农村的必要途径,是助农增收的当务之急。作为我国组织体系最健全、
通辽市的农牧民占全市人口的60%,是内蒙古传统的农业大市,作为自治区重要的农业产区,农业保险是为其规避农业生产中不确定风险的必要手段,为农业的稳产增产起到了保驾护航的
随着人们对教育的不断重视,幼儿教育也受到越来越多人的关注,如何做好幼儿教育工作成为人们热议的话题.幼儿是国家未来的希望,幼儿教育工作能否进行良好的开展与实施,关系着
大数据时代的来临,为远程教育的智慧型变革提供了技术支撑和强大的助推力量。对大数据与智慧型远程教育之间关系进行探讨,有助于厘清未来远程教育的发展方向,为学生提供更好