【摘 要】
:
文本与数据挖掘(Text and Data Mining,简称TDM)是大数据时代特有的文本分析与数据处理技术,由于其技术特点,基于文本或者录音、录像等涉版权作品的文本与数据挖掘中涉及到对
论文部分内容阅读
文本与数据挖掘(Text and Data Mining,简称TDM)是大数据时代特有的文本分析与数据处理技术,由于其技术特点,基于文本或者录音、录像等涉版权作品的文本与数据挖掘中涉及到对作品的大规模复制行为以及片段上传的行为,因此带来了版权法上的争议,目前以欧美为代表的一些国家基于文本与数据挖掘所带来的巨大的公共利益,对文本与数据挖掘技术进行了合理使用层面上的放开,但仍规定了一些限制性条件,将合理使用的范围限制在基于公益目的而使用文本与数据挖掘技术的范围内,而在文本与数据挖掘性质并不明确的国家,仍存在权利人为主导的许可协议模式,鉴于文本与数据挖掘所引发的争议,是由于新技术产生带来的新问题,本文将从功利主义视角出发,尝试采用激励分析方法对其法律性质进行梳理探讨。本文第一部分将对文本与数据挖掘技术进行介绍,对文章论述对象进行限定并分析文本与数据挖掘的步骤流程,针对文本与数据挖掘技术的主要流程:准备阶段、挖掘阶段、结果表达阶段,分别对其版权风险进行分析;第二部分将探讨文本与数据挖掘正面临的版权困境,首先对文本与数据挖掘打破现行版权规则进行论述,之后则针对文本与数据挖掘使得版权法的目的不能实现进行论述,得出按照现行版权规则对文本与数据挖掘技术的实施进行规制,会造成利益失衡结果的结论;第三部分对国际上目前有关文本与数据挖掘行为的应对情况分模式进行比较评析,认为授权许可协议模式仍没有脱离现有著作权具体规则框架,并将对比较有影响的文本与数据挖掘制度层面上的应对政策,以是否允许商业性使用文本与数据挖掘技术进行区分,分为有条件模式与无条件模式,并对两种模式进行对比,探讨对商业性使用文本与数据挖掘技术所持不同态度的根本原因是对公共利益的定位不同;第四部分将从文本与数据挖掘的技术本质、其对著作权人造成的经济上的影响以及所具有的公法价值、产业价值进行分析,论证该技术实施关切极其重大的公共利益且不会给权利人带来实质性损害,具有著作权法上的正当性,结合第三部分论证得出结论,无条件模式将公共利益定位在大数据产业上更合理;第五部分是论述的重点,本部分将在之前论述的基础上对文本与数据挖掘的法律性质进行厘清,由于文本与数据挖掘技术实施确实涉及版权争议,为了明确权利边界,实现交易的可预期性,应在版权法范围内对其进行定性,基于本文第四部分得出的文本与数据挖掘能够带来巨大的公共利益且不会对著作权人市场带来实质性损害的结论,本部分第一到三部分从合理使用的制度定位出发,论述文本与数据挖掘应为合理使用行为,本部分最后一节是本文的主要创新点所在,从著作权的本质、功能等角度论述商业性使用文本与数据挖掘也应被认定为合理使用,认为商业性使用文本与数据挖掘技术,不但不会对权利人造成实质性损害,反而以额外收益激励额外投资能带来更大的社会利益,更有助于大数据产业的发展;第六部分得出结论,对于我国而言,对于涉及文本与数据挖掘的著作权相关争议,可以在司法裁判中采取激励分析方法的解释进路,在现有合理使用制度范围内,将商业性使用文本与数据挖掘也囊括在例外的范围内,推动"互联网+"背景下我国大数据产业的发展。
其他文献
商标延伸注册问题产生于商标申请人利用品牌延伸策略扩张经营之需求与我国现行商标注册制度之间的冲突,主要关涉商标异议程序中,商标申请人能否依据其在先基础商标与延伸商标
随着国内车用商品汽油标准对烯烃含量的限制越发严格,以及人们对空气污染的关注,降低汽油中烯烃含量,改善汽油燃烧性能并提高汽油辛烷值具有现实意义。本文主要研究磁基铑催
近年来,随着科技与通讯业的疾速发展以及大屏智能手机的流行,人们的道德判断不再局限于发生在传统的纸质呈现载体下,更多发生在手机屏幕这种新的呈现载体下。呈现载体的改变是否影响人们的道德判断?有研究指出,人们经常在手机上快速浏览碎片化的新闻讯息,表现为一种“浅阅读”;且人们在手机上做决策时会体验到“窄化效应”。这些因素综合起来会引起人们更抽象、更高层次的心理表征,从而对道德情境的判断也会更加严苛,即对道
学业自我妨碍是指学生在学业成就情境中,为使自我价值不受损,而预先采取的任何能够增大将失败原因外在化的策略方式。高二阶段是学生学业自我妨碍的高发期,大量研究发现,长期
相比于一元纯金属纳米粒子,许多双金属纳米粒子会具备更加优异的物理和化学性能。已有大量实验和理论研究表明:很多双金属纳米粒子因为元素之间表面能和原子半径的不同而优先
在对模态问题的研究中,卡尔纳普、辛迪卡将可能世界解释为语句的极大一致集合。而大卫·刘易斯认为,“语句的极大一致集”这一表述本身就包含着模态,可能世界不可能是句子的集合。基于反事实条件句的分析,大卫·刘易斯对可能世界做了实体解释,创建了他的可能世界理论。大卫·刘易认为,可能世界是实体的存在,它们是由时空相连的部分构成的。接着,他分析了可能世界的孤立性、具体性、现实性和充裕性特征。面对哲学家们提出的诘
我国《国家赔偿法》中规定了行政追偿制度,但由于立法过于原则和笼统,导致行政追偿制度在实践中的未能发挥其应有的作用,法律规定形同虚设。本文从行政追偿制度本身出发,将行
在实际的应用中,无论是科研人员还是用户,都希望能够了解模型做出判断的依据和过程,以信任模型的决策结果。当模型做出了错误判断后,了解模型判断错误的原因,也对模型的进一步改进和提升有很大帮助。人们在不断应用和创新各种模型并解决了一个又一个问题的同时,机器学习模型缺乏可解释性的矛盾日益尖锐起来。在一些对模型和精度要求较高的领域如医疗专家系统、虹膜身份识别、工业互联网等,可解释性的缺失会给任务带来严重威胁
数据分类是知识发现与数据挖掘领域的一项重要任务。然而,大多分类算法均以数据分布平衡为前提,这并不适用于非平衡数据分类问题。此外,优化模型的求解方法大多采用随机梯度下降,该方法利用单个样本梯度近似代替全梯度的计算原理,虽然减少了一定的计算量,但是单个样本梯度和全梯度之间是存在偏差的,这必然会影响算法的收敛。由上述可知,用于非平衡数据分类问题的新优化模型及其高效求解算法的研究一直是机器学习领域面临的挑
随着人们生活水平的提高,技术水平的巨大飞跃,人们越来越关注水下鱼类的智能养殖监测和水下鱼类生活习性等研究。目前水下鱼监测主要还是通过人工监测,潜水员潜水跟踪拍摄,很多水下环境危险系数高,而且潜水员跟踪可能会惊扰到鱼类,不能反映出最真实的鱼类生活规律和健康等重要数据。因此,不断探索智能化的水下鱼跟踪机器鱼,和其核心的视觉跟踪算法。本文研究应用水下机器鱼进行鱼监测的机器视觉识别和定位的技术,主要包括以