论文部分内容阅读
摘 要:在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代图书馆发展的主旋律,通过大量的非结构化数据、半结构化数据去寻找隐藏在数据背后的世界,进而为图书馆服务的模式、未来发展趋势提供分析与预测将成为大数据时代图书馆的一大主要服务内容。
关键词:大数据;非结构化数据;半结构化数据;数据处理;图书馆服务数据挖掘
一、大数据带给图书馆的影响与挑战
大数据时代的到来改变了传统的IT架构与数据存储、利用机构,也将对作为社会中储存信息知识、提供信息服务的信息中心的图书馆形成冲击与挑战。因此,深刻理解大数据的内涵,联系图书馆的发展及其现阶段数据储存、分析、挖掘的发展状况及大数据时代图书馆用户对信息资源的利用需求,对大数据带给信息服务业的影响与挑战进行大胆的假设分析与小心论证将显得非常必要。这种分析与论证也将使得图书馆在大数据时代真正来临时将有充足的应对准备与发展对策。
二、复杂数据的处理将成为大数据时代图书馆的发展旋律
社会信息化进程的加快,使得信息的重要性日益显现,信息、能源与材料也被誉为是现代社会发展的三大支柱之一。提高民众的信息获取能力、保障信息获取公平、优化信息获取环境、推动信息社会的发展也因此成为了一个国家、地区政府的主要职责之一。
在政府主导、社会重视的氛围中,图书馆也发挥了该有的作用,门户网站、特色数据库、数字图书馆建设也是风起云涌,截至目前,我国的图书馆均基本实现了信息化建设,但具体分析不管是国内外的国家计划还是图书馆的信息化发展,其所包括的信息数据建设都还主要是数据库、XML等同类型、不能再细分的单一数据,即都是结构化数据。但随着大数据时代相关业界对大数据的重视及应用,大数据的特性与优势将在日常的生活中将凸显出其巨大的优越性,民众的需求也将随着这些人性化、个性化的高满意度服务出现而对图书馆的服务呈现出明确和迫切的需求,适应社会的发展,满足用户的需求,提供复杂数据的处理也将成为大数据时代图书馆的发展旋律。
三、迅猛增长的复杂海量数据将为图书馆的数据存贮能力提出挑战
信息环境下,信息产生的成本快速下降,产生的方式也多种多样,存在于社会空间中的信息数据量迅猛增长,但大数据时代更是会促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据的组成结构、类型格式、存在形态等都愈加复杂。图书馆对这些复杂的数据进行的应用、存储将有着极强的挑战性,其不仅有技术问题,也还包括社会问题,当然在解决这些挑战、问题的过程中,可能会促发图书馆服务模式、资源建设模式、管理模式与发展模式的转变,但要顺利的完成以上模式的转变与完成,两大难题则须予以解决:首先,云计算的出现使得海量数据的存储与运算得到了解决,但其自身存在的安全等问题依然不能让用户完全放心和信任,而图书馆自身海量数据的存储及运算能力与大数据对存储能力的高要求之间的矛盾如何去解决将直接决定着图书馆在大数据时代能拥有什么质量、多少数量的负责数据;其次,数据即业务,大数据对于图书馆的数据存储范围有着极高的要求。因此图书馆要在大数据时代掌握读者用户、馆员乃至社会服务群体等的信息,则对其的数据描述中应既要有当前通用的数据记录中的个人身份、借阅记录等结构化数据外,还更需要大量的存储信息行为、搜索方式、行为痕迹等半结构化、非结构化数据。
四、传统的信息服务将面临以复杂数据为对象、以深度挖掘为要求高标准挑战
图书馆信息化程度的提高,使得信息服务成为了当前图书馆服务的主要内容之一,知识社会的到来也使得以互联网信息搜索、查询为基础的知识信息服务逐渐被更多的图书馆所吸纳与实践,也成为了现代图书馆服务系中不可或缺的一大版图。但不管是简单的信息服务还是结合了信息检索、组织、分析等高級业务素养去完成的知识服务,都只是可归纳为是就数据而进行的服务,尽管也有了Web2.0等互动技术的推动后图书馆服务的个性化、人性化服务有了显著提高,但交互性程度并不高,个性化、人性化服务也只是简单的以用户的结构化数据,如根据服务诉求、专业特长等数据,去完成一定程度上的差异化服务。但大数据则要求图书馆不仅需要通过结构化数据了解现在客户需要什么服务,也更需要利用大量的非结构化数据、半结构化数据对图书馆—用户的服务关系中去挖掘正在发生什么、预测和分析将来会发生什么,以便图书馆找到更好的服务营销模式与应对未知的危机及挑战。
大数据的出现,将改变我们对数据的看法与认识,数据的存在不仅有价值,大数据更是将其能转化为有意义,人们将透过大数据而找到隐藏在大量数据背后的世界,然而大数据的应用是技术难度极高的集成应用。图书馆作为社会信息服务的中心,在面临这些较高的技术和管理风险的同时,还面临着内外部环境的挑战与竞争,对内方面,除上述存在的主要挑战之外,基础设施、人力资源、运行经费、管理体制都会是不得不面对的挑战因素;对外方面,IT厂商与信息服务机构的大数据研究、应用已捷足先登,图书馆在大数据的服务竞争中已落后于他们一步,尽管图书馆有资源的优势,但图书馆在技术等方面的劣势也将限制图书馆难以追赶上,如何避免边缘化,将是图书馆不得不考虑的一大问题。
关键词:大数据;非结构化数据;半结构化数据;数据处理;图书馆服务数据挖掘
一、大数据带给图书馆的影响与挑战
大数据时代的到来改变了传统的IT架构与数据存储、利用机构,也将对作为社会中储存信息知识、提供信息服务的信息中心的图书馆形成冲击与挑战。因此,深刻理解大数据的内涵,联系图书馆的发展及其现阶段数据储存、分析、挖掘的发展状况及大数据时代图书馆用户对信息资源的利用需求,对大数据带给信息服务业的影响与挑战进行大胆的假设分析与小心论证将显得非常必要。这种分析与论证也将使得图书馆在大数据时代真正来临时将有充足的应对准备与发展对策。
二、复杂数据的处理将成为大数据时代图书馆的发展旋律
社会信息化进程的加快,使得信息的重要性日益显现,信息、能源与材料也被誉为是现代社会发展的三大支柱之一。提高民众的信息获取能力、保障信息获取公平、优化信息获取环境、推动信息社会的发展也因此成为了一个国家、地区政府的主要职责之一。
在政府主导、社会重视的氛围中,图书馆也发挥了该有的作用,门户网站、特色数据库、数字图书馆建设也是风起云涌,截至目前,我国的图书馆均基本实现了信息化建设,但具体分析不管是国内外的国家计划还是图书馆的信息化发展,其所包括的信息数据建设都还主要是数据库、XML等同类型、不能再细分的单一数据,即都是结构化数据。但随着大数据时代相关业界对大数据的重视及应用,大数据的特性与优势将在日常的生活中将凸显出其巨大的优越性,民众的需求也将随着这些人性化、个性化的高满意度服务出现而对图书馆的服务呈现出明确和迫切的需求,适应社会的发展,满足用户的需求,提供复杂数据的处理也将成为大数据时代图书馆的发展旋律。
三、迅猛增长的复杂海量数据将为图书馆的数据存贮能力提出挑战
信息环境下,信息产生的成本快速下降,产生的方式也多种多样,存在于社会空间中的信息数据量迅猛增长,但大数据时代更是会促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据的组成结构、类型格式、存在形态等都愈加复杂。图书馆对这些复杂的数据进行的应用、存储将有着极强的挑战性,其不仅有技术问题,也还包括社会问题,当然在解决这些挑战、问题的过程中,可能会促发图书馆服务模式、资源建设模式、管理模式与发展模式的转变,但要顺利的完成以上模式的转变与完成,两大难题则须予以解决:首先,云计算的出现使得海量数据的存储与运算得到了解决,但其自身存在的安全等问题依然不能让用户完全放心和信任,而图书馆自身海量数据的存储及运算能力与大数据对存储能力的高要求之间的矛盾如何去解决将直接决定着图书馆在大数据时代能拥有什么质量、多少数量的负责数据;其次,数据即业务,大数据对于图书馆的数据存储范围有着极高的要求。因此图书馆要在大数据时代掌握读者用户、馆员乃至社会服务群体等的信息,则对其的数据描述中应既要有当前通用的数据记录中的个人身份、借阅记录等结构化数据外,还更需要大量的存储信息行为、搜索方式、行为痕迹等半结构化、非结构化数据。
四、传统的信息服务将面临以复杂数据为对象、以深度挖掘为要求高标准挑战
图书馆信息化程度的提高,使得信息服务成为了当前图书馆服务的主要内容之一,知识社会的到来也使得以互联网信息搜索、查询为基础的知识信息服务逐渐被更多的图书馆所吸纳与实践,也成为了现代图书馆服务系中不可或缺的一大版图。但不管是简单的信息服务还是结合了信息检索、组织、分析等高級业务素养去完成的知识服务,都只是可归纳为是就数据而进行的服务,尽管也有了Web2.0等互动技术的推动后图书馆服务的个性化、人性化服务有了显著提高,但交互性程度并不高,个性化、人性化服务也只是简单的以用户的结构化数据,如根据服务诉求、专业特长等数据,去完成一定程度上的差异化服务。但大数据则要求图书馆不仅需要通过结构化数据了解现在客户需要什么服务,也更需要利用大量的非结构化数据、半结构化数据对图书馆—用户的服务关系中去挖掘正在发生什么、预测和分析将来会发生什么,以便图书馆找到更好的服务营销模式与应对未知的危机及挑战。
大数据的出现,将改变我们对数据的看法与认识,数据的存在不仅有价值,大数据更是将其能转化为有意义,人们将透过大数据而找到隐藏在大量数据背后的世界,然而大数据的应用是技术难度极高的集成应用。图书馆作为社会信息服务的中心,在面临这些较高的技术和管理风险的同时,还面临着内外部环境的挑战与竞争,对内方面,除上述存在的主要挑战之外,基础设施、人力资源、运行经费、管理体制都会是不得不面对的挑战因素;对外方面,IT厂商与信息服务机构的大数据研究、应用已捷足先登,图书馆在大数据的服务竞争中已落后于他们一步,尽管图书馆有资源的优势,但图书馆在技术等方面的劣势也将限制图书馆难以追赶上,如何避免边缘化,将是图书馆不得不考虑的一大问题。