图书情报领域关于大数据研究的热点分析
发布时间:2021-06-10
摘要:近年来,大数据研究成为图书情报领域的研究热点。本文采用文献计量和引文分析等方法,对图书情报领域关于大数据研究的现状、热点、主要研究方法和发展趋势等进行了分析和整理,期待为相关人员的研究提供参考。
关键词:图书情报;大数据;研究热点
自2008年9月《Nature》杂志首次正式提出“大数据”[1],迅速引起了学术界的广泛关注,众多学者开始从自己的学科角度出发探讨大数据的价值理念、大数据分析方法和大数据在本学科的应用。以文献、信息和数据为主要研究对象的图书情报学领域,也迅速掀起了大数据研究热潮,在我国2014年公布的图书情报领域国家社科基本项目名单中[2],与大数据有关的就18项,约占总量的13.7%,可见我国图书情报领域学者们对大数据的重视与关注。
1现状分析
(1)发文量分析
本文的主要数据来源为CNKI数据库,以“大数据”作为检索关键词,研究学科内容设为“图书情报与数字图书馆”,检索时间为2020年5月,对检索结果进行归纳后再剔除与之不相关论文,共得到1039篇学术性的研究文献。如图1所示,近几年来我国该领域相关研究成果稳定增长,2014年发文124篇,2019年发文最高195篇。
(2)关键词分析
关键词是研究内容的真实反映和高度总结,体现该领域的研究重点和方向。本文统计了排名前二十的关键词。排名第一的是“大数据”,共出现了598次,其次是大“数据时代”、“图书馆”、“大数据应用”,分别出现247、125、105次。
3)被引次数分析
被引用次数在很大程度上反映了该篇文章的学术影响力以及学术价值。研究发现:被引次数最多的是《图书馆需要怎样的“大数据”》,共被引247次,其次是《大数据时代的图书馆服务浅析》、《大数据时代下图书馆的挑战及其应对策略》,分别被引236次和151次。
2研究方法
目前在这一领域研究所用的主要方法有:共词分析、聚类分析、因子分析、多维尺度分析。
(1)共词分析
共词分析法是内容分析法的一种,它的思想源于文献计量学的引文耦合与共被引概念,即当两个主题词或关键词在一篇文献中同时出现,表明这两个词之间具有一定的关系,同时出现的次数越多,表明它们的关系越密切、距离越近[3]。共词分析法是在提取关键词、构建共词矩阵后,运用聚类分析、多维尺度分析和社会网络分析等多元分析方法,将某一学科领域内的关键词加以提取、统计,从而归纳出该领域的研究热点和发展趋势。
(2)聚类分析
聚类分析方法研究“物以类聚”问题行之有效,其本质为分类方法,根据样本数据之间的亲密程度,对数据样本进行分类处理,分类数据中的同类数据表现出较强的亲密关系,不同类别的数据表现出较大的差异性[4]。具体操作流程是将区别较大的不同矩阵导入SPSS22.0当中,然后进行分析、分类、层次聚类操作;然后将变量导入右面的变量列表当中,按照次序分别设置各类聚类分析选项,输出图与统计表内容。
(3)因子分析
因子分析通过运用数量较少的因子来确定原始变量之间的具体关系,并反映出原始资料中大量数据信息之间的关系。因子分析有5个基本特征:第一,因子分析模式中因子原有数量高于提取个数;第二,因子可以有效降低数据计算量,并能开展数据建模工作;第三,因子可以反馈原有变量信息中的大量重要因素;第四,因子之间不存在显性的线性关系;第五,因子具有命名解释的基本性能。
(4)多维尺度分析
多维尺度为降维分析,是根据具有很多维度的样本或变量之间的相似性(距离近)或非相似性(距离远)来对其进行分类的一种统计学研究方法,具体方式为将相异矩阵导入当中,然后进行分析、度量、多维尺度选择,将变量全部转移到变量列表当中,分别设置模型与选项。
3研究热点分析
(1)大数据影响分析
大数据极大地颠覆了社会各行各业原有的生产与服务模式。图书情报领域将会受到怎样的影响,如何抓住机遇、迎接挑战是研究者们共同思考的问题,尤其是大数据对数字图书馆的影响备受关注。陈传夫、钱鸥、代钰珠指出,大数据带来的变化将会挑战数字图书馆现有的资源组织、信息服务与成本管理[5]。温浩宇、李京京提出了一种基于NoSQL中间件模型的异构数据集成方法,该方法应用于数字图书馆可以更好地适应大数据带来的海量数据分布式存储[6]。
(2)竞争情报
竞争情报是一个企业、团体及国家为了在市场上赢得竞争优势所需要的经过加工的信息。大数据为竞争情报的收集和分析带来了巨大的影响与变革。吴金红、张飞、鞠秀芳指出,大数据有利于提高竞争情报的真实性、精准性以及实时性,但同样会带来新的挑战,包括情报存储、情报分析、情报安全以及人才紧缺方面的问题,企业在情报意识、情报组织团队、竞争情报系统以及安全制度等方面需作出相应的变革以应对挑战[7]。刘高勇、汪会玲、吴金红认为,大数据能够提升竞争情报的地位、情报源价值和情报分析能力,并降低分析成本,但企业也需要在情报认知、数据处理能力和体系组织模式等方面应对大数据带来的挑战[8]。顾涛提出,面对与以往截然不同的海量数据处理,各组织机构可以进行竞争情报的协作共享,并提出了三种大数据下的竞争情报协作共享模式,即自主协作模式、中心协作模式或分级协作模式[9]。
(3)智慧图书馆
智慧图书馆是未来图书馆发展的新模式,它通过提供融理性智慧、价值智慧和实践智慧为一体的公共智慧服务,打造更具魅力的公共文化环境和更大的信息共享空间。图书馆可以使用大数据的分析方法建立起新的服务体系与资源体系,以提供更好的读者服务。樊伟红等学者分析了图书馆的主要数据源与图书馆信息服务现状,探讨了大数据给图书馆带来的挑战、机遇和可能的帮助,并分析了当前的研究现状与热点,指出大数据可能在许多方面给图书馆带来帮助,包括建立业务风险模型、用户分析、新型知识服务引擎、预测资源故障等[10]。杨海亚指出,图书馆可以通过推进大数据应用、维护发展图书馆制度、强化图书馆的人文关怀、培养智慧图书馆员等方式提供公共智慧服务[11]。李恬认为大数据提供了一种全新的数据理念,重视从世俗的视角发现问题、重视数据整体、从数据中寻找关联。建议图书馆以大数据理念处理馆藏数据、书目数据、用户数据及工作数据,提供更加深入、高效的服务[12]。韩翠峰认为大数据时代的图书馆需要创新图书馆服务,包括重视用户数据与信息、增加大数据分析服务、利用分析技术与工具、提高服务智能化[13]。
(4)资源建设
大数据时代,图书馆资源采购重心逐渐向数字资源转移,数字资源的甄选、建设、整合与保存都成为新的挑战。学者们总结了大数据对图书馆数字资源建设的挑战与机遇,并对图书馆的数字资源特点,数字资源新的采购、管理、保存、服务、共享模式,传统文献资源的数字化,以及数字图书馆的建设模式等进行了研究。王晓燕认为图书馆可以通过提高数据素养、建设大数据资源、开展大数据创新服务等方式应用大数据[14]。
(5)积极开发移动数据和云端处理模式
5G技术即将走进人们的生活,未来移动设备中的大数据技术开发将是主要的发展方向。虽然移动设备的运算、数据处理功能以及存储功能还不能满足数据处理需要,但也由此衍生了云端处理模式。云计算的出现为信息资源共享和沟通带来更大的便利,近年来各高校图书馆都在深入研究云计算在本领域的应用,并取得了一定成果。虽然现在移动云处理研究处于起步阶段,但伴随5G技术的推广应用,移动终端结合云端大数据处理应用研究将会得到更多研究群体的重视。同时大数据和移动云计算融合也有很多阻力,例如安全隐私、模型架构等诸多问题,但攻克这方面的技术难题指日可待。
相关期刊推荐:《图书馆学研究》:图书馆学刊物。坚持理论联系实际的原则,致力图书馆学、科技情报学、目录学、史料学、版本学、图书馆科学管理,干部培养,图书馆建设与设备、图书馆改革的研究,提高图书馆工作者的理论和业务水平。图书馆可以积累图书,供读者借阅,让读者从图书中获得想要得到的信息与资料,对其有所帮助。
4研究趋势分析
大数据将给应用情报学研究带来机遇和挑战[15],研究环境、研究对象、研究方法和研究工具发生巨大变化[16]:
(1)单一领域情报研究过度到全领域情报研究。这一领域的研究在方法上渗透面更广,跟其他学科领域相互交叉融合更多,虽然这种交叉和借鉴早就存在,但现在以及将来这种意识更强烈,手段也更为综合;另外在研究内容上有明显的扩展现象,图书情报已经不再单一地局限于自己本研究领域,而是在一个更广大的环境下,从而使得研究更为精准和严谨。
(2)对多种数据资源进行综合运用。综合利用多种数据资源进行分析已经成为大势所趋,随着经济和全球一体化的发展,公众对于情报资源的利用已经变得更为综合和细化,仅仅涉及一种元素已经不能满足公众的需要了。
(3)对新型信息资源进行重新审视和分析。随着科技的发展和应用的深入,各种新型信息资源也已经涌入大众的视野,研究人员对于这些资源的审视和分析,不仅是当前他们自身研究的必要,也是资源利用者的需要。
(4)情报研究的严谨性和智能化。情报研究偏向于利用现有的各种科学技术和手段来达到目的,但是针对同样一个问题,采用不同的技术手段可能产生不一样的结果,为避免这种偏差,必然对研究方法和手段提出更高的要求,推动情报研究的全方面智能化,保证结果的科学、严谨。
5结语
将大数据应用到图书情报工作领域的研究成果丰硕,虽然发达国家的相关研究比我们起步更早,但只要我们对图书情报大数据环境下的热点认真研究梳理,不但能促进大数据和图书情报工作更加深入的融合,还能为创新图书情报工作开辟一条新路径。——论文作者:夏军辉1,扈桂红2