时间:2015-12-20 23:07:53 所属分类:计算机网络 浏览量:
科学文献老化的探索源于1944年美国纽约大学的戈斯内尔(C.F.Gosnell)在美国《大学与研究机构图书馆》杂志上发表的题为《大学图书馆中文献老化问题》的论文,在传统文献老化规律研究领域,已经形成了以半衰期(Half-Life)和普赖斯指数(Price Index)为主要指标,
科学文献老化的探索源于1944年美国纽约大学的戈斯内尔(C.F.Gosnell)在美国《大学与研究机构图书馆》杂志上发表的题为《大学图书馆中文献老化问题》的论文,在传统文献老化规律研究领域,已经形成了以半衰期(Half-Life)和普赖斯指数(Price Index)为主要指标,以负指数模型、巴尔顿—凯普勒老化方程、布鲁克斯老化方程等为方法的研究体系。但是,这些指标和模型是否同样适用于网络信息资源的老化研究,目前还没有得到充分的论证。以下的部分,我们在分析网络信息资源老化原因的基础上,通过比较传统文献资源和网络信息资源老化的差异,从理论上初步探讨衡量网络信息资源老化的指标。
1 网络信息资源老化的原因及特征
1.1 网络信息资源老化的原因
网络信息资源的老化是指网络信息资源中情报的有效价值随着时间的流逝逐渐衰减,利用率逐步降低。这与传统文献的老化一样,是一种普遍存在的现象。造成网络信息资源老化的因素很多,我们大致可以将其归纳为以下几个方面:
(1)网络信息资源的增长。情报学家M.劳恩曾说过:“文献增长得越快,文献的半衰期就越短。”信息资源的增长和老化是同一事物的两个方面,它们从不同的角度反映信息资源的动态变化。众所周知,网络信息资源的增长速度极其惊人。以我国为例,据中国互联网络信息中心的统计,2002年12月31日,全国网页总数为157,091,220个,字节总数为2,877,754,095KB[1];2003年12月31日,全国网页总数为311,864,590个,字节总数为6,059,431,526KB[2];到2004年12月31日,全国网页总数就达到了650,682,300个,字节总数增长到20,537,214,718KB,与2003年相比,增幅分别为108.6%和238%[3]。
(2)网络信息资源的更新。网络信息资源的更新是指网络信息资源在载体形态、数据组织方式、网址等外在特征不变的情况下,所含知识和情报在内容上的变化。1998和1999年,Bar-Ilan和Peritz对信息计量学领域网络信息的生命周期研究表明,在6个月内近50%的网页发生了变化[4];而Wallace Koehler的观察结果更为显著,他发现97%的网站6个月内会发生变化,如观察时间为1年,则比例上升为99%。对于网页而言,这组数据分别为98.3%和99.1%[5]。应该指出的是,网络信息资源更新并没有引起网络信息资源总量的增长。
(3)网络信息资源的消失。网络信息资源的消失是指网络信息资源无论出于何种原因,被从系统中删除,不能再被访问和利用。文献[4]表明,68%的网页1年内将被从网上移除;而文献[5]发现,有12.2%的网站和20.5%的网页6个月后不能再被访问到。1年后,分别上升到17.7%和31.8%。并且,每周有0.5%的网页和网站消失。与网络信息资源的更新不同,网络信息资源的消失意味着网络信息资源总量的减少。
(4)替代性网络信息资源的出现。随着人类对客观事物和社会运动规律认识水平的提高,原有的知识不断被完善和突破。同时,由于技术的进步和社会信息需求的共同推动,网上信息的加工深度越来越大,原有的知识和情报被包含在新的知识和情报之中,因而,原来不完善、不全面的陈旧信息资源逐渐不再被利用。替代性网络信息资源的出现并不意味着原有信息资源的更新和消失,而表现为网络信息资源中,蕴含新知识和情报的信息的出现和信息总量的增长。
(5)网络信息资源的吸引力。网络信息资源的吸引力主要来自两个方面:一是网络信息资源所揭示和反映的对象所处的发展阶段。处于诞生和发展初期的事物,相关网络信息资源的数量往往呈指数增长,老化遵循负指数函数关系。进入成熟期后,信息的增长速率变小,老化曲线也变得平缓,半衰期加长。当对该事物的认识积累到一定程度,将出现质的飞跃,相关信息的增长进入新一轮的指数增长阶段,相应的,老化曲线也恢复成负指数曲线。二是网络信息资源的受关注程度。对于网络信息资源所揭示和反映的对象而言,受关注程度越高,往往意味着知识更新越快,半衰期越短,反之则越长。对于网络信息资源自身而言,其受关注程度遵循“Winner takes all”法则,受关注程度越高的网络信息资源半衰期越短,也就是说信息更新越快,质量和数量也稳步提升。
1.2 网络信息资源老化的特征
网络信息资源老化与传统文献资源老化既有相同之处,又有显著的差异,其独特之处主要表现在:
(1)非累积性。传统文献资源的重要特征之一就是其存在的永续性,即使这些载体上的知识和情报完全失去了使用价值,它也不会消失。原有信息的修正与更新、替代信息的生产以及新信息的产生必须依靠新的载体。因此,传统文献资源从数量上来说,总是不断增长的。而网络信息资源则不然。网络环境中的信息是介于产生后永续存在与即刻消失两种状态之间的第三类信息,它的更新和消亡是其存在和运动的常态。在网络环境下,新信息的出现并不一定意味着信息总量的增长,而且,相当一部分信息在丧失其使用价值之后会彻底消失,引起信息总量的减少,呈现负增长状态。所以,我们认为网络信息资源具有非累积性,这表明网络信息资源的老化研究往往只能基于特定时间点或时间段,难以系统地回溯其历史状态。
(2)动态性。动态性与非累积性是内在统一的。任何信息都是外在形态与所含内容的统一体。记录信息的载体和信息的组织方式是信息资源的外在形态,而内容,即其所蕴含的知识和情报才是核心。传统文献资源的外部形态和内容是不可分割的,因而必然具有累积性。而网络信息资源的外部形态和内容可以是相互独立的,因此,在网络信息资源载体的形态、信息组织方式、网址等保持不变的情况下,内容可以不断更新,甚至删除,这就体现为它的非累积性。众所周知,半衰期、普赖斯指数的测定都是依据特定领域文献资源的被利用情况,而网络信息资源的动态性使其老化规律的研究增加了新的内容,即对网络信息资源自身生命周期的研究。
(3)不完全性。传统文献,的生产和传播是受控的,由相关机构统一审核和管理。因此,在传统文献资源老化研究中,研究对象的范围一般相当清晰,在数量上也是可数的。而在网络信息资源的老化研究中,研究对象的不完全性却是无法回避的问题。导致该问题出现的原因主要来自两个方面:一是网络的开放性决定了网上信息的发布基本上处于不受控制的状态,因此,任何研究者都无法确知网络信息资源的精确构成和分布状况,在研究特定领域的网络信息资源时,也就不可能准确地划定研究对象的范围和数量。二是网络信息资源的非累积性和动态性造成了研究对象在时间维度上的缺失,因此,在研究中也就难以系统地回溯研究对象的历史状态。
转载请注明来自:http://www.zazhifabiao.com/lunwen/dzxx/jsjwl/30000.html