首页 理论教育 网络信息的布氏分布

网络信息的布氏分布

时间:2022-03-04 理论教育 版权反馈
【摘要】:本节将采用布拉德福的方法处理和研究网络信息的分布。通过一些工具性网站2003年5月1~3日“网络经济”这个条目命令中的网页数量的集中与分散分布发现,其分布的近似曲线与布拉德福分布曲线比较接近。再次,信息审查同科学期刊的差异也影响了网络信息的分布。而信息一旦进入零成本,低限制地发布环境,无疑将造成信息激增,同时分布更加分散。

11.2.1 网络信息的布氏分布

国外近几年对网络信息分布的研究成果表明,网络条件下信息分布仍然满足离散分布规律,但是网络条件下的信息发布环境与传统期刊出版条件相比有很大不同,这种集中与分散的程度是否会有所变化?本节将采用布拉德福的方法处理和研究网络信息的分布。通过一些工具性网站2003年5月1~3日“网络经济”这个条目命令中的网页数量的集中与分散分布发现,其分布的近似曲线与布拉德福分布曲线比较接近(如图11-1所示)。前半段数据较少,表明在门户网站搜索引擎的信息搜集中,信息资源集中的网站比较集中,而且信息共享形成一些信息集中的网站群。同时,由于信息检全率有限,对于非核心网站的信息统计数量明显不足,表现出的格鲁斯下垂格外明显。而在内容分析中,虽然网络经济的相关网页约15万篇,但根据搜狐的统计结果,相关网页超过10页的网络经济相关网站只有120个,超过20页的相关网站不过23个,最多的海脉咨询也不过2000页左右,大量相关网页分散在其他网站,网络信息分布更加分散。同时,对“远程教育”的研究也表明基本符合这一趋势。此外,网络条件下的信息分布不够稳定,各网站的信息丰裕程度和信息组织能力变化很快。比如新浪网的搜索引擎6月份升级以后,它的网络信息搜集能力大大超过同类网站,而且可能连续两天的搜索结果相差很大。但是我们尝试在三个不同的时段对互联网进行统计,其分布图形基本一致。

img140

图11-1 以网络经济为主题的网页的布氏分布曲线

在计量分析的过程中,虽然数据有限,而且许多门户网站使用同样的搜索引擎,搜索结果的形式也不太一样,但网络信息分布与文献分布的差异比较明显。搜索引擎的共享使许多网站都具有相同的信息搜索能力,像百度搜索引擎被100多个地方网站和30多家专业网站采用,对网络信息的分布影响很大。其次,摆脱了版面与经费限制,也使网络信息离散程度加剧。再次,信息审查同科学期刊的差异也影响了网络信息的分布。科学期刊都有严格的审查制度,而且科技文献发表有一定的成本,其结果必然会有一个均衡。而信息一旦进入零成本,低限制地发布环境,无疑将造成信息激增,同时分布更加分散。另外,用户对网络信息的浏览也是造成网络信息集中分散的重要原因,我们可以用实际数据进行分析。根据中国互联网络信息中心2001年7月的统计数据,平均每个商业网站每天的浏览量为5342个页面,是企业网站的10倍左右,是政府机构网站的6倍左右。从企业网站的浏览量在各行业分布看,零售批发贸易业的浏览量占24.1%,其次为电脑/通信设备/网络设备/软件业,占18.8%,再次为机械及工业制品占7.4%。科学研究和综合技术服务业及公关、咨询、广告和市场研究等服务业等的浏览量也分别占5.8%与4.7%。(5)从浏览范围上看,大多数网络信息用户的浏览范围局限于少数几个核心网站。这种状况主要受搜索成本的影响。用户获取信息资源必须付出一定的搜索成本,而一旦得到,今后就可以在不付出任何搜索成本的条件下使用该信息资源。所以,今后用户不愿进行新的信息搜索,就形成了较高的用户忠诚度。另一方面,不管是资金、技术、人力资源还是市场机会,都集中在少数优秀的网络,导致马太效应特别突出,更使得网络信息用户的浏览范围局限于少数几个核心网站。核心网站具有良好的市场前景,许多的网站都愿意与这些网站链接,提高网站的信息网罗程度,提高网络信息资源的信息质量,更加吸引网络信息用户。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈