首页 理论教育 网络环境下的农业信息集成服务

网络环境下的农业信息集成服务

时间:2022-07-03 理论教育 版权反馈
【摘要】:网络环境下的区域性农业信息集成服务平台构建与实现_数字化信息服务研网络环境下的区域性农业信息集成服务平台构建与实现陈果 胡昌平[摘 要]本文从当前农业信息化现状出发,结合农业的区域性差异,分析了区域性农业信息集成服务。2 网络环境下的区域性农业信息集成服务及其平台信息集成服务是针对某个既定目标或面向某项特定任务,利用信息集成技术,对分散的信息资源进行组织、重构,建立整体化的信息资源保障体系。

网络环境下的区域性农业信息集成服务平台构建与实现_数字化信息服务研

网络环境下的区域性农业信息集成服务平台构建与实现

陈果 胡昌平(1)

(武汉大学信息资源研究中心武汉430072)

[摘 要]本文从当前农业信息化现状出发,结合农业的区域性差异,分析了区域性农业信息集成服务。文章提出了需求导向下的区域性农业信息集成服务平台总体框架。以此为指导,对区域性农业信息集成服务平台的功能设计进行了分析,形成了一套完整的具有区域针对性的农业信息集成服务平台构建方案。最后以湖北省麻城市农业信息集成服务平台为例,对其实现和应用进行了介绍。

[关键词]农业信息服务 信息集成 信息服务平台(www.guayunfan.com)

Construction and Application of Regional Agriculture Information Integrated Service Platform Under Network Environment

Chen GuoHu Changping

(Center for Studies of Information Resources of Wuhan University,Wuhan,430072)

[Abstract]This article is based on the current status of agricultural information,considering the regional differences of agriculture.This article develops a scheme:integrated service of regional agriculture information,and puts forward the overall framework of demand-oriented integrated service of regional agriculture information platform.Under guidance of this framework,this article makes a depth analysis of the construction of the platform.After that,a systematic plan to construct the platform is proposed.

[Keywords]Agricultural Information Service Information Integration Information Service Platform

1 引 言

随着近年来国家对农村基础设施建设的大力投入,我国农业信息化所依赖的基础设施和农村信息服务体系逐渐完善,农村信息传播渠道发展迅速,农业信息化“最后一公里问题”所面临的硬件和软件障碍也会逐步被解决。农业信息化必须在经过农业信息基础设施建设阶段后,进行农业信息资源和农业信息技术的集成开发与应用,最终进入信息农业阶段。[1]

目前,我国农业网站已经走过了自发发展、数量急剧扩展和以设施建设为主的起步阶段,进入一个良好发展、统筹规划、整合创新、稳步推进,以服务效果导向的新阶段。[2]在此阶段,探讨一种适合我国国情,依托于网络环境的农业信息服务模式,并将其在实际应用中优化改进,是一项十分必要的工作。

在2005年至今连续4年中,武汉大学信息管理学院共有多支本科生寒、暑期社会实践小分队参与对湖北省、河南等地区农业信息需求和服务现状进行实地调研,获得了丰富的第一手资料。在此基础上,我们提出了网络环境下的区域性农业信息集成服务。作者完成了平台的方案设计、技术实现工作,并在武汉、麻城、罗田等地进行了试点应用。本文就平台构建、实现问题进行探讨。

2 网络环境下的区域性农业信息集成服务及其平台

信息集成服务是针对某个既定目标或面向某项特定任务,利用信息集成技术,对分散的信息资源进行组织、重构,建立整体化的信息资源保障体系。其技术具有数字化、网络化、虚拟化的特征。[3]

农业信息集成服务是在互联网环境下产生的新型农业信息服务方式。当前农业已呈区域性产业化、技术差异化发展,而在我国农村,农户、企业了解的信息与市场信息不对称,单个农户、小规模农业组织搜集、捕捉分析信息的能力差,同时农村有针对性的信息服务也不到位。[4]农业信息集成服务旨在对已有的异构信息源的集成和优化,提供在当前农村用户基本信息技能下可行的信息服务方式。

由于农业生产、经营的区域性差异,其用户信息需求具有不同的内容和特征,针对各地域的农业信息集成服务十分重要。区域性农业信息集成服务面临农业区域性差异带来的挑战,因而需要充分挖掘区域用户的信息需求,对已有农业信息资源中符合区域性要求的异构信息进行采集、过滤、分类和重组,并在服务层面上整合目标区域内已有的农业信息服务体系和业务,为用户提供具有针对性的“一站式”信息服务。

我国农业网站发展基数庞大,体系已趋于完整,但整体而言,农业信息分散、混乱的问题日益严重。我们需要构建一个以现有农业网站体系为基础的信息集成服务平台,以满足农业的地域和行业双重要求。另一方面,平台的构建必须依托于现实,同时又能弥补当前农业网站信息服务不足的,具备可实现性和可应用性。在这种背景下,区域性农业信息集成服务平台的构建和应用可以说是一种初步尝试,目的是探究一种解决我国农业当前面临问题的可行办法。平台在促进农业产业化和完善农产品市场、拓展农业电子商务等方面具有重要的实践价值。

3 区域性农业信息集成服务平台的构建

区域性农业信息集成服务平台的构建必须以用户需求为导向,结合农业用户的区域性特殊信息需求和行业共性的信息需求,以此指导平台的功能设计,特别是平台在信息集成中的信息源选择、信息集成方式和集成后的业务组织方式。

3.1 用户需求导向下的平台总体框架

针对某一区域的农业信息集成,用户的需求就决定了其信息既要符合区域特性,又要属于农业这一领域,因而需要在用户需求建模、信息资源选择、信息过滤和分类组织上满足这一双重要求。另一方面,平台信息集成应涉及农业新闻、政策法规、市场信息、农技农情、致富经验等与农业生产、经营相关的各个方面。同时,信息的集成不应局限在单一区域内,还应包括各农业领域内各区域的通用公共信息。[5]

在用户需求的基础上,根据整合原则,结合信息检索、信息资源整合和信息服务等理论[6][7][8],本文提出区域性农业信息集成服务平台的总体构建框架,包括多级人工信息发布体系、可配置的信息自动采集、集成信息的过滤和重组、集成信息显示网站体系、农业网站服务接口、非网络媒体服务接口和主动式推送服务接口、集成检索接口等。如图1所示。

3.2 平台功能设计

区域性农业信息的集成是提供有针对性农业信息服务的前提和基础,信息的集成是在信息资源整合基础上进行的。它包括对信息源的处理、信息的采集、信息的标准化、信息的评价和过滤、信息的分类与组织、信息存储等。

区域性农业信息集成可采用如图2所示方式。

下面分析信息采集、信息评价和过滤、信息的分类与组织等信息集成中关键部分的相关功能及其设计。

3.2.1 信息采集

信息的采集是信息资源整合的第一步,也是信息集成的基础。它包括信息源的选择和预处理、信息的获取、数据格式的标准化。其中信息的获取是关键,它包括两种形式:依托于互联网上已有信息资源的自动采集和依托于人工的手动信息发布。

图1 区域性农业信息集成服务平台总体框架

图2 区域农业信息集成方式

针对我国当前农业信息服务体系不完善,同时互联网上信息资源量大而针对性不强这一现状。一种有效的区域性农业信息采集方案是结合自动采集和手动采集信息入库两种方法。信息的自动采集可以最大限度、以最快的速率整合已有资源,对多个信息源进行实时跟踪和采集,可以确保信息集成的信息数量和更新频率要求;而人工信息发布的管理者一般为该区域的农业信息服务人员,经过他们人工择取和处理的信息具有明确的针对性和价值,可以更好地满足当地农业信息用户的需求。

3.2.2 信息评价和过滤

对于自动采集到的信息,很难确保其满足特定区域农业用户的要求,大量冗余、无用信息也有可能被采集到,从而对自动采集信息的整体质量和精确度产生影响。因此对采集到的信息进行评价和过滤是很有必要的。

一种可行的方案是在建立用户需求词表集合的基础上,将采集到的信息与词表集合进行相似度计算,根据预设的阈值,判断该信息对特定区域农业用户信息需求`的相关度,依次作为信息评价和过滤的依据。[9]

图3 区域农业信息评价和过滤方式

3.2.3 信息的分类与组织

信息的分类与组织是对其进行序化和优化的手段,也是提供优质信息服务的前提。在对采集信息进行评价中,就已经对信息的区域性特征进行了量化,信息的地域分类可以此为依据,因此对农业信息进行分类和组织主要是按照信息内容的所属栏目进行。

通过对当前网上农业信息源的分析和比较,我们发现大部分区域农业信息的内容所属栏目大同小异,且与其信息来源密切相关。集成信息的分类可追溯至信息源的选择和分类,因此可提出如下分类方法:将采集信息源细化到各个农业网站的最底层栏目,做好初步分类工作,并将其归入到集成后的平台分类体系中。通过过滤和评估,这些信息仍归入其信息源所对应的信息分类。

3.3 平台集成信息服务的业务组织

通过信息采集、过滤和分类,将符合用户需求的信息进行统一存储,我们可以建立一个集成信息资源库。要有效地利用这些信息,实现各信息体系之间以及与用户间的无障碍交流,为用户提供方便快捷的一站式服务,就需要对区域性农业信息集成的业务组织方式进行研究。平台集成信息服务业务的组织将直接影响其服务的最终效果。

信息服务的业务组织一方面受其服务对象的需求和自身特征影响,另一方面也受基础设施和已有服务体系的影响。因此区域性农业信息集成的业务组织必须坚持两个原则:现实性原则和有用性原则。现实性原则是指业务的组织要在对服务对象和服务环境进行充分调研和分析的基础上进行,最终得到的服务方式能应用于实际;有用性原则是指业务的组织要结合自身优势,提出能解决现实中已经存在和可能会存在问题的办法,来弥补已有信息服务模式的不足。

在区域性农业信息集成的基础上,结合对武汉市、湖北省麻城市和罗田县等地区农业信息服务现状的调查,提出如图4所示区域农业信息集成服务的业务组织结构。

图4 区域性农业信息集成服务的业务组织架构

4 区域性农业信息集成服务平台的实现

在上述基础上,本文作者以湖北省罗田县和麻城市为对象,分别开发了相应的基于b/s模式的区域性农业信息集成服务子平台。其中湖北省罗田县的子平台访问入口为: http://csir.whu.edu.cn/nongye/luotian/index.jsp;湖北省麻城市的子平台访问入口为: http://csir.whu.edu.cn/nongye/macheng/index.jsp。

下面以麻城子平台为例,从信息自动采集、处理和前台网站服务功能的实现工作两个方面来介绍平台的实现工作,并对其应用情况进行说明。

4.1 信息采集、处理的实现

在平台的信息采集部分,参照Heritrix[10]和Nutch[11]等基于java的网络爬虫技术,采用作者自己开发的网络采集器,具有简单易用、方便配置、针对性强的优点,能很好地满足平台对网页信息的采集。采集器核心部分包括Source类、UrlLsitGrap类、ContentGrap类、Format类、Filter类等。其处理流程如图5所示。

在网页内容分析和文本抽取方面,平台采用目前较为先进的HTML Parser[12]技术,将带采集网页的html代码进行解析为dom树的形式。作者采用基于统计的文本密度分析方法[13][14],开发了具有通用性的网页内容分析器,实现对大多数农业信息源内网页的正文内容抽取,过滤掉了广告和版权说明等干扰信息。以此为基础,开发了相应的信

图5 平台信息采集与过滤流程

息源配置管理后台,让用户可以进行个性化的信息源选择与定制,实现了可自定义配置的通用信息采集方案。[15]图6是麻城市子平台后台管理中的“采集管理>>信息源配置”界面。

图6 用户自定义信息源配置界面

在文本内容的过滤、分类和索引部分,平台采用Lucene技术,同时引入基于词典的中文切分词技术。Lucene是一个基于java的开源搜索引擎项目,很多先进的信息检索理念都在Lucene中得以体现。在文本过滤和分类中计算文本与指定词表相似度时,可以Lucene自带的基于向量空间模型的相似度算法[16],依据所得的结果进行信息的过滤和分类。对于符合要求的信息内容,在入库存储前用Lucene建立全文索引,便于以后进行快速全文检索。

4.2 网站服务功能的实现

在前台网站建设中,平台按照集成信息的三种类别,提供了相应的服务方式。

(1)区域农业信息:包括本地区农业新闻、政务、经济等方面信息,本地区所在省份的农业新闻、政务、经济信息,本地区附近大型农产品市场的农产品价格日报,以及针对特定地区的特色农业栏目,以农产品类别进行分类组织,每类农产品又按新闻资讯、供求价格、技术经验等进行分类。

(2)通用农业信息:包括针对全国的农业政策、部门公告、新农村建设、国内和国际农业动态、农业气象、致富创业、农村奇闻逸事等。这一部分信息各个子平台间可通用。

(3)集成检索服务:以农产品数据库的形式提供集成检索服务,包括农产品的价格、技术、品种、供求信息查询。平台中的集成检索目前实现了初步的一站式查询服务,提供统一的检索界面,将用户的查询转发到其他农业数据库,由相关数据库做出响应,返回结果。其中集成检索页面如图7所示。

图7 集成检索页面

麻城市子平台首页如图8所示。

4.3 平台应用

麻城市区域性农业信息集成服务平台已于2007年11月完成,作者于2007年11月下旬与项目组成员一起赴麻城市与相关单位协商了试点应用事宜。由于麻城市农业信息化基础设施较落后,唯一的农业网站“麻城农业信息网”托管在福建省的一家网络服务商处。平台采用“数据中心”和“网站联盟”相结合的应用方式,做好两手准备,一方面在武汉大学信息资源研究中心建立了数据中心,实现信息的定时采集、处理和集中存储,在此基础上向麻城市农业网站提供信息传送;另一方面,我们开发了麻城市农业信息集成服务网站,向当地用户提供集成化的农业信息服务,同时在麻城现有的农业信息网上增加了平台访问入口,如图9所示。

图8 麻城市子平台前台网站

图9 麻城市农业信息网中平台入口

5 总结与展望

区域性农业信息的集成是提供有针对性农业信息服务的基础,是区域性农业信息集成服务平台的重要功能。它包括对信息源的处理、信息的采集、信息的标准化、信息的评价与过滤、信息的分类与组织、信息存储等。其中信息采集可使用自动采集和手动信息入库相结合的方法;信息的评价与过滤需要在建立区域性用户需求的基础上进行相似度运算和匹配;信息的分类与组织可在对信息源分类的基础上进行。

迄今为止,区域性农业信息集成服务平台已与武汉市农业信息中心建立合作关系,结合武汉市8+1综合配套改革试验区的契机,加大武汉市农业对周边地区的辐射,农业信息化是其重点发展的部分。结合区域性农业信息集成服务平台和武汉市已有的农业信息服务体系,建立一个区域性农业信息集成服务示范工程,供有需要的地区参考采用,是有利于华中地区乃至全国的农业信息化发展的尝试。

就当前农业信息化发展现状来看,在信息集成的基础上建立农业数据中心,对分散、隔离的农业信息源进行整合,并根据需要提供数据服务是很有必要的。下一步工作是在华中地区建立一个农业数据中心,向华中地区内的农业网站、农业信息服务机构、相关媒体、农业用户提供整合后的信息资源。以此为契机,推动华中地区农业信息化的发展,使信息真正能成为推动农业发展的力量。另一方面,在已有的平台基础上,可以拓宽视野,根据平台的应用情况,对平台功能进行改进和拓展,完善平台应用方式,最终总结出一个可以推广使用的区域性农业信息集成服务应用模式。

参考文献

[1]王亚东等.中国农业信息化建设研究[J].情报学报,2002(2):214-218

[2]牛盾.在全国农业网站发展座谈会暨农业信息中心主任会议上的讲话.[EB/OL].http://www.ahny.gov.cn/sites/MainSite/Detail.aspx?StructID=11766.(访问日期:2008-03-09)

[3]霍忠文,张捷.信息集成服务发展战略[J].情报理论与实践,2000(1):1-5

[4]李应博.我国农业信息服务体系研究[D].中国农业大学,2005

[5]郭希玲.网络环境下的农业信息需求[J].现代情报,2002(4):136,139

[6]胡昌平.面向用户的信息资源整合与服务[M].武汉:武汉大学出版社,2007

[7]张会田.基于Web的个性化网络信息集成服务系统设计与实现[J].情报学报,2004(1)

[8]胡晓博.面向特定领域的专业搜索引擎的架构与实现方法[D].哈尔滨工程大学,2007

[9]唐志.主题Web信息采集与分析技术研究[D].重庆大学,2006

[10]http://crawler.archive.org

[11]http://lucene.apache.org/nutch/

[12]http://htmlparser.sourceforge.net

[13]孙承杰,关毅.基于统计的网页正文信息抽取方法的研究[J].中文信息学报,2004(5)

[14]李效东,顾毓清.基于DOM的Web信息提取[J].计算机学报,2002(5)

[15]卓国锋.基于中介器/包装器的动态信息集成研究[D].重庆大学,2006

[16]http://lucene.sourceforge.net

【注释】

(1)作者简介:胡昌平(1946—),男,教授,博士生导师;陈果(1986—),男,硕士在读,研究方向为信息集成服务、信息检索。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈