首页 理论教育 条件下的协同创新与知识转化研究_数字化信息服务研

条件下的协同创新与知识转化研究_数字化信息服务研

时间:2022-07-03 理论教育 版权反馈
【摘要】:条件下的协同创新与知识转化研究_数字化信息服务研Wiki条件下的协同创新与知识转化研究陆泉 胡慧丽 李湘东[摘 要]Wiki作为一种新的协作系统技术,为学术交流提供了一种全新的模式。本文主要探讨在Wiki条件下的专家团队的系统特征的基础上,领域专家群体进行学术交流活动的协同创新理论与知识转化模型。Wiki以其自身协同知识创作优势给知识的管理与创新机制注入了新的活力。

条件下的协同创新与知识转化研究_数字化信息服务研

Wiki条件下的协同创新与知识转化研究(1)

陆泉 胡慧丽 李湘

(武汉大学信息资源研究中心武汉430072)

[摘 要]Wiki作为一种新的协作系统技术,为学术交流提供了一种全新的模式。本文对Wiki条件下的协同创新这种新的科学研究模式作一个系统学分析,阐明了其协同创新的复杂学原理,进而给出了Wiki条件下知识转化的SECI模型。

[关键词]Wiki 领域专家 协同创新 知识转化(www.guayunfan.com)

Synergetic Innovation and Knowledge Transform Based on Wiki

Lu Quan Hu Huili Li Xiangdong

(Center for Studies of Information Resources of Wuhan University,Wuhan,430072)

[Abstract]Wiki provides a bran-new mode for academic exchange of domain expert in a certain field。This paper analyzes this new scientific research mode on Wiki from systematology point of view,clarifies its complexity principle of synergetic innovation,and presents the SECI model of knowledge transform based on Wiki.

[Keywords]Wiki Domain Expert Synergetic Innovation Knowledge Transform

Wiki作为一种新的协作系统技术的应用受到越来越广泛的关注,利用Wiki网络条件下的“头脑风暴法”用于学术研究,这对国内信息管理领域在开展学术研究的过程与方式上是一种创新。本文主要探讨在Wiki条件下的专家团队的系统特征的基础上,领域专家群体进行学术交流活动的协同创新理论与知识转化模型。

1 关于Wiki

1.1 Wiki的基本介绍

Wiki(中文为维基,英文来源于wee kee wee kee,即快点快点之意)是继网络Blog之后出现的一种供群体用户信息交流与共享的新型服务工具。它是一种超文本系统,支持面向社群的协作式写作,同时还包括一组支持这种协作的辅助工具。

Wiki具有“群体互动、共同进行文档写作;保持站点信息内容的修改、达到高度统一性与相关性;保证信息的开放性、完整性、充分性;支持知识与信息的转化、扩展与创新;管理上的可控性”等独特功能。[1]Wiki的成果是一个不断完善的知识库,享用这个知识库的人要比为这个知识库作贡献的人多得多。开放、合作、平等、共创、共享是Wiki的精髓。作为一种社会性软件,Wiki在提供知识共享的同时,不断促进、激发知识创新。与BBS、BLOG等其他超文本系统相比,Wiki更能体现群体的共同参与性,体现社区共享式网络文化。正是有了群体的参与,才能为具有不同观点、不同见解的人提供“头脑风暴”式的创造新知识的环境。

1.2 国内外研究现状

国外关于Wiki的理论研究主要集中于对Wiki的概念体系、技术、引擎版本、功能特征、与Web2.0工具的比较研究,以及社会影响等方面。当前,语义Wiki是国外的研究热点。有人提出建立扩展的语义MediaWiki,旨在将Wiki应用于更加宽广的领域。

国内方面,对Wiki的关注是从英文维基百科(http://en.wikipedia.org)开始的。2002年10月中文维基百科(http://zh.wikipedia.org)开通,主要从华人的视角,撰写关于中国的地理、历史、文化方面的条目。2003年10月21日Wikipedia中文正式定名为维基百科,《中国电脑教育报》的《我也来写百科全书》一文对其做了介绍。2004年7月25日在北京大学举行了中文维基人的第一次非正式聚会。到2004年9月6日中文维基百科已经突破条目1.3万个。一些Wiki项目正在开发,如:新浪网的万家姓维客计划,旨在打造一个完整、准确并具开放性的中华姓氏大全:http://cn.netor.com/ wjx;中国W3C标准研究组织W3C文档翻译计划:http://wiki.w3china.org;记录南开大学历史、人物、特色等的南开维基:http://bbs.nankai.edu.cn/wiki;中科院国家科学数字图书馆项目管理:http://159.226.100.132/pmwiki/pmwiki.php,等等。

2 Wiki条件下的专家团队的系统分析

Wiki以其具备的开放性和协作性为专家团队的学术交流提供了一种全新的模式。任何人都可以对Wiki中的内容进行编辑和管理,对共同的写作主题进行修改、扩展或者探讨。在支持社群协作式写作的同时,达到群体之间分享、交互、创造知识的目的。同一维客网站的写作者自然就构成了一个社群(专家系统),维客系统为该社群提供简单的交流工具。Wiki以其自身协同知识创作优势给知识的管理与创新机制注入了新的活力。一般认为通过Wiki社群(专家团队)成员可以共同协作进行新知识的创造和知识共享。[2]

2.1 Wiki条件下的专家团队系统的分析

作为一个抽象系统来看,Wiki条件下的专家团队系统是以领域专家作为基本单元与活动个体;领域专家之间可能有稳定或松散的联系,因而形成动态或大或小的子系统(子团队);所有领域专家以及他们所在的子系统通过Wiki环境共同构成一个宏观的领域专家Wiki团队系统。这个系统通过Wiki平台可以实现,如图1所示。

图1 Wiki条件下的专家团队系统

2.2 Wiki条件下的专家团队系统特征分析

Wiki条件下的专家团队系统具有复杂适应系统的几个基本特征。

首先,主体(领域专家)是主动的、活的实体。这点是复杂适应系统和其他系统模型的关键性的区别。Wiki条件下的专家团队系统的知识创新和知识转移的根本动力是所有领域专家。

其次,在这个系统模型中,个体与环境(包括个体之间)的相互影响、相互作用,是系统演变和进化的主要动力。即Wiki条件下的专家团队系统主要的创造力来自于领域专家通过Wiki不断表述、讨论、修正、启发的过程。这个特点使得Wiki条件下的专家团队知识能够运用于本身属性极不相同(学术观点、学术流派等),但是相互关系(学术联系、Wiki环境)的个体来产生许多宏观一致(达到共识)和涌现行为(集体创新)。

第三,Wiki条件下的专家团队系统把宏观和微观有机地联系起来。它通过主体和环境的相互作用,使得个体的变化成为整个系统的变化的基础,统一地加以考察。通过领域专家和Wiki的相互作用,领域专家提出的新问题、新思想、新观点等能迅速有效地为整个领域的专家所评论和关注,通过Wiki的相互作用,产生有效的知识转化和知识创新,进而体现在本领域发展的宏观层面上。

通过以上分析,结合Pierre[3]和陆泉[4]对复杂适应系统的研究,我们发现:Wiki条件下的专家团队系统是一个具有促进领域专家知识从无序(混沌)转化为有序(规则)特征的复杂适应系统。“复杂适应系统”(或复杂自适应系统,Complex Adaptive Systems,CAS)[5]这一名词是由J.Holland 1994年正式提出的。复杂适应系统(CAS)理论把系统的成员看做是具有自身目的与主动性的积极的主体。主体能够与环境以及其他主体进行交流,在这种交流的过程中“学习”或“积累经验”,并且根据学到的经验改变自身的结构和行为方式。整个系统因此而产生演变或进化,包括新层次的产生、分化和多样性的出现或新的、聚合而成的、更大的主体的出现,等等。

复杂适应系统具有一些共性。这些共性对进一步研究Wiki条件下的专家团队系统的协同创新与知识转化问题有重要意义。根据目前了解的情况,这类共性有三种:①非均匀性,比如基本单元分布的非均匀性,它们之间相互作用的非均匀性,在时间演化中表现的不可逆性;②非线性性,这是基本单元之间的相互作用产生的,从而导致系统在各种条件下可能存在无序(混沌)和有序(规则)的解,也就引发了无序与有序之间转化的问题;③网络性,复杂适应系统在结构上具有网络性,复杂网络研究结果表明,复杂系统所构成的网络往往具有小世界性质和(或)无标度性质,这种网络的构成由确定和随机两种因素决定。

3 Wiki条件下的专家团队系统协同创新原理分析

由于Wiki条件下的专家团队系统是一个具有促进领域专家知识从无序(混沌)转化为有序(规则)特征的复杂适应系统,这样一个系统的协同创新原理必然符合复杂适应系统的有关基本规律。

3.1 从复杂适应系统的角度对协同创新原理进行的分析

复杂学和人工生命研究认为混沌的边缘是生命与智能的起源。20世纪80年代,斯蒂芬·沃弗拉姆对细胞自动机(CA)做了全面的研究(1984)。他将细胞自动机分成四种类型:类型Ⅰ,CA演化到一个均质的状态;类型Ⅱ,CA演化到周期性循环的模式;类型Ⅲ,CA的行为变成混沌,没有明显的周期性呈现,并且后续的模式表现为随机的,随着时间的变化,没有内在的或持续的结构;类型IV,CA的行为呈现出没有明显周期的复杂模式,但是,展现出局域化的和持续的结构,特别是,其中有些结构具有通过CA的网格传播的能力。[6]虽然类型Ⅲ的CA产生了丰富的模式,但是,那里没有突现的行为,就是说,没有连贯、持久的、超出单一细胞层次的结构出现。在类型IV的CA中,确实发现了突现的行为:从纯粹局部相互作用的规则中突现出秩序。

克里斯·兰顿进一步研究发现类型IV的局域化的结构可以通过网格传播。兰顿推测,在类型IV中,传播结构的存在意味着局域化的周期性结构和传播性的周期结构之间可能有任意复杂的相互作用。[7]兰顿因此把类型IV的CA看做是表达了部分发展了的混沌行为,并因此把具有这种行为状态的CA称为处于“混沌边缘”(edge of chaos)的CA。在混沌的边缘,既有足够的稳定性来存储信息,又有足够的流动性来传递信息,这种稳定性和流动性使得计算成为可能。在此基础上,兰顿认为生命或者智能就起源于混沌的边缘。兰顿还构造了一些具体的第四类CA来验证其观点,它们非常像“真实的”生命的一些方面。

在脑部的生物组织和生理反应及其数学特征方面,Haken[8]、郭爱克[9]、Spangler[10]、唐延林[11]等人做了大量的研究,指出脑部智能的产生具有符合自组织临界[12]和混沌边缘的特征。郭爱克在他的《计算神经科学》中综合了关于人脑神经系统的研究,指出脑部具有稳定解与不稳定解、周期性与混沌性、临界振荡、临界涨落和临界慢化等特征性质,并进而探讨了人脑中的思维的起源,认为人脑在生物特性上是一个复杂适应系统。他提出应该研究人脑的“灵感”和“顿悟”行为,并指出这些行为体现出了混沌边缘特性和自组织临界特性。

在认知科学的研究中,人脑的“灵感”和“顿悟”具有混沌边缘特征的典型例子是图2的从人脸到女孩问题。

图2 从人脸到女孩问题[13]

如图2所示,分二行自左到右排列着八个小图。第一小图为人脸,逐步做些修改,至第八小图已变成女孩。当一张脸从左向右逐步演化到某一临界点时,被人们感知为一位少女。事实上,除头尾两小图外,其余各小图都有人脸和女孩的成分。此图中八个小图是离散的逐步演变的。但是这个特定的例子导致了一次必然的有序—混沌—有序的过程。由此可以看出协同与混沌的边缘理论有着非常相近的观点,即在原有认识的基础上通过对某一问题的共同协作讨论进而产生新的认识。正如郭爱克在《生命与思维——在混沌的边缘演化》中提出:自组织和达尔文过程将思维推向“混沌的边缘”和“自组织临界状态”,意识、灵感就产生在混沌的边缘。

3.2 在Wiki条件下协同创新原理的应用

马费成在《论情报学的基本原理及理论体系构建》一文中指出:利用频次—等级导出的布拉德福分布与通过对数透视原理导出的感知信息量具有相同的数学表达式。[14]本文认为,信息、知识和情报系统是复杂系统的一种,情报学的离散分布原理、有序性原理、小世界原理和对数透视原理只是信息、知识和情报复杂系统的混沌边缘特性与自组织临界特性在某一宏观角度的反映。

在“混沌的边缘是智能起源”这样一个结论下,由于如何从工程上实现“混沌的边缘”仍然是一个未解难题[15],即不可能由计算机系统完全自动地实现知识创造,所以Wiki条件下的专家团队系统试图在Wiki环境中实现网络氛围下的“头脑风暴”法,提供了一种良好的混沌边缘环境条件,从网络环境下领域专家思维整理的显性化过程,到共同编辑、反复讨论、逐步明确的创新过程,促进领域专家团队知识在混沌边缘不断循环上升,从而实现持续的和最大化的团队知识创新能力。通过Wiki内部链接的形式整合各个知识条目,形成宏观意义上的大知识库。[16]这种通过内部链接将领域专家团队所创造的知识凝聚成系统化、集成化、有序化的知识并被所有领域专家用户认识从而指导科研实践。在Wiki条件下的专家团队系统通过不断引导领域专家团队知识从混沌状态向有序状态转化来最大化领域专家团队的知识创新。

4 Wiki条件下知识转化的SECI模型

4.1 知识转化的原理

知识根据表现形式的不同可以分为显性知识和隐性知识两类,显性知识是指容易表达的、有物质载体的、可确知的知识,它可以通过个体之间正常的语言方式进行传播;而隐性知识是指隐含的经验类知识,它存在于个体的头脑中或者组织的结构文化中,很难用语言进行准确描述,不易被他人学习利用。[17]显性知识与隐性知识的划分不是绝对孤立和静止的,而是以一种互动的螺旋上升的形式相互转化,不断地创造新知识。在日本学者野中郁次郎提出的知识的“四种螺旋转化”的SECI模型中,知识转移由隐性知识的社会化、隐性知识的外化、显性知识的融合、显性知识的内化等四个阶段构成。也就是说,知识的吸收直到创造在大部分情况下是通过显性知识和隐性知识之间的相互转化而进行的。

4.2 Wiki条件下专家团队的知识转化

在现实中隐性知识的难以描述性成为知识转移过程的障碍,使群体知识的有效共享和隐性知识的充分显化依然难以实现[18],从而形成“知识孤岛”。传统的解决方法是通过编码化、面对面交流、人员轮换等途径将隐性知识转化为易于传播的显性知识,进而实现知识共享与创新。但是由于这些方法往往要耗费很多人力、物力,因此并不是实现知识转化的最佳途径。而Wiki符合隐性知识与显性知识之间不断转化和上升的原理,它为隐性知识向显性知识之间的相互转化提供了先进的技术和平台。由于Wiki系统支持多种格式的文件类型,而且操作简单,因而知识创造群体中的每个个体都可随时根据需要在Wiki平台上通过发布图片、动画、录像等方式将那些难以用文字或语言表述的隐性知识形象地表现出来,使其他个体能够更加直观地了解和学习这些知识,实现隐性知识的显性化。[19]Wiki群体通过自我组织,对知识进行了重新的定位和排列组合,进行了知识创新,并为知识的传播和发展做出了重大的贡献。Wiki就是通过螺旋式上升创新,进行信息与知识的相互转化,最后实现了新的知识库。

4.3 Wiki条件下的知识转化的SECI模型

我们可以描述出Wiki条件下知识转化的SECI模型,如图3所示。

图3 Wiki条件下知识转化的SECI模型

(1)个体隐性知识转化为个体显性知识

这是个人知识外化的过程。在Wiki条件下的专家团队知识系统中,每个个体都可利用Wiki提供的各种图片和动画将自己对研究主题的想法记录在Wiki上,还可以随时在自己原有记录的基础上进行不断补充和修改,Wiki会自动将更新的页面保存下来。通过一段时间后,一些成熟的观点会慢慢在这些记录片断中呈现出来,这些成熟的观点往往就是隐含在个体头脑中难以表述的知识。因此,Wiki不仅充分挖掘出了个人的隐性知识,还使它们具备了一定的逻辑性,能够较为容易地转化为显性知识,同时也为其他个体学习和利用这些知识提供了更加直观、快捷的途径,从而提高了知识形式转化的效率。

(2)个人显性知识融合为群体知识

这实际上是个人显性知识的积累融合过程。个体通过第一阶段的个人隐性知识到显性知识的转化后,会对彼此的知识结构有充分的了解和认识。在此基础上,对团队内某个领域的知识有共同兴趣的个体会通过Wiki平台逐渐聚拢到一起,形成一个社群,然后对该知识领域的问题进行共同探讨。在讨论的过程中,每个社群成员都可以就共同关心的话题提出自己的观点,而其他人则可以随时通过编辑、修改Wiki页面中的内容来对别人发布的这些显性知识观点进行外延式或内涵式的补充和完善,直到将同一主题论述得很充分、很深入,最终能够在整个社群内达成共识,形成完整的知识成果。在此过程中,每个社群成员的显性知识经过简单的融合就转化为群体隐性知识,经过不断汇聚和有机融合,这些隐性知识转化为群体共享的显性知识,同时还促进了新知识的产生,达到了知识共享1+1>2的效果。而团队内若干个社群的显性知识经过系统中知识主管(CKO)的进一步整理、提升,最终转化为整个系统的显性知识。

(3)群体显性知识转化为个人隐性知识

这是显性知识的内化过程。当个体显性知识转化为群体显性知识后就成为整个团队的共享资源,其他个体可以通过登录Wiki站点对这些共享知识进行浏览,还可以通过站内搜索引擎直接查询所需的知识。个体在获取了群体显性知识后,经过自己的不断学习、体会和实践,逐渐将这些知识运用到个人的研究当中,成为自己的技巧和诀窍,使群体显性知识转化为个人的隐性知识,同时也使自己的知识体系得到了进一步完善。

(4)群体隐性知识转化为群体显性知识

这是群体知识外化的过程。当群体的隐性知识达到一定状态,并通过Wiki的知识共享平台共同编辑、反复讨论,逐步明确,这一过程能够促进群体隐性知识向群体显性知识的外化,使那些隐含在群体中难以表述的知识逐渐外化。

经过上述几个阶段的知识形式转化后,专家团队便实现了在Wiki条件下的知识转化。随后个体会利用自己在Wiki平台下所获取的隐性知识来解决学术研究中碰到的问题,而在运用这些隐性知识的同时,个体结合自己的知识会产生新的想法,进而可以继续将这些新的想法通过Wiki平台表述出来,使个人隐性知识又转化为了个人显性知识,从而开始了新一轮的知识转化过程,这是基于Wiki平台上的一个“螺旋式上升”的知识转化过程。

每个领域专家团队都可以通过Wiki平台进行相互的信息和知识交流,实现“头脑风暴”式的专家团队之间知识的吸收、理解、消化以及创新。基于Wiki的信息管理领域专家学术研究共享与创新服务系统实现了领域专家群体隐性知识与显性知识有效集成的知识共享,知识创新个体之间不存在彼此的竞争关系,而是一种知识协同创新的共享模式。同时,这种网络氛围下的“头脑风暴”法,不仅优化了知识的良性积累和创新过程,更重要的是有效地促进了知识管理领域的研究从感性向完善理论体系方向发展。

5 结 语

Wiki在教育领域、企业知识管理以及医学领域的应用越来越广泛,但对于Wiki在知识创造、知识创新、知识管理、知识共享等深层次的理论研究与系统开发尚属空白。本文对Wiki条件下的专家团队这种全新的协同创新的科学研究模式作一个系统学分析,认为Wiki条件下的专家团队系统是一个具有促进领域专家知识从无序(混沌)转化为有序(规则)特征的复杂适应系统,阐明了其协同创新的复杂学原理即“混沌的边缘是智能起源”,进而给出了Wiki条件下知识转化的SECI模型,为“基于Wiki的信息管理领域专家学术研究共享与创新服务系统”的研发做了理论准备。

参考文献

[1]武琳.Web2.0时代信息交流模式分析[J].情报杂志,2006(3):10-12

[2]陈立华.Wiki:网络时代协同工作与知识共享的平台[J].中国信息导报,2005(1):51-54

[3]Pierre Marcenac.Modeling MultiAgent Systems as Self-organized Critical Systems[J].1060-3425198 IEEE(1998)

[4][15]Lu Quan.Co-evolution of Agents in Self-organized Criticality[J].The Second IEEE International Conference on Services Systems and Services Management,2005(6):996-999

[5]Waldrop,M.M..Complexity:The Emerging Science at the Edge of Order and Chaos[M].New York: Simon&Schuster,1992

[6]Wolfram,S..Universality and Complexity in Cellular Automata[J].Physical D,1984(10):1-35

[7]Langton,C.G..Studying Artificial Life with Cellular Automata[J].Physical D,1986(10):120-149

[8]Haken H..Principles of Brain Functioning:A Synergetic Approach to Brain Activity,Behavior and Cognition[M].Heidelberg:Springer,1996

[9]郭爱克.计算神经科学[M].上海:上海科技教育出版社,2000

[10]Spangler William E.,Peters James M..A Model of Distributed Knowledge and Action in Complex Systems[J].Decision Support Systems,2001,31(5):103-120

[11]唐延林.脑活动的自组织特征研究[J].贵州大学学报(自然科学版),2005(5),Vol.19 No.2:115-118

[12]Bak P.,Tang C.,Wisenfield K..Self-organized Criticality[J].Physical Review A,1988,38(1): 364-374

[13]郭爱克等.生命与思维——在混沌的边缘演化[J].科技导报,1998(1):13-17

[14]马费成.论情报学的基本原理及理论体系构建[J].情报学报,2007,26(1):3-13

[16]Eyal Oren,John G.Breslin,Stefan Decker.How Semantics Make Better Wikis[J].Proceedings of the 15th International Conference on World Wide Web,2006:1071-1072

[17][19]李纲等.基于Wiki的组织内部知识共享[J].江西社会科学,2006(7):50-53

[18]马捷等.知识转化模型分析与评价[J].情报科学,2006,24(3):355-360

基于语义网格的个性化信息推荐框架研究(2)

孙雨生 董慧(3)

(武汉大学信息资源研究中心武汉430072)

[摘 要]本文针对现行个性化信息推荐中存在的精度不高、智能性差、方式单一、推荐规模与质量相矛盾、推荐受众与信息来源比较固定等缺陷,分析互联网、语义网、网格技术解决个性化信息推荐问题的局限性。以此为基础,提出基于语义网格的个性化信息推荐总体框架,并讨论了其体系结构及运行机制,初步形成分布、异构、海量信息环境下的大规模、高精度个性化信息推荐解决方案

[关键词]语义网格 个性化信息推荐

Research on Personalized Information Recommendation Framework Based on Semantic Grid

Sun Yusheng Dong Hui

(Center for Studies of Information Resources of Wuhan University,Wuhan 430072)

[Abstract]In this article,the authors analyzed the drawbacks existing in the current personalized information recommendation.It included low accuracy,poor intelligence,single recommendation way,the contradiction between recommended scale and quality,fixed recommendation audience and information sources,and so on.Then the authors analyzed the limitations of the Internet,Semantic Web and grid technology in addressing these problems.On this basis,the authors provided the overall framework of personalized information recommendation based on the semantic grid,discussed its architecture and operational mechanism,and preliminary shaped the large-scale,high-precision personalized information recommendation solutions in the distributed,heterogeneous,massive information environment.

[Keywords]Semantic Grid Personalized Information Recommendation

1 引 言

随着互联网的发展,用户面临的信息环境发生了根本性改变:由信息匮乏变为信息过载,由单一集中式信息系统变为分布式、异构信息环境。这样,就出现了一系列问题:一是“信息过载”问题,由于现行信息服务手段和技术的相对滞后,主要是现行信息服务多为大众化服务,无法提供“一对一”个性化信息服务,导致用户在互联网环境下只能通过人工干预的方式获取其真正需要的信息,处理负荷较重;二是分布异构问题,信息资源分布存储和软硬件、信息资源等方面的异构问题导致计算资源、信息资源、服务资源等无法有效共享和充分利用,致使资源闲置和资源匮乏的现象并存,这在很大程度上制约了分布式环境下信息服务的质量和效率;三是检索效率问题,现行信息检索主要以关键词匹配为主,其检索精度无法令人满意,究其原因,主要是计算机无法理解关键词包含的语义信息,导致检索结果中出现大量不相关信息。同时,现有检索机制多是用户检索一次,就遍历一次所有信息资源,这种信息处理模式很难适应分布环境下的信息处理要求,主要是其需要进行大规模的检索请求转换、请求分发和结果整合等工作,这使检索的时效性受到影响,而且现实中很多信息系统可能根本就没有用户所需要的信息,因此,这种检索机制本身存在缺陷,导致很多不必要的信息检索。在这种情况下,如何实现分布、异构、海量信息环境下各种资源的互联互通和有效利用,如何提高网络环境下信息服务的精度和个性化程度,如何在分布式、异构信息环境下预先筛选符合用户需求的信息资源集合,在用户提出检索请求时只对候选资源进行检索,以实现信息分流和高效检索就成为当前信息服务中亟待解决的问题。

语义网格技术的出现为该问题的解决提供了一种解决途径和基础平台,其整合语义Web和网格技术的优势,可以实现分布式、异构信息环境下资源的充分共享和有效利用,并具备高智能性和强计算力。具体而言,其通过对分布各处的数字信息资源和用户、超级计算机的数值计算能力和信息系统的数据处理及发布能力进行整合,对异构平台、不同格式、不同语义的信息资源进行规范和转换,对网格环境下的网格服务、信息服务进行个性化集成和智能化管理,最终形成以用户为中心、高智能性的信息服务环境和管理机制[1][2],这为分布式、异构信息环境下的个性化信息服务,尤其是个性化信息推荐提供了良好的基础平台,同时为用户需求驱动的信息资源建设和个性化信息服务整合提供了一种实现可能。

本文将语义网格技术引入到个性化信息推荐领域,通过研究现行个性化信息推荐中存在的问题以及互联网、语义网、网格技术解决这些问题的局限性,提出基于语义网格的个性化信息推荐框架,并研究了其体系结构和运行机制,初步形成分布、异构、海量信息环境下的大规模、高精度、个性化信息推荐解决方案。

2 个性化信息推荐与语义网格技术

2.1 个性化信息推荐及其问题分析

2.1.1 个性化信息推荐

所谓个性化信息推荐实际上是一种个性化信息服务模式,其根据获取到的用户个性化信息(包括明确的用户信息需求、兴趣或行为模式)主动组织信息资源,构建个性化信息环境,并向用户推荐其感兴趣的信息、产品和服务,如热点链接、动态链接生成、文件预取、信息推送、信息提醒、产品推荐、查询重构策略推荐等。一般来说,个性化信息推荐系统的好坏取决于三个方面:一是推荐信息的针对性,好的推荐系统能够及时了解并实时跟踪用户的偏好、兴趣和需求,为其提供“一对一”的个性化信息服务;二是推荐信息的时效性,好的推荐系统在面对大量的客户推荐请求时,能够保证信息推荐的时效性,实现及时的、适当的信息反馈;三是推荐的智能性和准确性,好的推荐系统能够保证数据传送的准确性和权威性,提供高度智能化的推荐功能。

目前,关于个性化信息推荐的研究和应用主要集中在电子商务领域,并在大型电子商务企业、网站中得到了不同程度的应用,比如亚马逊公司、当当网等。按照推荐对象的不同,个性化信息推荐系统分为网页推荐系统和产品推荐系统两种:前者主要采用Web挖掘技术分析用户兴趣,向用户推荐其感兴趣的网页链接;后者即电子商务推荐系统,主要在网络环境下为用户推荐其感兴趣的产品,包括有形产品和“无形”产品,比如音乐,电影等。现行推荐技术主要包括协同推荐、基于关联规则的推荐、基于内容的推荐、基于用户统计的推荐、基于效用的推荐和基于知识的推荐等。[3]

2.1.2 个性化信息推荐问题分析

随着信息环境的变化和信息技术的进步,现行个性化信息推荐技术面临着巨大的挑战。

(1)分布、异构信息环境下的个性化信息推荐问题

现行个性化信息推荐系统和技术主要是针对固定用户群体和特定信息系统而言的,并不适用于分布式、异构信息环境下的大规模个性化信息推荐。如何实现分布式、异构信息环境下信息系统的互联互通,如何基于此环境进行用户偏好信息获取,并设计相应的推荐算法,如何扩大推荐规模同时保证推荐的实时性均是亟待解决的问题。

(2)推荐质量问题

用户偏好信息获取和推荐算法设计始终是个性化信息推荐的两大核心技术,但是现行个性化信息推荐技术主要以关键词为主,缺乏语义支持,致使计算机无法准确理解用户偏好以及信息资源中所包含的语义信息,同时每种推荐算法都或多或少有着各种各样的缺陷,而所有这些均会影响到个性化信息推荐系统的推荐质量,致使推荐结果中往往会出现一些用户并不感兴趣的信息。

(3)实时性问题

实时性和推荐精度是个性化信息推荐系统的一对主要矛盾,大部分推荐技术以牺牲推荐系统的质量来保证实时性,毕竟用户的耐心是有限的,这在搜索引擎中得到了充分的印证。因此,如何在分布、异构信息环境下保证大规模个性化信息推荐的实时性就显得至关重要。

(4)多种数据、多种推荐方法的集成问题

当前大多数个性化信息推荐系统的推荐方法比较单一,而且多数只利用一部分可用信息进行推荐。随着研究的深入,新型个性化信息推荐系统应该利用尽可能多的信息来提高推荐质量,并动态集成多种推荐技术来形成针对不同应用情形的推荐策略,以满足用户的个性化需求。[4]

2.1.3 现行技术解决个性化信息推荐问题的局限性

(1)互联网环境下的个性化信息推荐

互联网环境下的个性化信息推荐主要是针对特定网站和固定用户群、采用Web挖掘技术进行Web资源推荐,由于缺乏本体技术以及分布式计算技术的有效支持,其在用户个性化需求的准确获取,分布式、异构信息环境下异构信息系统的有效整合,计算能力的充分获取、推荐方法个性化集成等方面存在诸多不足,致使推荐的规模、精度、实时性、智能性等均难以得到保证。

(2)语义Web环境下的个性化信息推荐

为了提高网络处理的智能性,使计算机能够准确理解关键词所包含的语义信息,人们提出语义Web解决方案,通过构建本体来精确描述客观世界的概念等级体系以及概念之间的复杂关系,最终使计算机能够像人一样具备思考问题、解决问题的能力。基于语义Web的个性化信息推荐在准确获取用户偏好信息及保证推荐结果的精度上具有明显优势,但由于其缺乏有效的分布式计算技术支持,在计算能力的有效获取、异构信息系统的整合等方面存在不足,这在很大程度上影响了个性化信息推荐的规模性和实时性。

(3)网格技术环境下的个性化信息推荐

网格技术是新近出现的一种分布式计算基础设施,其目标是使人们能够像用电一样使用计算资源,核心是实现分布、异构环境下所有资源的互联互通和有效利用,同时提供高效的计算服务和信息服务。按照不同分类标准,网格可以分为计算网格、数据网格、信息网格、知识网格、服务网格、语义网格等,从目前进展情况来看,其在计算力充分共享和有效利用方面取得了比较理想的效果,因此,基于网格的个性化信息推荐在推荐规模和实时性上具有明显优势,但随着网格技术的发展,人们认识到目前的网格技术与预期目标仍有比较大的差距,主要原因是其缺乏语义支持,致使智能性不够理想,这也在很大程度上影响到个性化信息推荐的精度和智能性。

2.2 语义网格技术

2.2.1 语义网格

语义网格最早由英国工程与物理科学委员会及工贸部于2001年6月提出,当时,一些致力于语义Web、网格和软件代理研究的科技人员发现网格的现有努力和e-Science设想之间存在差距,要达到e-Science的易用性和无缝自动化要求,必须实现尽量多的机器可处理性和尽量少的人类介入,这和语义Web的目标有些相似。因此,研究人员将语义Web技术引入到现有的网格研究中,通过形式化语义描述,使计算机能像人类一样充分理解信息的语义,从而进行自动化信息处理,克服传统网络中信息格式异构、信息语义多重性以及信息关系匮乏和非统一性等问题,提高现有网格的智能性。其最终目的是充分利用语义Web中计算机可以理解的语义,并结合网格强大的计算能力,使不同国家、不同机构、不同学科的研究人员能够共享远程科学设备、交换信息和知识,通过联合的实验环境,跨越异构、分布的信息障碍,实现资源共享与全球协作。[5][6]

2.2.2 语义网格与个性化信息推荐

语义网格将语义Web原理及方法应用到网格技术上,利用本体技术来形式化描述网格信息,使网格具备高智能性,以便其自动进行信息处理,同时利用“服务”来屏蔽资源异构性,实现分布式环境下资源的充分共享和有效利用,因此,语义网格是分布、异构信息环境下实施大规模、高精度、个性化信息推荐的理想平台,其本身具备的强大计算能力和信息服务能力为分布、异构信息环境下个性化信息推荐的规模性和实时性提供根本保证,同时,语义Web技术的应用又为分布、异构信息环境下用户偏好信息的准确获取、满足用户需求的服务智能发现与组合、个性化的信息推荐方式集成等提供强大支持。

3 基于语义网格的个性化信息推荐框架及运行机制

3.1 总体框架

基于语义网格的个性化信息推荐实际上是以语义网格为基础平台,利用语义网格提供的高效计算和信息服务能力解决分布、异构环境下个性化信息推荐的大规模和实时性问题;利用语义网格提供的语义处理能力解决分布、异构信息环境下用户偏好信息的精确获取、网格服务的智能管理、候选网格节点的自动筛选与维护以及推荐服务的个性化集成等问题;利用语义网格监控技术解决候选网格节点的实时信息获取问题,最终形成分布、异构信息环境下以用户为中心的一站式个性化信息推荐解决方案,其逻辑框架如图1所示。具体而言,整个框架由基于语义网格的个性化信息推荐门户、个性化信息推荐平台和个性化信息推荐系统数据库三大部分组成。当然,还包括大量用于底层信息资源建设和服务提供的网格节点。

图1 基于语义网格的个性化信息推荐总体框架[7]

3.1.1 个性化信息推荐门户

个性化信息推荐门户是进入推荐系统的唯一入口,其用户包括管理员、服务提供者、领域专家和普通用户四类,主要负责采集各种背景信息(如项目信息、网格节点信息、用户信息、用户对项目评分、用户行为记录(如浏览历史、购买记录)等),响应用户推荐请求,向用户展示推荐结果,收集用户反馈。同时,分析收集到的背景信息,进行用户特征、项目关联规则和兴趣相似用户等方面的挖掘。既可以直接将收集到的背景信息、知识等存入相应系统数据库中供推荐平台使用,又可以将挖掘出来的信息交给信息推荐平台,由其对相关数据库信息进行更新,比如用户模型库、推荐场景库、推荐模型库、领域知识本体库等[8],此外,网格管理员可以通过门户进行平台维护和服务管理,服务提供者可以通过门户对其提供的服务进行维护,领域专家可以通过门户进行领域本体知识库、推荐模型库等系统数据库的维护工作,当然,这些工作均是在推荐平台的辅助下完成。

3.1.2 个性化信息推荐平台

个性化信息推荐平台主要负责推荐任务分解、推荐算法求解、推荐任务具体处理及结果整合、网格节点监控与管理等。在接收到用户推荐请求后,推荐平台调用推荐场景库、候选网格节点库、推荐模型库、领域本体知识库中的相关信息,分析推荐问题场景,将用户的推荐请求转化为可以直接由各种推荐算法按照客观评判准则求解的问题,并确定进行推荐处理的候选网格节点,即动态根据用户特征和推荐场景进行推荐算法组合,为用户形成一个“客观数据集”平台;然后,结合推荐平台监控到的各候选网格节点实时信息进行信息推荐处理与结果整合,并将最终推荐结果返回给信息推荐门户。此外,推荐平台还需根据监控到的实时信息进行候选网格节点库维护,并通过为用户做出推荐,接收用户反馈信息等方法持续修正其对用户特征的判断,丰富推荐场景、推荐模型等方面的信息,并将这些信息、知识储存在相关系统数据库中,供后续推荐使用。

3.1.3个性化信息推荐系统数据库

基于语义网格的个性化信息推荐系统数据库包括用户模型库、推荐场景库、推荐模型库、领域知识本体库、候选网格节点库和网格节点基本信息库。其中,用户模型库存放系统注册用户的特征模型,包括一些个人基本信息、个人偏好信息,是系统为每个用户构建好的、可以直接调用的推荐模型;推荐场景库存放当前系统能够实现的不同推荐场景信息,为推荐平台按照场景分解推荐任务提供信息;推荐模型库存放各种可用的推荐算法,各种推荐算法组合方式的知识等,为推荐算法求解提供信息;领域本体知识库主要存放用户兴趣本体、网格服务本体、推荐算法等方面的语义化知识信息,为信息推荐平台自动进行个性化的服务发现与组合、用户兴趣信息的准确获取、个性化信息推荐算法集成等提供信息;候选网格节点数据库主要存放能够满足不同推荐情形、不同用户偏好需求的候选网格节点集合信息,由语义网格平台预先根据推荐情景和用户兴趣模型自动获得,供推荐使用,主要目的是提高信息推荐的时效性;网格节点基本信息库主要存放关于网格节点、各网格节点待推荐项目、用户对项目评分情况等推荐系统所依凭的基本数据集,作为推荐平台筛选候选网格节点的依据。

3.2 体系结构

基于语义网格的个性化信息推荐系统体系结构分为资源层、语义网格平台层、个性化信息推荐层和用户交互层四层,具体如图2所示。其中资源层分为系统数据库和网格节点集合两大部分,前者用于为语义网格平台和个性化信息推荐层提供信息支持,后者主要进行底层信息资源建设,同时将各个网格节点所提供的服务在语义网格平台进行注册,网格节点本身可以是单一实体资源,也可以是虚拟资源集合,即其可以由多个子网格节点组成;语义网格平台主要进行网格平台的安全管理、网格节点的监控与维护、候选网格节点库的维护和管理、网格服务智能管理等工作,同时为个性化信息推荐层提供支持,即执行推荐任务处理和根据用户反馈更新相关系统数据库信息;个性化信息推荐层主要借助系统数据库中的相关信息以及语义网格平台提供的候选网格节点实时信息进行推荐任务分解及推荐策略制定,同时利用挖掘技术对用户交互层采集到的相关信息进行挖掘,并及时更新系统数据库中的相应信息,比如通过挖掘用户访问历史数据来完善用户模型库、根据挖掘得到的领域知识进行领域本体知识库的信息更新等;用户交互层体现为个性化信息推荐门户,直接与用户进行交流,主要负责相关背景信息收集、用户推荐请求接收、推荐结果显示和用户反馈接收等工作。

图2 基于语义网格的个性化信息推荐体系结构

3.3 运行机制

基于语义网格的个性化信息推荐主要实现收集用户信息、分析与完善用户偏好、提供推荐项目和接收用户反馈信息四项功能,主要为注册和非注册两类用户提供通用推荐、基于用户访问历史的推荐和动态个性化信息推荐三种推荐服务,整个推荐流程分为项目评分和一般推荐两部分,其中,项目评分用于协同推荐,一般推荐流程分为用户提出推荐请求、具体推荐和用户反馈三个环节。[9]推荐系统并不对项目评分和注册作硬性要求,但不为非注册用户提供项目评分服务,以防其利用网络机器人恶意进行项目评分。

整体推荐流程为:用户登录到推荐门户,系统根据用户类型为其提供推荐服务,对于未注册用户,只提供通用推荐服务,跟踪用户行为以获取相关信息,并将其存入相关系统数据库,以提高通用推荐服务质量;对于首次登录推荐门户的注册用户则提示其完善个人偏好信息,并对项目进行评分,对于未完善个人偏好信息的用户,系统只提供通用推荐服务,否则,系统根据用户填写的信息修改该用户的用户模型,并提供动态个性化信息推荐;对于老用户而言,其登录推荐门户后,系统提示其进行项目评分,但不做强制要求,同时为其提供基于访问历史的推荐和动态个性化信息推荐两种服务,前者根据用户偏好信息和推荐平台监控到的实时信息,利用挖掘技术所发现的兴趣相似用户、关联规则等信息将相关最新信息推荐给用户,后者则将用户推荐请求转交给推荐平台,在领域知识本体库、推荐场景库、推荐模型库、候选网格节点库、用户模型库、网格平台监控到的候选网格节点实时信息等的支持下,针对候选网格节点为用户提供推荐服务,并进行用户兴趣与信息资源语义相似度计算,形成最终推荐结果返回给前台推荐门户,最后,推荐平台根据用户反馈对用户模型库、推荐场景库等进行完善,以供后续推荐使用。此外,整个推荐过程均在领域本体知识库、候选网格节点实时监控信息等的支持下进行,以确保整个推荐的规模性、实时性和高精度。

4 结束语

综上所述,基于语义网格的个性化信息推荐主要实现海量、分布式、异构信息环境下的大规模、高精度、个性化信息推荐,其通过本体技术精确获取用户偏好信息,由网格环境预先筛选满足用户信息需求的候选网格节点,用户提出信息请求后,由网格监控机制根据候选网格节点的实时信息确定最优的几个网格节点进行信息检索,并对检索结果按照与用户需求的相关程度进行个性化信息推荐。此外,各网格节点管理本地信息资源,并发布其可提供的服务,网格监控机制实时监控各网格节点情况,进行候选网格节点的维护工作。

参考文献

[1]毕强,韩毅,朱亚玲.国外基于网格技术的数字图书馆结构体系比较研究[J].情报学报,2006,25(3):330-336

[2]秦永平,裴斌,汪群山等.基于信息网格的炮兵子网研究[J].计算机工程与设计,2007,28(19):4677-4679

[3]张娜.电子商务环境下的个性化信息推荐服务及应用研究[D].合肥工业大学,2007

[4]陈冬林,聂规划,刘平峰.知识网格与电子商务智能推荐理论研究[J].情报杂志,2007(4): 33-35

[5]朱亚玲,毕强.语义网格探微[J].情报理论与实践,2006,29(6):742-745

[6]崔兴全.基于语义网格的邮件过滤系统研究与应用[D].兰州大学,2007

[7][8]颜端武.面向知识服务的智能推荐系统研究[D].南京理工大学,2007

[9]王宏宇.商务推荐系统的设计研究[D].中国科学技术大学,2007

【注释】

(1)本文系国家社会科学基金项目07BTQ012的成果之一。

(2)本文系教育部人文社会科学重点研究基地重大项目“数字图书馆网格应用模型研究”(项目编号:05JJD870004)的研究成果之一。

(3)孙雨生(1980—),男,博士研究生,研究方向:信息系统工程,电子商务技术,电子政务技术;董慧,武汉大学信息管理学院教授、博士生导师,主要从事信息系统工程、数字图书馆技术、电子商务技术教学和研究工作。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈