首页 理论教育 粗糙集理论的数学表达

粗糙集理论的数学表达

时间:2022-03-02 理论教育 版权反馈
【摘要】:在粗糙集理论中[80],认为知识具有对对象进行分类的能力,对象用其属性集合表示,论域U上的划分可以用表征这些划分的等价关系集合R来形式化地分类。知识库表达了论域U上的一种基本分类方式。为了描述知识的确定程度,粗糙集理论引入了“上近似”、“下近似”的概念。知识约简是粗糙集理论的核心内容之一。属性的重要程度可用来衡量。其中B′B是属性集C导出的划分的属性子集。

4.1.2 粗糙集理论的数学表达

4.1.2.1 粗糙集的数学表达

在粗糙集理论中[80],认为知识具有对对象进行分类的能力,对象用其属性集合(称为论域U)表示,论域U上的划分可以用表征这些划分的等价关系集合R来形式化地分类。这样,知识就可理解为:使用等价关系集R对论域U进行划分,划分的结果或导出的规则就是知识,用U/R表示。由此,在U与R的意义下引出知识库的定义:属于R中所有可能的关系对U 的划分,记为K=(U,R)。知识库表达了论域U上的一种基本分类方式。

在论域U的划分中,如果一个等价关系集合对某些数据的划分存在矛盾,将导致不确定划分。为了描述知识的确定程度,粗糙集理论引入了“上近似”、“下近似”的概念。设对于每个子集X∈U和一个等价关系R对U的划分为U/R,那么称

R_(X )=∪{Y ∈UR∶Y∶X }(4-1)

R- (X )=∪{Y∈U/R∶Y∩X≠ }(4-2)

为X 的下近似和上近似;称posR(X)=R_(X)为X的R正域,negR(X)=U-R_(X)为X的R负域,bnR(X)=R-(X)-R_(X)为X的R边界域。显而易见,正域就是那些对于知识R、U中能完全确定地归入集合X 对象的集合;负域是那些对于知识R、U中能完全确定不属于集合X 对象的集合;边界域是论域U上的不确定域。

4.1.2.2 知识的约简

知识约简是粗糙集理论的核心内容之一。众所周知,知识库中知识(属性)并不是同等重要的,甚至其中某些知识是冗余的。所谓知识约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识[81]。知识约简中有两个基本概念:约简(reduct)和核(core)。

设有一等价关系族R={P、Q },则交集P∩Q也是一等价关系,并且是R上不可分辨的等价关系,记为ind(R)。而Q的P正域记为

posP(Q)=∪X∈U/QP_(X)(4-3)

另设一等价关系S ,其划分为U/S ,如果pos(R-P)(S)≠posR(S),那么称P是R中S 不可省略的,否则称P是R中S可省略的;称R中S不可省略的等价关系的集合为R中的S约简。

4.1.2.3 知识的依赖性及其度量

设K=(U,R)为论域U上的知识库,P、Q∈R,如果ind(P)∈ind(Q),就称知识Q依赖于知识P,其依赖的程度可表示为

rP(Q)=card(posP(Q))/card(U)(4-4)

式中:rP(Q)为知识Q依赖于知识P的度量,card为求集合基数的运算符号。

当rP(Q)=1时,Q完全由P导出,也即完全依赖于P;当0<rP(Q)<1时,Q可由P部分导出;当rP(Q)=0 时,Q完全不依赖于P。

4.1.2.4 知识的重要程度

为了确定某些知识或属性(知识往往与论域的特征属性相对应)的重要程度,需要考察去掉这些属性后论域U上的划分会如何变化。如果去掉这些属性会相应地改变划分,则说明这些属性强度大,重要性高;反之,强度小,重要性低。属性的重要程度可用

e(B′)=rB(C)-r(B-B′)(C)(4-5)

来衡量。其中B′B是属性集C导出的划分的属性子集。e值越大,说明B′对C的划分影响程度越高,B′的重要性越大;如果e=0,则说明该属性子集(或属性)的去掉不会改变原有的划分,因此它可以从知识库中的属性集中去掉。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈