软计算原理与实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 基于粗糙集的不确定知识表示方法

传统的知识表示模型对知识的描述是确定、清晰的,即被描述的对象具有或不具有某种属性是明确的。然而,在现实世界中,人们常常要在领域信息不完整、不确定、不精确的前提下完成对事物的认识、分析、推理、判断、预测和决策。这种智能行为往往要求人们对未知的信息进行估计、推测,对不完整数据进行分析、处理,对已知的证据进行分辨、扬弃。

粗糙集理论是1982年由Z.Pawlak提出的一种刻画不完整性和不确定性的数学理论,它从新的角度对知识进行了定义,把知识看作关于论域的划分,从而认为知识是有粒度的,知识的不精确性是组成论域知识的颗粒太大引起的。粗糙集理论的主要特点之一是它仅利用数据本身所提供的信息,不需要任何附加信息或先验知识,从这个角度来说它比证据理论、模糊集理论、统计学等更为方便,它是一种有效地分析和处理不确定知识的新的数学工具。文献[3]中基于粗糙集理论,定义了用于知识表示的特征集和原子概念,并在此基础上提出了一种基于粗糙集理论的知识表示特征集模型[4]

3.2.1 知识、划分与等价关系

知识在不同的范畴内有多种不同的含义。在粗糙集理论中,知识被认为是一种对对象进行分类的能力。

定义1:设UΦ是人们感兴趣的对象组成的有限集合,称为论域。任何子集XU,称为U中的一个概念或范畴。空集也被认为是一个概念。U中的一族概念就称为关于U的知识。

定义2:设UΦ是论域,C={X1,X2,…,Xn},使得XiUXiΦXiXj=Φ,对iji,j=1,2,…,n,且,则称C为一个划分。Xi称为划分C的一个等价类。U上的一族划分称为关于U的一个知识库。U上的一个划分与其上的一个等价关系是等价的。每一个等价关系描述的是论域U上的某一个属性,即属性亦可看作一个等价关系。

3.2.2 信息表、不可分辨关系和基本集

一个知识表示系统S可表示为S=<U,At,Val,f >,U是论域,At是属性集,Val=∪a∈AtVala是属性值的集合,f:U×At→Val是一个信息函数,它指定U中每一对象的属性值。由这样的属性−值对就构成了一张表,称为信息表。有时,针对某类问题,At=CDCD分别称为条件属性和决策属性,此时称信息表为决策表。

不可分辨关系是粗糙集理论中一个十分重要的概念,它是一族等价关系集合的最细划分,该关系中的每一个等价类不能由原等价关系族的任一等价类再细分,称之为基本集合。不可分辨关系揭示了知识的颗粒状结构,基本集就是组成论域知识的颗粒。

3.2.3 粗糙集的下近似、上近似及边界区

给定一个有限的非空集U,称为论域,RU上的一族等价关系。RU划分为互不相交的基本等价类,二元对K=(U,R)构成一个近似空间。

定义3:设UΦ是论域,XUωU中的一个对象,[ω]R表示所有与ω不可分辨的对象组成的集合,即由ω决定的等价类。当集合X能表示成基本等价类组成的并集时,称集合X是可精确定义的;否则,集合X只能通过逼近的方式来刻画。

集合X关于R的下近似:

集合X关于R的上近似:

集合X的边界区:

R_(X)实际上是那些根据已有知识判断肯定属于X的对象所组成的最大集合,亦称X的正域,记作POS(X)。由根据已有知识判断肯定不属于X的对象所组成的集合称为X的负域,记作NEG(X)。

R¯(X)是那些可能属于X的对象所组成的最小集合。显然,R¯(X)+NEG(X)=U

Bn(X)为集合X的上、下近似之差。如Bn(X)=Φ,则称X关于R是清晰的;反之,如Bn(X)≠Φ,则称集合X是关于R的粗糙集。

3.2.4 知识表示特征集模型

知识表示系统的基本成分是研究对象的集合,关于这些对象的知识是通过指定对象的属性及其属性值来描述的。把这种描述对象的属性−值对看成对象所具有的某种特征。

定义4:设UΦ是论域,Ω ={ω1,ω2,…,ωm}是对象集,ΩUΩ中任何对象所具有的特征所组成的集合称为特征集T={τ1,τ2,…,τn}。这些特征可由如下的属性−值对表示:τ=(a,v),a∈At,v∈Val。由特征集构成的表称为特征表。

对于任一对象ωΩ,如ω可由τ描述,则这种关系可表示为(ω,τ)∈ΓΓ表示特征关系。于是得到:

定义5:在论域U中,已知一特征集T,对于每个τT满足下式:

则称[τ]为τ特征集。

同理,非τ特征集[]可定义如下:

利用[τ]和[]可构造如下原子集:

称[α0],[α1],…,[αN]为原子概念,所有原子概念集称为概念空间C。事实上,每个原子概念都是一种布尔表示的等价类,在同一等价类中所有对象都是不可区分的,这些等价类共同形成了对论域U的划分。原子概念是信息系统知识表示的最基本范畴,或者说是构成知识的最小“颗粒”。很显然,颗粒越细,知识表示越清晰;反之,颗粒越粗,知识表示越粗糙。

根据粗糙集理论对于知识的定义,可以用原子集/原子概念来对知识AU进行描述和表达:若A可由一族原子概念精确描述,即A可表示成原子集的并集,则A是确定性知识,是可精确定义的;反之,A是不确定性知识,只能粗糙定义。显然,由于原子集对U的划分不可能是无限的,知识表达的最小单元(颗粒)肯定存在,因此,概念空间的表达能力是有限的,在一定前提下,可用原子集对知识进行精确表示,得到确定性知识。而更多的情况下,我们不得不面对不确定性知识表达的问题。对于不能用原子集精确表示的不确定性知识,采用逼近的方式来描述,即使用两个精确集——上近似和下近似来表示。知识A的下近似、上近似分别表示如下:

由此可得:

(1)若A_=A¯,则称A可用原子集精确定义,即A是确定性知识。

(2)若A_≠A¯,则称A不能用原子集精确定义,即A是不确定性知识。对不确定性知识A的描述又可分为四种情况:

① 若A_≠Φ,且A¯≠U,则称A为粗糙可定义的;

② 若A_=Φ,且A¯≠U,则称A为内不可定义的;

③ 若A_≠Φ,且A¯=U,则称A为外不可定义的;

④ 若A_=Φ,且A¯=U,则称A为完全不可定义的。

3.2.5 讨论

知识的精确表达是相对的,是在一定范畴和一定前提条件下的。选取的特征集不同,就可以得到不同的原子概念,故确定的知识可能变为不确定的知识,不确定的知识亦可能变为确定的知识。特征集的大小变化可导致原子概念的规模发生变化,同样可使确定的知识和不确定的知识相互转变。