2.1 形式背景预处理
形式背景中可能会存在许多冗余信息,为了更加清晰简洁地进行描述和进行相关运算,需要对形式背景进行简化和处理,去除冗余信息,便于后续的分析和属性拓扑的生成。
在形式背景中,如果,满足,,则集合A内任意对象之间互为等价对象。相对地,如果,满足,,则集合B内任意属性之间互为等价属性。
在形式背景中,若满足的任意两个对象均有,同时任意满足的属性,都有,则为净化背景。在净化背景中,不存在等价对象和等价属性。
在预处理过程中,首先将背景简化为净化背景。等价对象之间具有相同的属性信息,等价属性之间具有相同的对象信息,将互为等价对象的各个对象组合成一个对象,相应地,将互为等价属性的各个属性组合为一个属性,不会影响概念的生成和概念格的结构。
在形式背景中,若,满足,则称对象u为空对象,即空对象不具有任何属性,对应地,空属性指不具有任何对象的属性。空对象和空属性不包含计算所需的有用信息,并且与其他属性或对象均不存在关联,即独立于其他属性和对象存在。
如果,满足,则该对象称为全局对象,即全局对象具有所有的属性,对应地,如果所有的对象都具有某一属性,则属性m为全局属性。全局对象(或属性)包含了形式背景中存在的所有的属性(或对象)信息,所有其他对象(或属性)均作为其子集存在,即全局对象(属性)和其他对象(或属性)相比,不具有用于区分的属性(对象)信息,是可约简的。从概念格构造的角度来看,以全局对象为外延的概念和以全局属性为内涵的概念只可能存在于概念格的顶层和底层,而不会对其他的概念顶点及其格结构产生影响。
在净化背景的基础上去除空属性、空对象、全局属性和全局对象,即完成了形式背景的预处理过程。整个预处理过程去除了冗余信息,保留了分析计算所需的全部有效信息,对概念的生成和计算、概念格的构造没有影响,便于属性拓扑的生成。
表2-1展示了一个预处理后的形式背景,其包含了具有区分特性的所有属性和对象。若没有特殊说明,则本书中提到的所有形式背景均为预处理后的形式背景。
表2-1 预处理后的形式背景示例