利用粗集发现并获取知识,经常要在保持知识库初等范畴的情况下消去冗余基本范畴,进行知识化简。这用到简化(纪如⑷⑽)和核(⑶比),包括等价关系(知识〉的简化与核以及范畴的简化与核。
令尸和0为"中的等价关系,0的尸正域为1108,(0当戶和0为"中的等价关系族且满足⑴))(卜⑷( ))时,称?尸为0中0可省略的,否则/'为?中0不可省略的。当尸中每一个厂都是0不可省略时,称广为独立的;当5为广的4独立子族且满足!(⑴ 押?(⑴时,称5〔尸为尸的I?简化,记为比\ (尸〕。尸所有0不可省略原始关系族为尸的0核,记为⑶阳9 ( ),并且有⑶巧( ) 0 (户〉。
设卩 II,毛,…,义丨为一集合族,其中毛再给定一集合V且门尸27,则当门(尸-|毛丨)时,称毛为 '中7可省略的;反之,为不可省略的。当集合族且6中所有分量均为V不可省略时,称6为7独立的;反之,称6为7依赖的。当孖。尸为7独立的且门孖则称好为尸的7简化,记为此时,定义0。?(尸) 0 (厂)为厂的7核。
决策表是一类特殊且重要的知识表达系统,形式表达为?' 〈I 4 0,0’
6 ,其中0,00 分别为其条件属性集和决策属性集。对于每个16 "和每个将函数 定义为:尤: ( )(幻并将其成为7'中的决策规则。如果当4对于6和5具有相等的约束,亦即火I 0 I 时,恒有尤I 0= 1 0,则称4是相容的,否则是不相容的;当7'中所有规则是相容的,则7'是相容的,否则不相容。依赖度( )的决策表7'都可唯一地分解为相容表7\ 二〈V、,4,0,0,7,土〉和不相容表乙 〈172,4,0,0,、0,使得( ), 4 = 1 ?(尤)且I6 ⑷。
为了使上述流程叙述更易理解,我们将基于粗集理论的知识获取流程描述为如图4-13所示。基于115理论的知识获取首先需要将组织内大量的业务数据进行预处理,如空值处理、属性对齐与连续属性离散化等操作,然后将预处理后的数据 4'13基于—知识获取流程表达成决策表的形式。在实际操作中,决策表表
现为二维表格,每一行描述一个对象,每一列描
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:省略,决策,简化,相容,知识