1、粗糙集理论
粗糙集理论(RoughSetTheory,RST)是PawlakZ.及其合作者于1982年提出的一种处理模糊性和不**问题的新型数学工具。它的*大特点是不需要提供求解问题时所需处理的数据集合之外的任何先验信息,如统计中要求的先验概率和模糊集中要求的隶属度,即能有效地分析和处理不**、不一致、不完整等各种不完备数据,并从中发现隐含的知识,揭示潜在的规律。
1.1粗糙集的上、下近似集
在RST中,用等价关系代替分类,设U≠Φ是论域,R为U上的一族等价关系,二元对K=(U,R)构成一个近似空间(Approximationspace)。R将论域U分成一族等价类Ei(i=1,…,n),Ei和空集Φ称为R的基本集。如果U上的一个子集X不能用基本集的并集准确表示出来,则称X为粗糙集,粗糙集是用上近似集和下近似集两个**集来描述的,其数学定义如下:
其中x为U中的一个对象,[x]R表示所有与x不可分辨的对象组成的集合,即由x决定的等价类。实际上R_(X)是U中包含在X中的*大可定义集,R-(X)是U中包含在X中的*小可定义集。
1.2决策表
信息系统IS(InformationSystem)可表示为IS=〈U,A,Va,fa〉,其中U是对象的非空有限集合,称为论域;A是对象属性的非空有限集合,称为属性集合;Va=∪a∈AVaa是属性值的集合,Vaa表示属性a∈A的值域;f:U×A→Va称为信息函数。信息系统也称为知识表达系统。由这样的“属性—值”对就构成了一张二维表,称之为信息表(Informationtable)。
如果A由条件属性C和结论属性D组成,且C,D满足:
C∪D=A,C∩D=ø
则称IS为决策系统(DecisionSystem,简称DS)。
实际使用时,决策系统一般表示成一张决策表(Decsiontable)的形式,每一列表示一个属性,每一行表示一个对象。
例1:假设一个由7个对象的简单决策系统,有4个条件属性c1,c2,c3,c4,一个决策属性d,如表1所示:
1.3决策表的化简及分类规则的提取
决策表中的一个属性对应一个等价关系,一个决策表可看作是定义的一族等价关系。决策表中并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原有的表达效果。决策表的化简就是化简表中多余的条件属性,即去除冗余的条件属性,在删除这些属性后不会影响原有的表达效果,化简后的决策表具有更少的条件属性但具有化简前的决策表的功能。
决策表的简化步骤如下:
(1)删除条件属性集合的冗余属性,找到所有约简。首先定义决策规则的协调性:相同的规则前代(即属性部)必然有相同的后继(即结论部);不同的规则前代允许有不同或者相同的后继;相同的后继允许相同或不同的前代。判断某一个条件属性冗余或可省的准则是:若去掉条件属性集中某属性后,算法中所有规则仍然协调,则该属性冗余而可省去;若有一个规则不协调,则该属性不可省。同理,依次单独去掉其他条件属性来考察规则的协调与否,去掉所有冗余条件属性。例如逐一除去表1中条件属性c1,c2,c3,c4,看看没有该列决策表是否协调。检查后发现c3是多余的,而c1,c2,c4是必需的属性。{c1,c2,c4}称为原条件属性集{c1,c2,c3,c4}的一约简。一个决策表的条件属性集可能存在多个约简。本例中只有一个,见表2。
苏公网安备 32020202000206号