主动三支聚类


主动三支聚类

为了使得谱聚类的类簇划分更为清晰, 充分表达出数据对象的不确定性,本章借助三支决策的思想,将确定性的数据对象 划分到相应类的核心域,而具有不确定性的对象划分到相应类的边缘域,待进一步的决策。对于主动学习而言,借助于核心域,可以通过成对约束的传递性获取更多 的成对约束信息。通过边缘域来刻画数据的不确定性,可以极大地缩小主动学习对不确定性数据的搜索空间。

初始化核心域和边界域

对于多类别数据的聚类问题,位于类边缘的数据对象往往比类中心对象含有更多的信息量。对于多类别数据的聚类问题,位于类边缘的数据对象往往要比类中心对象含 有更多的信息量。因此在本章中,我们采用最远优先的遍历方法 (farthest-first traversal scheme)选择类边缘对象来构造 K 个初始核心域,然后借助于三支决策的思想对每个类的核心域和边缘域分别进行扩展。由此,得到一个更符合实际的聚类结果表示。


文章作者: 大杯柠檬加冰
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 大杯柠檬加冰 !
  目录