《中国人工智能学会通讯》——12.45 k-modes 型算法的类中心表示与收 敛性分析

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.45节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.45 k-modes 型算法的类中心表示与收 敛性分析

目前分类型数据的类中心表示方式有单值和多值两种。1998 年,Huang [4] 提出了 k-modes 算法,用 modes 来表示类中心,选择出现频率最高的值代表类,强调主流的属性值代表类,其他值为噪音,是典型的单值表示方式。单值表示方式由于简单易实现且聚类优化模型有很好的数学性质,保证了求解算法的收敛性,但它并不能充分刻画类的特性。San et al [17] 提出了多值表示类的方式,并应用于分类型数据的聚类。在该方法中,类是由每个属性上所有属性值来表示,并通过属性值在类内出现频率作为权值反映它对该类的代表能力,强调所有的值都对类有代表性,仅仅是代表能力不同。Kim et al [18] 将其扩展,提出了模糊 modes,并将其用于模糊 k-modes聚类算法。Lee 和 Pedrycz 提出了一种通用的多值类表示方式[19] ,类是由每个属性上属性值频率较高的前几个值来表示,通过属性值在类内出现频率作为权值反映它对该类的代表能力,强调部分的值被用于代表类,其他值为噪;其他基于频率的类中心表示方式都可以看作该方法的特例。

多值代表方法克服了单值代表方法的缺点,但却带来聚类算法的迭代收敛性无法保证,同时现有聚类优化算法仅在多值类表示方式退化为单值类表示方式时,才能保证算法的收敛性。为了解决这一问题,Bai et al [20] 研究了类的表示方式与聚类优化算法的收敛性关系,分析了现有多值类代表的聚类优化算法不能收敛的原因,构建了基于正则项的聚类优化模型,从根本上解决了多值类表示 k-modes型聚类算法的收敛性问题。

相关文章
|
2月前
|
机器学习/深度学习 算法
【优选算法】—— 滑动窗口类问题
【优选算法】—— 滑动窗口类问题
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习算法:探索人工智能的前沿
深度学习算法:探索人工智能的前沿
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
未来十年人工智能在医疗行业的应用前景分析
随着人工智能技术的不断发展,医疗行业也迎来了巨大变革。本文将探讨未来十年内人工智能在医疗领域的应用前景,从诊断辅助、个性化治疗到医疗大数据分析等方面进行深入分析。
|
4天前
|
机器学习/深度学习 存储 人工智能
【人工智能】机器学习算法综述及常见算法详解
【人工智能】机器学习算法综述及常见算法详解
|
10天前
|
机器学习/深度学习 人工智能 算法
【AI 初识】描述遗传算法概念
【5月更文挑战第2天】【AI 初识】描述遗传算法概念
|
10天前
|
机器学习/深度学习 存储 人工智能
【AI 初识】人工智能中使用了哪些不同的搜索算法?
【5月更文挑战第2天】【AI 初识】人工智能中使用了哪些不同的搜索算法?
|
11天前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在医疗影像分析中的应用
【5月更文挑战第1天】随着人工智能技术的飞速发展,其在医疗领域的应用日益广泛,尤其是在医疗影像分析方面。本文将深入探讨人工智能在医疗影像分析中的关键技术、应用现状以及未来发展趋势,以期为相关领域的研究者和实践者提供有益的参考。
|
14天前
|
机器学习/深度学习 人工智能 运维
人工智能平台PAI 操作报错合集之请问Alink的算法中的序列异常检测组件,是对数据进行分组后分别在每个组中执行异常检测,而不是将数据看作时序数据进行异常检测吧
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
15天前
|
机器学习/深度学习 数据采集 人工智能
【热门话题】AI作画算法原理解析
本文解析了AI作画算法的原理,介绍了基于机器学习和深度学习的CNNs及GANs在艺术创作中的应用。从数据预处理到模型训练、优化,再到风格迁移、图像合成等实际应用,阐述了AI如何生成艺术作品。同时,文章指出未来发展中面临的版权、伦理等问题,强调理解这些算法对于探索艺术新境地的重要性。
30 3
|
16天前
|
机器学习/深度学习 人工智能 算法
详解AI作画算法原理
AI作画算法运用深度学习和生成对抗网络(GAN),通过学习大量艺术作品,模拟艺术家风格。卷积神经网络(CNN)提取图像特征,GAN中的生成器和判别器通过对抗训练生成艺术图像。循环神经网络和注意力机制可提升作品质量。这种技术开创了艺术创作新途径。