支持向量机优化基于K-means的蚁群聚类算法
支持向量机[6-7]SVM是在统计学理论的VC维理论和结构风险最小化原理的基础上发展起来的一种新的机器学习方法。它的基本思想是将输入空间通过一种非线性变换映射到一个高维的特征空间,然后在这个新的高维特征空间中求解原始问题的最优解[8-9]。
3.2 使用SVM优化K-means 蚁群聚类算法
K-means蚁群聚类算法继承了蚁群算法的优势,且从距离的角度更明了地反映了蚂蚁与巢的归属关系,摒弃了蚁群算法随机的判断条件,使聚类有合理的理论支撑,聚类效果得到提高。但是,K-means算法本身也存在缺点,源于其收敛准则主观设定,聚类过程中心重复计算更新,使各类中心附近的数据能找到最优归属,而离类中心较远的数据因误差累积效应找到最佳归类的性能减弱,从而使聚类结果达到局部最优,影响聚类的效果。
SVM的强适应性、全局最优性等优点弥补了K-means算法的不足。在已聚出类结果的基础之上再引入支持向量机,对所聚类结果以类中心为基准选取适当数据训练支持向量机,利用获取的模型对整个数据集进行重新测试与分类,从而使得聚类结果达到全局最优。
4 实验及结果分析
4.1 实验平台、数据集及度量标准
实验平台:PC配置:Pentium 4,2.4 GHz CPU,512 MB内存;Windows XP操作系统;使用VC算法编写。数据集采用UCI公共数据库提供的数据集Iris、Breast-cancer 和KDDCUP。
聚类性能评价采用了参考文献[10]中介绍的F-measure方法。F-measure组合了信息检索中查准率(precision)和查全率(recall)的思想。一个聚类 j 相对于分类i的 precision和recall定义为:

从图1可知当Pdel≤0.06 时,聚类总数平均值越来
参考文献[11]中说明数据集Iris用于聚类时可作两类处理。从表1可知,与AntClust相比较,KM-AntClust获得更好的聚类效果,其F-measure平均值均比AntClust的高,最高达到了0.988 722;聚类总数也越接近数据集原始分类。而SVM-KMAntClust使得聚类效果得到了进一步提高,其F-measure平均值均比前两种算法的高,有的甚至能全部正确分类,F-measure平均值为1,聚类总数与数据集原始分类数相差甚小。
本文对蚁群聚类算法进行研究后,首先提出一种新的K-means蚁群聚类算法(KM-AntClust),使用K-means算法改进蚁群聚类算法规则,解决了AntClust存在的聚类判断条件随机的问题,提高了聚类效果。受K-means算法局部最优限制,为获取更佳聚类效果,本文在KM-AntClust聚类结果基础上引入支持向量机SVM,选取适当数据训练SVM分类机,然后利用已获模型对整个数据集进行重新分类,充分发挥SVM的强适应性和全局最优性,使得聚类结果达到全局最优。AntClust与K-means算法结合继承了AntClust的优点,同时保证了类的稳定性;AntClust与SVM结合使聚类效果全局最优时也扩大了SVM的应用领域。实验结果表明,三者相结合聚类质量得到了进一步的提高。
参考文献
[1] QUEEN J M.Some methods for classification and analysis of multivariate observations[C].Proc. of the 5th Berkeley Symp.On Math Statist,1967:281-297.
[2] KAUFMAN J,ROUSSEEUW P J.Finding groups in data:an introduction to cluster analysis[M].New York:John Wiley & Sons,1990.
[3] LABROCHE N,MONMARCHE N,VENTURINI G.A new clustering algorithm based on the chemical recognition system of ants[C].Proc of 15th European Conference on Artificial Intelligence(ECAI 2002),Lyon FRANCE,2002:345-349.
[4] LABROCHE N,MONMARCHE N,VENTURINI G.Web sessions clustering with artificial ants colonies[EB/OL].(2002-02)[2006-01-12].
[5] LABROCHE N,MONMARCHE N,VENTURINI G.AntClust:ant clustering and Web usage mining[C].GECCO 2003:25-36.
[6] VAPNIK V.The nature of statistical learning theory[M]. New York:Springer-Verlag,1995.
[7] CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995(20):273-297.
[8] 白亮,老松杨,胡艳丽.支持向量机训练算法比较研究[J].计算机工程与应用,2005,41(17):79-84.
[9] 沈翠华,刘广利,邓乃扬.一种改进的支持向量分类方法及其应用[J].计算机工程,2005,31(8):153-154.
[10] YANG Y,KAMEI M.Clustering ensemble using swarm intelligence[C].IEEE SWRFB intelligence symposium. Piscataway,NJ:IEEE service center,2003:65271.大电流电感
基于Wave Panel的HID设备通讯接口设计 4月08日 第三届·无线通信技术研讨会 立即报名 12月04日 2015•第二届中国IoT大会 精彩回顾 10月30日ETF•智能硬件开发技术培训会 精彩回顾 10月23日ETF•第三届 消费
锂离子电池智能充电器硬件的设计锂离子电池具有较高的能量重量和能量体积比,无记忆效应,可重复充电次数多,使用寿命长,价格也越来越低。一个良好的充电器可使电池具有较长的寿命。利用C8051F310单片机设计的智
设计完板子不知道背景求教最近在写写一篇论文设计了一个电路buck型DC-DC 的开关电源24v直流转化成5V 1A直流的实际背景有哪些?希望大神们求教什么意思呢?就是说我这个电路在哪可以应用上我把24v转成5v