《现代电子技术》2006年第24期摘录:2006年第24期总第239设
-
如发现有乱码,请点击下面链接浏览原文
正文摘录:
2006年第24期总第239设置的参数敏感。但当增加距离阈值和数量阈值时,在除噪方面性能将降低。计算时间与聚类对象个数”有关,与聚类个数走无关。计算复杂度为o(nlog”),其中。为数据库中对象数。该法在发现任意形状的簇以及处理大型数据库和去除有噪方面比较有效。图3DSBCAN聚类结果在自组织映射实验中,首先利用函数initsm对竞争网络进行初始化,然后用函数tral’nsm对其进行训练。训练过程中将显示频率取为每50步显示一次,最大训练步数为15000步,学习率为0.5。竞争层训练完成之后,就可以用来对输入矢量进行分类。神经元2有一个输出1,神经元1和神经元3分别有输出O.5。神经元2为获胜神经元,神经元1,3与神经元2相邻。此输入样本P的聚类结果如图4所示。图4自组织映射网络得到的聚类结果在实验中发现,神经网络的最大训练步数,学习率及神经元数对神经网络有很大的影响,并影响神经网络应用扩展。神经网络聚类方法与脑处理具有较强的理论联系。但由于存在较长处理时间和复杂数据中复杂关系问题,还需要做更多研究才能使这类方法适合处理大数据库。3结语聚类是根据数据对象的不同特征,将其划分为不同的数据类或簇的过程邱。。他的目的是使得属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体之间的距离尽可能的大。作为统计学、机器学习、数据挖掘、模式识别等学科的一类重要技术,聚类已经在许多问题上得到了广泛的应用,如基因分类、web文档分类等。通常,聚类分析可作为一个独立的工具来获得数据分布的情况,通过观察每个簇的特点;集中对特定的某些簇再做进一步的分析。在这个意义上,聚类分析还可作为其他分析(如特征提取和分类)的预处理步骤。神经网络的聚类方法需要较长的处理时间和复杂的数据复杂性,所以不适用于大型数据的聚类。自组织特征映射算法是一种无教师示教的聚类方法,他能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变,即在无教师示教的情况下,通过对输入模式的自组织学习,在竞争层将分类结果表示出来。此外,网络通过对输入模式的反复学习,可以使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接矢量空间分布反映输入模式的统计特征。参考文献[1]左爱群,杜波.数据仓库技术研究及其在银行的应用[J].武汉工业学院学报,2006,25(1):15—18.[2]牛玉廷.数据仓库技术初探[J].仪器仪表用户,2005,12(6):148~149,152.[3]倪步喜,章丽芙,姚敏.基于s0FM网络的聚类分析[J].计算机工程与设计,2006,27(15):855—856,878.[4]白耀辉,陈明。利用自组织特征映射神经网络进行可视化聚类[J].计算机仿真,2()06,23(1):180—183.[5]朱福珍,吴斌.s0FM网络及其在Matlab中的实现[J].微计算机信息,2005(35):163—165.[6]JiaweiHan、Kichelin<jKamber。数据挖掘概念与技术[M].范明,盂小峰,译.北京:机械工业出版社,2001.作者简介林金山男,1971年出生,福建莆田人,就职于莆田学院电子信息工程系,大学讲师,2004年厦门大学计算机科学系研究生。主要研究方向为计算机情报学、智能网络。林敏女,1980年出生,福建莆田人,就职于莆田学院电子信息工程系,大学助教,2004年厦门大学计算机科学系研究生。主要研究方向为人工智能。
阅读此文(图):
点击此处在线翻阅