位置:成都中公优就业IT培训机构 > 学校动态 > 怎样掌握聚类基本概念技巧
以下是小编为大家整理大数据知识点怎样掌握聚类基本概念技巧的内容。
聚类(Clustering)就是一种寻找数据之间内在结构的技术。
聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。
处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。
聚类技术通常又被称为无监督学习,与监督学习不同的是
在簇中那些表示数据类别的分类或者分组信息是没有的。
数据之间的相似性是通过定义一个距离或者相似性系数来判别的。
显示了一个按照数据对象之间的距离进行聚类的示例,距离相近的数据对象被划分为一个簇。
聚类分析可以应用在数据预处理过程中
对于复杂结构的多维数据可以通过聚类分析的方法对数据进行聚集,使复杂结构数据标准化。
聚类分析还可以用来发现数据项之间的依赖关系,从而去除或合并有密切依赖关系的数据项。
聚类分析也可以为某些数据挖掘方法(如关联规则、粗糙集方法),提供预处理功能。
在商业上,聚类分析是细分市场的有效工具,被用来发现不同的客户群
并且它通过对不同的客户群的特征的刻画,被用于研究消费者行为,寻找新的潜在市场。
在生物上,聚类分析被用来对动植物和基因进行分类,以获取对种群固有结构的认识。
在保险行业上,聚类分析可以通过平均消费来鉴定汽车保险单持有者的分组
同时可以根据住宅类型、价值、地理位置来鉴定城市的房产分组。
在互联网应用上,聚类分析被用来在网上进行文档归类。
聚类分析通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征
从而帮助电子商务企业了解自己的客户,向客户提供更合适的服务。
尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/3178/news/215867/违者必究! 以上就是成都中公优就业IT培训机构 小编为您整理 怎样掌握聚类基本概念技巧的全部内容。