全国服务热线:400-035-8011

位置:成都中公优就业IT培训机构 > 学校动态 > 分类算法的基本概念有哪些

分类算法的基本概念有哪些

来源:成都中公优就业IT培训机构时间:2020/7/11 10:41:37

  以下是小编为大家整理大数据知识点分类算法的基本概念有哪些的内容。

      分类算法反映的是如何找出同类事物的共同性质的特征型知识和不同事物之间的差异性特征知识。

       分类是通过有指导的学习训练建立分类模型,并使用模型对未知分类的实例进行分类。

     分类输出属性是离散的、无序的。

  分类技术在很多领域都有应用。当前,市场营销的很重要的一个特点就是强调客户细分。

分类算法的基本概念有哪些

       采用数据挖掘中的分类技术,可以将客户分成不同的类别。

  例如,可以通过客户分类构造一个分类模型来对银行贷款进行风险评估

     设计呼叫中心时可以把客户分为呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他

      来帮助呼叫中心寻找出这些不同种类客户之间的特征

      这样的分类模型可以让用户了解不同行为类别客户的分布特征。

  其他分类应用还有文献检索和搜索引擎中的自动文本分类技术,安全领域的基于分类技术的入侵检测等。

  分类就是通过对已有数据集(训练集)的学习,得到一个目标函数 f(模型)

       来把每个属性集 X 映射到目标属性 y(类)上(y 必须是离散的)。

  分类过程是一个两步的过程:步是模型建立阶段,或者称为训练阶段,第二步是评估阶段。

  1)训练阶段

  训练阶段的目的是描述预先定义的数据类或概念集的分类模型。

     该阶段需要从已知的数据集中选取一部分数据作为建立模型的训练集,而把剩余的部分作为检验集。

     通常会从已知数据集中选取 2/3 的数据项作为训练集,1/3 的数据项作为检验集。

  训练数据集由一组数据元组构成,假定每个数据元组都已经属于一个事先指定的类别。

      训练阶段可以看成为学习一个映射函数的过程,对于一个给定元组 x, 可以通过该映射函数预测其类别标记。

     该映射函数就是通过训练数据集,所得到的模型(或者称为分类器)。

      该模型可以表示为分类规则、决策树或数学公式等形式。

  2)评估阶段

  在评估阶段,需要使用阶段建立的模型对检验集数据元组进行分类

   从而评估分类模型的预测准确率。

  分类器的准确率是分类器在给定测试数据集上正确分类的检验元组所占的百分比。

     如果认为分类器的准确率是可以接受的,则使用该分类器对类别标记未知的数据元组进行分类。

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/3178/news/215858/违者必究! 以上就是成都中公优就业IT培训机构 小编为您整理 分类算法的基本概念有哪些的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-035-8011