全国服务热线:400-035-8011

位置:上海中公优就业it培训机构 > 学校动态 > 大数据机器学习工具

大数据机器学习工具

来源:上海中公优就业it培训机构时间:2020/8/9 9:28:40

  大数据机器学习工具

  Mahout

  Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

大数据机器学习工具

  Spark Mlib

  MLlib是一个机器学习库,它提供了各种各样的算法,这些算法用来在集群上针对分类、回归、聚类、协同过滤等(可以在 Machine learning 上查看Toptal的文章,来获取更过的信息)。其中一些算法也可以应用到流数据上,例如使用普通小二乘法或者K均值聚类(还有更多)来计算线性回归。Apache Mahout(一个针对Hadoop的机器学习库)已经脱离MapReduce,转而加入Spark MLlib。

  TensorFlow (Google 系)

  TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从图象的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。

  TensorFlow可被用于语音识别或图像识别等多项机器深度学习领域,对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行。TensorFlow将完全开源,任何人都可以用。

  Amazon Machine Learning

  Amazon Machine Learning 是一项面向各个水平阶层开发人员的服务,可以帮助他们利用机器学习技术。Amazon Machine Learning 提供可视化的工具和向导,指导您按部就班地创建机器学习模型,而无需学习复杂的机器学习算法和技术。当您的模型准备好以后,Amazon Machine Learning 只要使用简单的 API 即可让您的应用程序轻松获得预测能力,而无需实现自定义预测生成码或管理任何基础设施。

  Amazon Machine Learning 采用与 Amazon 内部数据科学家社区多年来一直使用的机器学习技术相同的技术,具有稳定可靠、容易扩展的特点。此服务使用强大的算法通过发现已有数据中的规律来创建机器学习模型。然后,Amazon Machine Learning 会使用这些模型来处理新数据并为应用程序生成预测结果。

  Amazon Machine Learning 具有极强的可扩展性,每天可以生成数十亿条预测结果,并以高吞吐量实时地将其送出。使用 Amazon Machine Learning 不需要对硬件或软件事先投入资金,只需要根据使用量付费,所以不妨先从小规模做起,然后根据应用程序的发展情况再酌情进行扩展。

  DMTK (微软分布式机器学习工具)

  DMTK 是微软分布式机器学习工具包。

  DMTK 包括以下几个项目:

  DMTK framework(Multiverso): 参数服务器架构的机器学习

  LightLDA: 用于大规模主题模型的可扩展、、轻量级系统.

  Distributed word embedding:文字嵌入分布式算法.

  Distributed skipgram mixture: 多义文字嵌入分布式算法

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/3180/news/234951/违者必究! 以上就是上海中公优就业it培训机构 小编为您整理 大数据机器学习工具的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-035-8011