全国服务热线:400-035-8011

位置:沈阳兄弟连IT培训学校 > 学校动态 > 大数据hadoop和Spark分布式框架比较

大数据hadoop和Spark分布式框架比较

来源:沈阳兄弟连IT培训学校时间:2019/11/30 8:51:43

  hadoop和Spark是两种不同的大数据处理框架,他们的组件都非常多,往往也不容易学,我把他们两者整理在一幅图中,给大家一个全貌的感觉。

大数据hadoop和Spark分布式框架比较

  以上这些大数据组件是日常大数据工作中经常会碰到的,每个组件大概的功能,我已经在图中做了标识。下面,针对这幅图我给大家两点重要提示:

  a.蓝色部分,是Hadoop生态系统组件,黄色部分是Spark生态组件,虽然他们是两种不同的大数据处理框架,

  但它们不是互斥的,Spark与hadoop 中的MapReduce是一种相互共生的关系。Hadoop提供了Spark许多没有的功能,

  比如分布式文件系统,而Spark 提供了实时内存计算,速度非常快。有一点大家要注意,Spark并不是一定要依附于Hadoop才能生存,

  除了Hadoop的HDFS,还可以基于其他的云平台,当然啦,大家一致认为Spark与Hadoop配合默契好摆了。

  b.技术趋势:Spark在崛起,hadoop和Storm中的一些组件在消退。

  大家在学习使用相关技术的时候,记得与时俱进掌握好新的趋势、新的替代技术,以保持自己的职业竞争力。

  HSQL未来可能会被Spark SQL替代,现在很多企业都是HIVE SQL和Spark SQL两种工具共存,当Spark SQL逐步成熟的时候,就有可能替换HSQL;

  MapReduce也有可能被Spark替换,趋势是这样,但目前Spark还不够成熟稳定,还有比较长的路要走;

  Hadoop中的算法库Mahout正被Spark中的算法库MLib所替代,为了不落后,大家注意去学习Mlib算法库;

  Storm会被Spark Streaming替换吗?在这里,Storm虽然不是hadoop生态中的一员,但我仍然想把它放在一起做过比较。

  由于Spark和hadoop天衣无缝的结合,Spark在逐步的走向成熟和稳定,其生态组件也在逐步的完善,是冉冉升起的新星,我相信Storm会逐步被挤压而走向衰退。

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/1791/news/115649/违者必究! 以上就是沈阳兄弟连IT培训学校 小编为您整理 大数据hadoop和Spark分布式框架比较的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-035-8011