全国服务热线:400-6263-721

位置:广州中公优就业IT培训 > 学校动态 > java大数据开发 数据库

java大数据开发 数据库

来源:广州中公优就业IT培训时间:2023/2/11 14:47:02

  大数据的典型特征,包括数据量大、数据类型多、价值密度低等,而具备这样特征的数据,在进入到存储阶段时,就需要根据数据类型及场景,来匹配适当的数据存储解决方案。今天我们来讲讲Java大数据开发当中,必须掌握的四种数据库。

  大数据时代的数据,我们可以大致分为结构化数据和非结构化数据。其中,结构化数据,主要是依靠传统的关系型数据库去存储,比如说Oracle、MySQL、PostgreSQL等,都是关系型数据库的代表。

  而比结构化数据,更加庞大的非结构化数据(其中也包括半结构化数据),则主要依靠非关系型数据库来完成存储。对于大数据开发者而言,非关系型数据库(NoSQL)也有不同的类型,需要匹配不同的场景需求来进行选择。

  MongoDB

  MongoDB,可以说是大数据时代的数据库代表作了。MongoDB较大的特点是表结构灵活可变,字段类型可以随时修改。MongoDB中的每一行数据只是简单的被转化成Json格式后存储,没有表结构的限制。

  没有表结构这一点,对于MongoDB来说,带来了优势,当然也存在一定的缺陷,比如说在多表查询、复杂事务等操作上,MongoDB就显得不够了。

  得益于MongoDB的这些特点,MongoDB很适合那些表结构经常改变,数据的逻辑结构又没那么复杂不需要多表查询操作,数据量又比较大的应用场景。

  Redis

  Redis是现在较热门的key-value数据库。Redis的较大特点当然就是key-value存储所带来的简单和高性能了。

  所谓key-value存储,就是每一条记录只包含一个用于查询数据的Key,以及与之对应的存储数据的value,就如同现实生活中的门牌号与住户,而没有诸如表、字段这些常规数据库中必需有的复杂概念,所有的查询都仅仅依赖于key值。

  得益于这种简单的结构,再加上Redis会把所有数据加载到内存中的,Redis相比常规数据库的读写性能得到了极大的提升。并且,Redis还支持数据持久化,list、set等多种数据结构,主从复制备份等功能,堪称简单易用。

  同样地,因为数据结构的简单,Redis对复杂查询的支持也有限,不能支持多列查询、区段查询等。总的来说,Redis更适用于读写性能要求极高,且数据表结构简单、查询条件也同样简单的应用场景。

  ElasticSearch

  ElasticSearch,严格来说,其实不算是数据库,而是搜索引擎,这个产品本身也是围绕搜索来设计的。

  ES的典型优势就是,支持全文搜索,在对中文的支持上也比较友好(单是中文分词器就有很多种)。ES通过建立倒排索引实现全文搜索,以实现对存入ES中的所有数据进行检索,就算是非常复杂的聚合查询也可以得到不错的性能。

  当然,ES也同样有不足,较明显的就是字段类型无法修改、写入性能较低和高硬件资源消耗。这就注定了ES不适用于数据价值不高、对写入性能有要求、数据量大而成本受限的场景下。

  Hbase

  HBase作为Hadoop生态当中的重要组件,说是大数据必学,相信没有人会反对。HBase较大的优点,就是对海量数据的支持,以及极强的横向(存储容量)扩展能力。

  Hbase的存储和Redis类似,为每一行数据定义一个key,之后所有的查询都依赖这个key进行。但是Hbase的不同在于,一行数据还可以有非常多的列项,数据会按照列进行分组和存储,同一列的数据存储在同一个地方。

  HBase的列式存储特性带来了海量数据规模的支持和极强的扩展能力,但是也给数据的读取带来很大的局限。由于只有同一列族的数据才会被存放在一起,而且所有的查询都必须要依赖Key,这就使得很多复杂查询难以进行。

  简单来说,HBase适合数据量极大,查询条件简单,列与列之间联系不大的轻查询应用场景。

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/2370/news/593867/违者必究! 以上就是广州中公优就业IT培训 小编为您整理 java大数据开发 数据库的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6263-721