全国服务热线:400-035-8011

位置:忻州中公优就业IT培训学校 > 学校动态 > 提高HBase表效率的查询技巧

提高HBase表效率的查询技巧

来源:忻州中公优就业IT培训学校时间:2020/10/7 17:42:04

    1.多并发读写提升吞吐量
    HBase的优势不在于对单条请求的响应速度,而在于整个集群的吞吐量高。因此,倘若想提高客户端读写速度,直接的一个方法就是多并发读写。
    2.批量处理请求

    和其它数据库类似,HBase提供了批量处理操作的API,批量处理请求可以利用好RPC时间,提高单个客户端的处理效率。

忻州有就业大数据培训课程

    3.全表扫描时关闭块缓存功能
    HBase提供了读缓存,当读取一条记录时,会将对应的块读到读内存中。对于某些频繁访问的行,这个功能可以提高读取速度。然而,当用户需要做全表扫描时,应记得关闭这个功能,避免读缓存扰动、缓存命中率下降。
    4.扫描时使用扫描缓存
    HBase的扫描器在获取数据时,会为每行数据生成一个单独的RPC请求,即使用户显式指定了要获取n行的数据,扫描器也会向服务器发送n个RPC请求。为了一次RPC请求可以获取多行数据,用户必须显式开启扫描器的扫描缓存功能。
    5.严格限制查找范围
    使用行键查找对应的值无疑是效率高的查找方式。不过,如果在查找请求中添加一些额外的条件,也有助于提高查找效率:限定列族可以避免扫描其它列族的存储文件;限定时间戳在4小时以内,可以跳过一些后修改时间在4小时之前的文件;限定列名可以控制返回给客户端的数据量,降低传输时间和网络流量。
    
领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/2414/news/262245/违者必究! 以上就是忻州中公优就业IT培训学校 小编为您整理 提高HBase表效率的查询技巧的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-035-8011