概述

特点

  • Druid是一个快速列式分布式支持实时分析的数据存储系统。在处理PB级别数据、毫秒级延迟、数据实时处理方面,比传统的OLAP系统有显著的性能改进。

  • 列式存储格式,Druid使用面向列的存储,只需要加载特定查询所需的列,查询速度快

  • 可扩展的分布式系统,Druid通常部署在数十到数百台服务器的集群中,并且提供数百万条/秒的摄取率,保留数百万条记录,以及亚秒级到几秒钟的查询延迟。

  • 大规模的并行处理,Druid可以在整个集群中进行大规模的并行查询。

  • 实时或批量摄取,Druid可以实时摄取数据(实时获取的数据可立即用于查询)或批量处理数据。

  • 自愈,自平衡,易操作,集群扩展和缩小,只需添加或删除服务器,集群将在后台自动重新平衡,无需任何停机时间。

  • 数据进行了有效的预聚合或预计算,查询速度快。

  • 数据的结果应用在Bitmap压缩算法

适用场景

  • 适用于清洗好的记录实时录入,但不需要更新操作。

  • 适用于支持宽表,不用Join的方式,单表操作。

  • 适用于可以总结出基础的统计指标,一个字段表示。

  • 适用于实时性要求高的场景。

  • 适用于对数据质量的敏感度不高的场景。

最后更新于