Druid-简介

简介:
Druid 是目前比较流行的高性能的,分布式列存储的OLAP框架(具体来说是MOLAP)。它有如下几个特点:
一. 亚秒级查询
     druid提供了快速的聚合能力以及亚秒级的OLAP查询能力,多租户的设计,是面向用户分析应用的理想方式。
二.实时数据注入
     druid支持流数据的注入,并提供了数据的事件驱动,保证在实时和离线环境下事件的实效性和统一性
三.可扩展的PB级存储
     druid集群可以很方便的扩容到PB的数据量,每秒百万级别的数据注入。即便在加大数据规模的情况下,也能保证时其效性
四.多环境部署
     druid既可以运行在商业的硬件上,也可以运行在云上。它可以从多种数据系统中注入数据,包括hadoop,spark,kafka,storm和samza等
五.丰富的社区
     druid拥有丰富的社区,供大家学习。
   关于Druid
Druid is an open-source analytics data store designed for business intelligence ( OLAP) queries on event data. Druid provides low latency (real-time) data ingestion, flexible data exploration, and fast data aggregation. Existing Druid deployments have scaled to trillions of events and petabytes of data. Druid is most commonly used to power user-facing analytic applications.

Sub-second OLAP Queries Druid’s column orientation and inverted indexes enable complex multi-dimensional filtering and scanning exactly what is needed for a query. Aggregate and filter on data in milliseconds.

Real-time Streaming Ingestion Typical analytics databases ingest data via batches. Ingesting an event at a time is often accompanied with transactional locks and other overhead that slows down the ingestion rate. Druid employs lock-free ingestion of append-heavy data sets to allow for simultaneous ingestion and querying of 10,000+ events per second per node. Simply put, the latency between when an event happens and when it is visible is limited only by how quickly the event can be delivered to Druid.

Power Analytic Applications Druid has numerous features built in for multi-tenancy. Power user-facing analytic applications designed to be used by thousands of concurrent users.

Cost Effective Druid is extremely cost effective at scale and has numerous features built in for cost reduction. Trade off cost and performance with simple configuration knobs.

Highly Available Druid is used to back SaaS implementations that need to be up all the time. Druid supports rolling updates so your data is still available and queryable during software updates. Scale up or down without data loss.

Scalable Existing Druid deployments handle trillions of events, petabytes of data, and thousands of queries every second.


欢迎关注官方博客

目录
相关文章
|
SQL 缓存 监控
SpringBoot整合阿里巴巴Druid数据源
Java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,又不得不使用数据库连接池。 Druid 是阿里巴巴开源平台上一个数据库连接池实现,结合了 C3P0、DBCP 等 DB 池的优点,同时加入了日志监控。 Druid 可以很好的监控 DB 池连接和 SQL 的执行情况,天生就是针对监控而生的 DB 连接池。 本文主要讲解如何整合Druid数据源及Druid常用配置项和详解
5383 1
SpringBoot整合阿里巴巴Druid数据源
|
druid
springboot1集成druid数据源
springboot1集成druid数据源
|
关系型数据库 Java 中间件
ShardingSphere-简介 | 学习笔记
快速学习ShardingSphere-简介。
ShardingSphere-简介 | 学习笔记
|
存储 负载均衡 监控
【Druid】(二)Apache Druid 原理与架构剖析1
【Druid】(二)Apache Druid 原理与架构剖析1
507 0
【Druid】(二)Apache Druid 原理与架构剖析1
|
druid Java 数据库连接
数据库连接池入门(c3p0、Druid)
数据库连接池入门(c3p0、Druid)
259 1
|
存储 分布式计算 监控
【Druid】(一)Apache Druid 基本介绍
【Druid】(一)Apache Druid 基本介绍
2380 0
【Druid】(一)Apache Druid 基本介绍
|
SQL JSON Kubernetes
【Druid】(五)通过 Imply 快速入门1
【Druid】(五)通过 Imply 快速入门1
162 0
【Druid】(五)通过 Imply 快速入门1
|
SQL 数据可视化 druid
【Druid】(五)通过 Imply 快速入门2
【Druid】(五)通过 Imply 快速入门2
141 0
【Druid】(五)通过 Imply 快速入门2
|
消息中间件 存储 druid
【Druid】(二)Apache Druid 原理与架构剖析2
【Druid】(二)Apache Druid 原理与架构剖析2
301 0
【Druid】(二)Apache Druid 原理与架构剖析2
|
存储 XML 分布式计算
Druid 0.17 入门(2)—— 安装与部署
在Druid快速入门其实已经简单的介绍过最简化配置的单节点部署,本文我们将详细描述Druid的多种部署方式,对于测试开发环境可以选用轻量的单机部署方式,而生产环境我们最好选用集群部署的方式,确保系统的高可用性。
542 0
Druid 0.17 入门(2)—— 安装与部署