暂无个人介绍
# 概述 ## 什么是基数统计 基数是指集合中不重复元素的个数,在网站运营、流量分析时我们经常需要统计的UV(Unique Visitor),就是一种基数,在使用SQL查询时,我们可以通过COUNT和DISTINCT这两个函数的组合进行基数统计,下列SQL: ```sql select count(distinct(seller_id)) from kylin_sales;
什么是Kylin Apache Kylin是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。 Kylin的查询高性能主要依赖于Cube理论,如图所示: 它将表字段划分为维度和量度,通过预先计算,在维度上进行量度聚合并保存聚合结果,而根据