漫谈OceanBase 列式存储
              列式存储主要的目的有两个:
大部分OLAP查询只需要读取部分列而不是全部列数据,列式存储可以避免读取无用数据;
将同一列的数据在物理上存放在一起,能够极大地提高数据压缩率。
OLAP和OLTP
OLAP,也叫联机分析处理(Online Analytical Processing)系统,有的时候也叫DSS决策支持系统,就是我们说的数据仓库。
              
             
            
              
              PostgreSQL 流式统计 - insert on conflict 实现 流式 UV(distinct), min, max, avg, sum, count ...
              标签
PostgreSQL , 流式统计 , insert on conflict , count , avg , min , max , sum
背景
流式统计count, avg, min, max, sum等是一个比较有意思的场景,可用于实时大屏,实时绘制统计图表。
              
             
            
            
              
              一种对数据仓库友好的数据库设计
              系统可以分为两种:一种是 联机交易系统(OLTP),一种是在线分析系统(OLAP)。OLTP用来收集数据,然后把数据同步到OLAP,在OLAP中进行分析数据。  
OLAP可以减少OLTP的负载,提高对数据的利用率。
              
             
            
              
              MSSQL · 特性分析 · 列存储技术做实时分析
              摘要
数据分析指导商业行为的价值越来越高,使得用户对数据实时分析的要求变得越来越高。使用传统RDBMS数据分析架构,遇到了前所未有的挑战,高延迟、数据处理流程复杂和成本过高。这篇文章讨论如何利用SQL Server 2016列存储技术做实时数据分析,解决传统分析方法的痛点。
传统RDBMS数据分析
在过去很长一段时间,企业均选择传统的关系型数据库做OLAP和Data Warehouse工作。这一
              
             
            
            
            
            
              
              云数据库POLARDB优势解读系列文章之②——高性价比
              现在做任何事情都要看投入产出比,对应到数据库上其实就是性价比。POLARDB作为一款阿里自研数据库,经常被问的问题是:性能怎么样?能不能支撑我的业务?价格贵不贵?很显然,在早期调研阶段,对稳定性、可靠性很难有量化的指标时,性能的好快就成了一个非常关键的决策因子。
              
             
            
              
              数据挖掘150道试题 学会你也具有专业能力
              
一、
 单选题
1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)
A. 关联规则发现
B. 聚类
C. 分类
D. 自然语言处理
2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A)
(a)警察抓小偷,描述警察抓的人中有多少个是小