23>云原生数据仓库的机遇和挑战云原生数据仓库的机遇和挑战作者|占超群 阿里巴巴集团研究员 数据库OLAP产品部负责人一、数据仓库的发展历程(一)业界趋势可以看到,目前业界中数据生产和数据处理正在发生质变,其主要趋势有:1.数据规模爆炸性增长:2020 年,全球数据规模约 40ZB,预计到 2025 年全球数据规模相比今天将会增长超过 4 倍;2.生产/处理实时化:到 2025 年,实时数据的占比会超过 30%,且到 2022 年,预计50%的业务将会采用实时分析;3.生产/处理智能化:随着摄像头和 5G 的兴起,未来的非结构化数据增速在加快,并且占比越来越高,会超过 80%,非结构化数据年增速将达到 55%;4.数据加速上云:到 2023 年,75%的数据会上云,到 2025 年,49%的数据会直接在云上存储。随着业务的变化和数据的质变,数据处理将会面临新的挑战,主要有:云原生数据仓库的机遇和挑战<24数据一致性:平均一个客户的数据源会超过 5 种;分时实时性:分析的实时性要求越来越高;系统复杂性:基本上一个大数据系统将会包括超过 40 个组件,复杂性急剧增加,运维成本越来越高