在实时离线一体化数仓架构中可以将这些技术分为哪三类
第一类是事务数据库,一般事务数据库是按照行存储的,对于交易型的数 据有很好的更新能力,但是对于千万级及以上的统计型的查询,消耗时非 常大的,所以一般也不用事务型数据库做分析。
第二类是 OLAP 系统,这一类技术会对分析场景做很多优化,例如列存技 术,分布式技术,索引技术等等,这类技术查询都很快,但是往往在更新 上稍显不足。
第三类在大数据分析场景中也很常见,定义为 serving 的系统,需要提供 在线服务,需要有高吞吐和超快的查询响应,但是牺牲了灵活性,例如文 档数据库,或者 KV 查询的数据库,对于 Key/Value 的查询和更新的效率 都非常高。
以上内容摘自《阿里云云原生一体化数仓新能力解读》电子书,点击https://developer.aliyun.com/ebook/download/7725 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。