奈学：数据湖有哪些缺点？-阿里云开发者社区

奈学：数据湖有哪些缺点？

2020-06-28 938

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据湖本身是一个中心化的存储，能够存储任意规模的结构化与非结构化数据。数据湖相比数据仓库有很多的优势，但大多是在理想状态下的，一旦执行起来还有很多技术挑战。

数据湖本身是一个中心化的存储，能够存储任意规模的结构化与非结构化数据。数据湖相比数据仓库有很多的优势，但大多是在理想状态下的，一旦执行起来还有很多技术挑战。

（一）数据湖的数据可能并不会真正做到实时。在业务环境下，如果把所有数据都放到数据湖里，那么从数据湖直接调用数据的过程可能比原来数据仓库更慢，因为从数据湖中提取出来的数据，依然要经过清洗实现标准化后才能更好的利用。具体能否达到需求的低时延效果，还要根据具体应用场景来进行判断。

（二）把所有的原始数据都放到数据湖，可能会提升数据的使用难度。对于大型企业而言，业务内容丰富，操作系统繁杂，数据使用者往往期望所有的数据都能平民化，就像数据仓库提供的那种经过了精心处理的数据，能够轻松调度和使用来实现对业务的指导。如果是数据湖提供的原始化数据，其本身是很复杂的，数据专家进行理解和处理时或许难度适中，但大多数的平民用户能否消化、理解并利用这些数据，将会是一个巨大的疑问。

（三）数据治理问题。数据仓库里的数据是经过整理、清晰易懂的。但数据湖的概念是不经处理直接进行堆砌，那么数据湖就有可能会变成“数据沼泽”，筛选难度会变大。当然，数据湖的优势就是数据可以先作为资产存放起来，问题就在于如何把这些数据在业务中利用起来。当部署了数据湖之后，数据治理问题将会接踵而至，比如从数据湖到数据池塘，如何将数据进行分流、池塘的数据如何进行整理等。

本文来源于：奈学开发者社区

奈学：数据湖有哪些缺点？

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

奈学：数据湖有哪些缺点？

热门文章

最新文章

相关电子书