开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

【百问百答】《阿里云云原生数据湖体系全解读》

1、为什么说数据湖是大数据和 AI 时代融合存储和计算的全新体系?

2、阿里云云原生数据湖体系有什么优势?

3、数据湖存储OSS是什么?

4、阿里云云原生数据湖加速是什么?

5、阿里云数据湖构建是什么,解决了什么问题?

6、阿里云数据湖云原生计算引擎是什么?

7、阿里云云原生数据库是什么,有什么作用?

8、阿里云数据湖存储OSS的产生背景是什么?

9、什么是数据湖?

10、阿里云数据湖的关键特性与价值是什么?

11、基于 OSS 的数据湖存储是否满足海量数据存储的特性?

12、基于 OSS 的数据湖存储是否满足高效数据计算的特性?

13、基于 OSS 的数据湖存储是否满足安全数据管理的特性?

14、为什么要构建数据湖?

15、JindoFS是什么?

16、JindoFS 的架构是怎样的?

17、JindoFS 元数据服务是什么,有什么优势?

18、JindoFS高效的元数据操作提现在什么地方?

19、JindoFS是如何实现秒级启动的?

20、HDFS是如何实现低资源消耗的?

21、JindoFS缓存服务是什么?

22、JindoFS弹性运维是什么?

23、StorageService的高性能存储是什么?

24、JindoFS的适用场景是什么?

25、JindoFS的缓存模式是什么?

26、JindoFS的存储模式是什么?

27、JindoFS方案再性能上有什么优势?

28、JindoFS方案在成本上有什么优势?

29、JindoFS支持哪些组件?

30、将训练数据存储在数据湖上具有什么优势?

31、将训练数据存储在数据湖上带来了哪些问题和挑战?

32、基于 JindoFS 缓存加速的训练架构有什么优势?

33、JindoTable数据湖之数据优化是什么?

34、JindoTable数据湖之查询加速是什么?

35、JindoTable数据湖之分层存储是什么?

36、HadoopDistCp是什么?

37、S3DistCp是什么?

38、JindoDistCp是什么?

39、为什么使用 JindoDistCp?

40、使用 JindoDistCp 性能提升多少?

41、数据湖统一元数据服务需要具备哪些能力和价值?

42、是引擎接入层作为元数据服务上层有哪些好处?

43、元数据自动发现能力包括哪些能力?

44、阿里云数据湖构建服务支持哪些计算引擎?

45、数据湖的对接主要体现在哪几个方面?

46、一站式入湖需要解决哪些问题?

47、数据入湖整体上分为哪几个部分?

48、入湖模板是什么?

49、入湖引擎是什么?

50、DLF 支持的文件格式有哪些?

51、DTS 增量数据实时入湖是什么?

52、TableStore 实时入湖是什么?

53、SLS 日志实时入湖是什么?

54、什么是 CDC?

55、侵入式的CDC方案是什么?

56、非侵入式的CDC方案是什么?

57、常见的 CDC 方案实现之Sqoop 离线同步是什么?

58、常见的 CDC 方案实现之binlog 实时同步是什么?

59、Spark Streaming SQL是什么?

60、Delta Lake是什么?

61、Spark on Kubernetes存在哪些问题?

62、数据湖要考虑的首要问题是什么?

63、数据湖要解决的三大问题是什么?

64、阿里云DataWorks是如何解决元数据管理问题的?

65、阿里云DataWorks是如何解决数据集成问题的?

66、阿里云DataWorks是如何解决数据开发问题的?

点击下载 https://developer.aliyun.com/topic/download?id=900《阿里云云原生数据湖体系全解读》

展开
收起
Lee_tianbai 2021-01-08 15:32:48 2245 0
0 条回答
写回答
取消 提交回答

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
阿里云云原生 Serverless 技术实践营西安站材料合集 立即下载
智算时代,基于 Kubernetes 落地云原生 AI 立即下载
从技术到架构,云原生全面加速应用现代化 立即下载