|
数据建模 数据管理
|

全链路数据治理-智能数据建模

DataWorks智能数据建模沉淀阿里巴巴数据中台建模方法论,以维度建模为基础,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让数据仓库的建设向规范化,可持续发展方向演进。 通过本书,你可以学习到: 1. 数据建模理论与规范 2. 菜鸟、大淘系数据建模实践 3. 工业、汽车行业数据建模实践 4. 零售电商数据建模实操案例

26132
|
数据采集 SQL OLAP
|

全链路数据治理-全域数据集成

DataWorks全链路数据治理包含智能数据建模、全域数据集成、高效数据开发、主动数据治理、全面数据安全、快速分析服务六大产品能力,覆盖数据的全生命周期。本篇全域数据集成向开发者介绍通过DataWorks数据集成在多表多表、多表到单表、单表到单表等场景下,进行实时或离线同步的技术选型与核心能力,并以MaxCompute与Hologres引擎为例,演示云上数据同步操作步骤最佳实践。

26783
|
对象存储 专有云 块存储
|

Hologres物化视图升级 构建企业一站式实时数仓

《Hologres物化视图升级 构建企业一站式实时数仓 》技术资料

492
来自: 实时数仓 Hologres  版块
|
4月前
|
网络协议 网络架构 RDMA
|

UPN512技术架构白皮书

随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。

337
|
对象存储 专有云 块存储
|

PAI-Megatron-Patch:灵骏集群训练 LLMs

本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。

551
来自: 人工智能平台PAI  版块
|

当搜索遇见AI

597
来自: 智能搜索推荐  版块
|
对象存储 专有云 块存储
|

阿里云人工智能平台 PAI年度发布

本书聚焦于PAI平台的最新功能更新、技术创新以及在人工智能领域的实际应用案例。

433
来自: 人工智能平台PAI  版块
|
云计算 对象存储 大数据
|

阿里云 JindoFS+OSS 数据上云实战

为了帮助读者能更全面地了解 JindoFS,我们特地编撰了这本电子书。从架构到场景到实操,全方面解读jindoFS。

123829
|

大数据AI一体化的解读

425
来自: 人工智能平台PAI  版块
|
对象存储 专有云 块存储
|

Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)

Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。

312281
|
API 数据采集 数据处理
|

大数据&AI实战派 第2期

《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。

132443
来自: 大数据计算 MaxCompute  版块
|
大数据 新零售 双11
|

全链路数据治理-主动数据治理

2万字揭秘阿里巴巴数据治理平台建设实践。阿里巴巴一直将数据作为自己核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续优酷、高德、菜鸟等板块,面对各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从7个方面为大家揭秘数据治理平台建设实践。

26628
|

《阿里云实时数仓Hologres最佳实践合集》

Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。

2198
来自: 实时数仓 Hologres  版块
|
对象存储 专有云 块存储
|

一站式大数据开发治理DataWorks使用宝典

零基础如何开发治理大数据?阿里专家告诉你!《一站式大数据开发治理DataWorks使用宝典》由9位阿里巴巴DataWorks产品专家领学精心打造,全面介绍了DataWorks十大功能模块,以动手实操的方式清晰使用方法及开发流程,帮助用户快速上手DataWorks核心功能。如果你有自定义数据治理方面的需求,学习DataWorks绝对是你的不二选择。此书也定能成为你学习之路的宝典,快来一起过关斩将吧!

12364
|

FFA2024分论坛-流式湖仓

FFA 2024 流式湖仓专场由 Apache Flink 核心贡献者与来自淘天集团、抖音集团、vivo、小米、中原银行、阿里云智能、蚂蚁集团、贝壳找房、货拉拉等公司的一线技术专家解析流批一体、存算分离、湖仓融合的实时湖仓架构,探讨以 Apache Paimon 为流批一体湖存储的湖仓架构建设实践,如何帮助业务获得更实时的数据来驱动业务决策,并实现数据管理的降本增效。

1193
来自: 实时计算 Flink  版块
|
对象存储 专有云 块存储
|

开源大数据产品年度发布

《开源大数据产品年度发布》技术资料。

509
来自: 实时计算 Flink  版块
|

极氪大数据平台建设实践

572
来自: 实时数仓 Hologres  版块
|

OpenSearch向量检索和大模型方案

733
来自: 智能搜索推荐  版块
|
OLAP 数据管理 数据处理
|

EMR StarRocks 白皮书

StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容,⾦融级⾼可⽤,兼容 MySQL 5.7 协议和 MySQL ⽣态,提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案,适⽤于对性能、实时性、并发能⼒和灵活性有较⾼ 要求的各类应⽤场景。

3959
|
对象存储 专有云 块存储
|

阿里巴巴大数据及AI实战

深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。

65322
来自: 大数据计算 MaxCompute  版块
|
云计算 流计算
|

Streaming Lakehouse Meetup

Streaming Lakehouse Meetup · Online 。由阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家,Apache Flink PMC,Paimon PPMC 李劲松(花名:之信)作为出品人,联合业内大咖共同分享 Apache Paimon 在各场景中的最佳实践、生产经验、技术原理等。

725
来自: 实时计算 Flink  版块
|
对象存储 专有云 块存储
|

阿里云ElasticsearchSeverless版产品发布

575
|
对象存储 专有云 块存储
|

MaxCompute半结构化数据思考与创新

《MaxCompute半结构化数据思考与创新》介绍了半结构化数据模型简析,与传统方案优劣对,MaxCompute思考与实践,以及收益分析。

344
来自: 大数据计算 MaxCompute  版块
|

实时数仓Workshop(广州站)- 余文兵

245
来自: 实时计算 Flink  版块
|
流计算 云计算 监控
|

Apache Flink 案例集(2022版)

希望通过本手册,可以让大家了解到大量来自不同领域的公司在数据集成、数据分析、人工智能、云原生以及企业数字化转型等应用场景中使用 Apache Flink 解决实际生产问题的成功案例,其中既包含传统和新兴的互联网公司,也包含通信、证券、银行等传统企业。希望这些生产实践案例和经验能够帮助大家更好的理解和使用 Apache Flink,加速更多企业的实时化平台搭建和业务转型。

20690
来自: 实时计算 Flink  版块
|
对象存储 专有云 块存储
|

Apache Flink 十大技术难点实战

《Apache Flink 十大技术难点实战》由 Apache Flink 核心贡献者及一线大厂生产环境使用者总结分享,内容全面丰富,涵盖原理解析、应用实践、demo演示、Flink 1.10 生态等总结生产环境十大常见难点。10篇技术实战文章帮你完成故障识别、问题定位、性能优化等全链路过程,实现从基础概念的准确理解到上手实操的精准熟练,从容应对生产环境中的技术难题!

58671
来自: 实时计算 Flink  版块
|

领军行业大数据及AI实战

飞天大数据平台不仅是阿里经济体大数据生产的基石,更为各行业客户提供大数据整体解决方案和强劲算力。上一册介绍阿里巴巴内部大数据实战的电子书《阿里巴巴大数据及AI实战》推出后,受到了广大开发者的认可。本次带来不同行业下企业的大数据&AI案例和实战电子书《领军行业大数据及AI实战》,希望能给广大企业和开发者带来更多受益。

43983
来自: 大数据计算 MaxCompute  版块
|
人工智能 算法 云栖大会
|

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

908
来自: 人工智能平台PAI  版块
|
前端开发 UED 图形学
|

面向Web应用的三维建模实战

得益于游戏产业的发展,目前主流桌面端三维引擎如UE、Unity等三维模型的工作流非常成熟;但是Web端的三维模型开发却面临工作流混乱、规范缺失、人才匮乏等挑战,阻碍了三维模型Web应用的推广。Blender是支持WebGL引擎最好的DCC软件之一,结合pbr/gltf规范可以搭建完整的Web端三维模型工作流,为三维模型Web应用开发提供支撑。

328
来自: 数据可视化DataV  版块
|
流计算
|

FFA2023主论坛

FFA2023主论坛资料汇总

437
来自: 实时计算 Flink  版块
|
搜索推荐 Java 分布式计算
|

Elastic Stack 实战手册

本书由数十位 Elasticsearch 技术圈的优秀开发者共创而成,得到了许多资深业界精英,社区技术大咖,Elastic Stack 相关书籍作者的支持,凝聚了众多创作人的实践经验和创作能力。 书籍涵盖了一位 Elastic Stack 开发者所需的必要知识,尤其对于刚入门的开发者,从上篇基础的 Elastic Stack 产品能力到下篇的应用实践,提供了系统性学习参考的上手指南。

24551
|

《“后红海”时代,独家揭秘当下大数据体系》

《“后红海”时代,独家揭秘当下大数据体系》从系统架构的角度,就大数据架构热点,每条技术线的发展脉络,以及技术趋势和未解问题等方面做一概述。特别的,大数据领域仍然处于发展期,部分技术收敛,但新方向和新领域层出不穷。本文内容和作者个人经历相关,是个人的视角,难免有缺失或者偏颇,同时限于篇幅,也很难全面。仅作抛砖引玉,希望和同业共同探讨。

4569
来自: 大数据计算 MaxCompute  版块
|
对象存储 专有云 块存储
|

Elastic Stack 实战手册(早鸟版)

开源搜索引擎这十来年的发展,基本就是 Lucene 体系的发展。而基于 Lucene 的诸多搜索引擎中,Elasticsearch 以其极好的易用性、开箱即用的体验迅速折服了开发者。其边界也从最早的搜索引擎,扩展到了日志全观察、安全分析等场景,形成了今天的 Elastic Stack,具备从数据采集、处理、分析到展示的强大生态能力。

45696
|

《实时数仓技术入门一本通》

云原生Hologres作为HSAP服务与分析一体化理念的最佳实践,到底有哪些核心技术优势?Hologres实时数仓原理是什么?又有哪些常见的写入场景?针对传统数据库痛点, Hologres 落地具体业务场景的最佳实践又是什么样的呢?这些问题都可以在本书找到答案!本书通过详细的图文介绍,指导读者搞定融合实时数仓&报表、数据仓库、传统OLAP迁移等10+个实战场景,助力实现服务和分析一体化实时数仓。

26105
来自: 实时数仓 Hologres  版块
|

Apache Spark 中文实战攻略下册

Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略(下册)》让企业大数据平台性能更优。阿里、Databricks、领英、Intel都在用!Spark 企业级最佳实践中文解读全收纳!

25181
|

零基础入门:从0到1学会 Apache Flink

大数据实时计算及 Apache Flink 年度Flink 年度学习资料大礼包,300+页实战应用精华总结!本书内容包含:1、零基础入门,30 天成长为 Flink 大神的经典教程。2、Apache Flink 核心贡献者及阿里巴巴技术专家的一线实战经验总结。3、收录来自 bilibili、美团点评、小米、OPPO、快手、Lyft、Netflix 等国内外一线大厂实时计算平台及实时数仓最佳实践案例

141613
来自: 实时计算 Flink  版块
|
对象存储 专有云 块存储
|

大数据工程师必读手册

阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。

102997
来自: 大数据计算 MaxCompute  版块
|

FFA2024分论坛-核心技术

FFA 2024 核心技术专场由 Apache Flink 核心贡献者与来自阿里云智能、小红书、哔哩哔哩、蚂蚁金服、Shopee等公司的一线技术专家解析 Flink 技术动向与应用实践,重点探讨 Flink 的核心技术(如状态管理、容错机制、数据传输、大规模调度和核心算法等)在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。

970
来自: 实时计算 Flink  版块
|

阿里云产品月刊云栖特刊

阿里云全面投入升级AI大基建,全线产品年度重磅发布,更多详情请点击阿里云产品月刊2024云栖大会特刊

6
|
流计算
|

FFA2023流批一体专场资料汇总

FFA2023流批一体专场资料汇总

519
来自: 实时计算 Flink  版块
|

FFA2023流式湖仓专场资料汇总

FFA2023流式湖仓专场资料汇总

976
来自: 实时计算 Flink  版块
|
数据挖掘
|

Databricks数据洞察:从入门到实践

Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。

31218
|
对象存储 专有云 块存储
|

开源与云:Elasticsearch应用剖析

本书基于【Elasticsearch生态&技术峰会Online】阿里巴巴集团副总裁、Elastic创始人&CEO Shay Bannon等10位资深大咖演讲内容整理而成,对当下热门Elasticsearch技术领域与云生态下开源共生之路的探讨。10大章节,10位大咖,讲透4大技术场景,分享3大云服务应用场景!通过本书,大家能对Elasticsearch开源体系、云原生和数字化转型有更加深刻的了解。

11488
|

《阿里云实时数仓Hologres最佳实践合集(网页)》

《阿里云实时数仓Hologres最佳实践合集(网页)》PPT

12506
来自: 实时数仓 Hologres  版块
|
Java 数据采集 分布式计算
|

Elastic与阿里云合作宣传信息白皮书

阿里云是 Elastic 在中国最早开展合作的伙伴,长期的合作积淀了深厚的技术实践和丰富的业务经验,本白皮书介绍了自合作以来阿里云和Elastic的联合价值主张、产品功能与优势、客户案例等。

1762

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
68691
内容
128
活动
439596
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务