PAI-ChatLearn 灵活易用大规模RLHF高训练框架
《PAI-ChatLearn 灵活易用大规模RLHF高训练框架》介绍了PAI-ChatLearn框架,且通过实际案例演示了PAI-ChatLearn的功能。
PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
Flink CDC Meetup PPT - 孙家宝
2022.5.21 Flink CDC Meetup|孙家宝 - Flink CDC MongoDB Connector 的实现原理和使用实践
《“后红海”时代,独家揭秘当下大数据体系》
《“后红海”时代,独家揭秘当下大数据体系》从系统架构的角度,就大数据架构热点,每条技术线的发展脉络,以及技术趋势和未解问题等方面做一概述。特别的,大数据领域仍然处于发展期,部分技术收敛,但新方向和新领域层出不穷。本文内容和作者个人经历相关,是个人的视角,难免有缺失或者偏颇,同时限于篇幅,也很难全面。仅作抛砖引玉,希望和同业共同探讨。
Apache Flink 必知必会
“实时计算”不再只是未来趋势,它已经融入到企业生产的各个环节之中。一线开发同学如何掌握大数据极致算力应用,企业如何全面提升数据服务能力? 本书不仅有PMC 及 Committer 坐阵,全方位解析 Flink 底层架构、核心功能模块、社区生态等,知其然更知其所以然,还能带你手把手实操演示,轻松掌握 Flink 应用场景与功能实现的生产开发技能!零基础上手实战,7天轻松学会 Flink~
FFA2024分论坛-行业解决方案
FFA2024行业解决方案专场由 Apache Flink 核心贡献者与来自中国联通、阿里云、腾讯、中国电信、微财、谙流科技、平凯星辰、飞轮科技等公司的一线技术专家带来分享,探讨Apache Flink在关键行业场景中落地的实时数据驱动决策和分析的方案,通过这些案例,一起解析技术挑战,分享业务成果,促进实时数据处理技术的创新与发展。
FFA2024分论坛-云原生
FFA2024云原生专场由 Apache Flink 核心贡献者与来自阿里云、网易游戏、小红书、美团、哔哩哔哩等公司的一线技术专家带来,聚焦Flink与云原生技术的结合,探讨如何在云原生环境中高效部署和深度优化Flink流批任务。通过实战经验分享,帮助开发者利用容器化、K8s、Serverless等工具,在稳定、性能、成本之间取得平衡。
FFA2024分论坛-Data+AI
FFA2024Data+AI专场由 Apache Flink 核心贡献者与来自哔哩哔哩、抖音集团、Elastic、京东、硕橙科技等公司的一线技术专家带来,聚焦实时大数据处理与人工智能的前沿融合,共同探讨如何利用Flink助力AI大模型技术的实时化升级,议题涵盖但不限于特征工程、训练、推理、大模型架构优化、以及实时AI大模型在各行业领域的创新应用。
大数据&AI实战派 第1期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例。电子书第1期以《阿里云大数据知识图谱》为核心,通过阿里云大数据&AI产品能力介绍结合操作实践,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
Elastic(中国)产品应用实战
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为下册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书为读者详解了Elastic的功能实战和开发效能,呈现了行业中应用Elastic产品能力的实践案例,例如追踪最近的客户订单、获取数据视图等等,供开发者学习并加以实践。
Flink CDC Meetup PPT - 覃立辉
2022.5.21 Flink CDC Meetup|覃立辉 - Flink CDC + Hudi 海量数据入湖在顺丰的实践
Flink CDC Meetup PPT - 徐榜江
2022.5.21 Flink CDC Meetup|徐榜江 - 基于 Flink CDC 实现海量数据的实时同步和转换
开源大数据前瞻与应用实战
大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。作为一线技术骨干,每天沉在业务里,怎样才能快速和时代接轨,让自己不落伍?Flink社区重磅推出2021理论与实战精解系列电子书!《开源大数据前瞻与理论实战》收录了多位大数据领域行业开拓者对未来前沿趋势的洞察,揭秘Apache Flink及开源生态的前沿独家应用!
中国开发者调查报告
为了了解Elasticsearch 中国开发者群体,结合1186位开发者的调研数据和18位社区专家的深度访谈,Elastic 技术社区、阿里巴巴 Elasticsearch 技术团队和阿里云开发者社区联合发布了《Elasticsearch 中国开发者调查报告》。免费下载,抢先一步读懂这个“族群”吧。
13个专题6万字详解,Hologres一体化实时湖仓实践手册
Hologres 3.0 全新升级为一体化实时湖仓平台,通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+Al 一体,发布全新 Dynamic Table、External Database、分时弹性、Query Queue、NL2SQL 等能力,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率。
面向Web应用的三维建模实战
得益于游戏产业的发展,目前主流桌面端三维引擎如UE、Unity等三维模型的工作流非常成熟;但是Web端的三维模型开发却面临工作流混乱、规范缺失、人才匮乏等挑战,阻碍了三维模型Web应用的推广。Blender是支持WebGL引擎最好的DCC软件之一,结合pbr/gltf规范可以搭建完整的Web端三维模型工作流,为三维模型Web应用开发提供支撑。
阿里云云原生一体化数仓新能力解读
云原生一体化数仓是阿里云推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、 全链路数据治理四大核心能力。本书将分为离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解炙手可热的云数据产品最新演进趋势,为大数据开发者讲述一体化数仓的核心产品能力以及在业务中的应用。
Elastic(中国)基础开发宝典
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为上册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书不仅向读者介绍了Elastic的基础开发技能,还解答了日常工作中的常见问题,例如Elasticsearch 内存管理和故障排除等。通过阅读本书,开发者可以从中获取必要的基础技能和理论知识。
实时数仓Hologres技术实战一本通2.0版(上)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水区玩法。— 《“伏羲”神算》现在可以免费下载阅读啦,快来先睹为快吧。
领军行业大数据及AI实战
飞天大数据平台不仅是阿里经济体大数据生产的基石,更为各行业客户提供大数据整体解决方案和强劲算力。上一册介绍阿里巴巴内部大数据实战的电子书《阿里巴巴大数据及AI实战》推出后,受到了广大开发者的认可。本次带来不同行业下企业的大数据&AI案例和实战电子书《领军行业大数据及AI实战》,希望能给广大企业和开发者带来更多受益。
阿里云开源大数据Workshop·杭州站
阿里云开源大数据Workshop·杭州站,旨在和开发者朋友们一起了解流式湖仓、湖仓一体架构的最近演进方向和企业云上湖仓实践案例。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。