PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
2022年开源大数据热力报告
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
Elastic Stack 实战手册
本书由数十位 Elasticsearch 技术圈的优秀开发者共创而成,得到了许多资深业界精英,社区技术大咖,Elastic Stack 相关书籍作者的支持,凝聚了众多创作人的实践经验和创作能力。 书籍涵盖了一位 Elastic Stack 开发者所需的必要知识,尤其对于刚入门的开发者,从上篇基础的 Elastic Stack 产品能力到下篇的应用实践,提供了系统性学习参考的上手指南。
Flink CDC Meetup PPT - 王赫
2022.5.21 Flink CDC Meetup|王赫 - Flink CDC + OceanBase 全增量一体化数据集成方案
Flink CDC Meetup PPT - 覃立辉
2022.5.21 Flink CDC Meetup|覃立辉 - Flink CDC + Hudi 海量数据入湖在顺丰的实践
Flink CDC Meetup PPT - 孙家宝
2022.5.21 Flink CDC Meetup|孙家宝 - Flink CDC MongoDB Connector 的实现原理和使用实践
Flink CDC Meetup PPT - 徐榜江
2022.5.21 Flink CDC Meetup|徐榜江 - 基于 Flink CDC 实现海量数据的实时同步和转换
实时数仓Hologres技术实战一本通2.0版(下)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
《阿里云实时数仓Hologres最佳实践合集》
Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。
Apache Flink 十大技术难点实战
《Apache Flink 十大技术难点实战》由 Apache Flink 核心贡献者及一线大厂生产环境使用者总结分享,内容全面丰富,涵盖原理解析、应用实践、demo演示、Flink 1.10 生态等总结生产环境十大常见难点。10篇技术实战文章帮你完成故障识别、问题定位、性能优化等全链路过程,实现从基础概念的准确理解到上手实操的精准熟练,从容应对生产环境中的技术难题!
阿里云开源大数据Workshop·杭州站
阿里云开源大数据Workshop·杭州站,旨在和开发者朋友们一起了解流式湖仓、湖仓一体架构的最近演进方向和企业云上湖仓实践案例。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。