待集成、连接、丰富—MaxCompute生态再出发 | 大数据生态专场
待集成、连接、丰富—MaxCompute生态再出发-李睿博_大数据生态专场嘉宾介绍李睿博
互金---众安保险数据平台实践分享
众安保险作为国内首家互联网保险公司,从创立之初计算平台就使用MaxCompute。MaxCompute不仅仅是一个计算平台,它还提供可用的IDE(DataWorks、Studio)开发工具进行数据分析和挖掘,从而降低了众安最初的开发成本。MaxCompute不仅为众安提供任务调度系统、元数据、数据质量监控、数据服务与安全,而且生态的丰富,资源与工具的共享,都能很好的满足众安的使用需求,让众安可以有更多时间去接触用户,为用户创造更大价值。
从 Apache ORC 到 Apache Calcite | 第二讲 春蔚专访 《MaxCompute 与 Calcite 的技术和故事》
【直播主题】春蔚专访《MaxCompute 与 Calcite 的技术和故事》【分享嘉宾】雷春蔚 阿里云智能计算平台 高级开发工程师 / Apache Calcite Committer / 华中科技大学硕士【直播时间】5月30日 16:00-16:50【精彩剧透】什么是Apache Calcite开源项目?MaxCompute在SQL层面做了哪些优化?如何进入大数据行业?又如何一步步成为Calcite committer?【系列直播预告】6月6日 16:00-16:50 苑海胜专访 《MaxCompute 与大数据查询引擎的技术和故事》
阿里云新品发布会第57期:DataWorks 实时数据开发平台发布会
查看产品:DataWorks点击了解:Stream Studio重磅发布有奖问答:互联网大数据时代的实时计算需求,你打算用什么方式来应对?点击了解:“阿里云新品发布会频道”点击订阅:阿里云新品发布·周刊发布会议程简介15:00-16:00 《阿里云DataWorks Stream Studio —— 一站式流任务开发平台》介绍实时计算任务开发的困难、问题和背景,引出使用Stream Studio可以大大加快实时任务的开发速度,降低开发和维护门槛,同时结合DataWorks的整体能力,能够实现实时数仓、实时监控、实时分析、实时大屏等实时大数据场景的一站式开发。讲师简介王喆(喆别)+阿里巴巴产品专家扫码加入阿里云Stream Studio用户群
EMR StarRocks OLAP 数据分析场景
EMR StarRocks 线上公开课 第3期直播亮点EMR Serverless StarRocks 极速分析存算分离架构升级Trino兼容,无缝替换讲师/嘉宾简介周康(榆舟)阿里云高级技术专家开源大数据OLAP引擎团队负责人StarRocks TSC Member
一站式实时数仓Hologres整体能力介绍
Hologres分析服务一体化架构与优势,新能力Serverless Computing实现大ETL任务降本,行为、画像分析等场景深耕,多种函数组合,实时数仓、离线实时一体、实时湖仓多种方案实践讲师/嘉宾简介丁烨 阿里云Hologres产品专家
Havenask进阶系列第4节:分词器开发
Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask进阶系列课程第4课《分词器开发》,视频中共包含以下3部分内容。 分词器插件简介 内置分词器介绍 分词器实战开发 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云OpenSearch官网:https://www.aliyun.com/product/opensearch Havenask官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:
Havenask入门系列第10节:Havenask Kubernetes模式
hape工具参考:https://havenask.net/# /doc/sql/petool/intro kubernetes部署参考: https://havenask.net/# /doc/v1-2-0/sql/petool/startcluster/k8smode k8s模式问题排查:https://havenask.net/# /doc/v1-2-0/sql/petool/problem# k8s%E6%A8%A1%E5%BC%8F%E9%97%AE%E9%A2%98%E6%8E%92%E6%9F%A5 Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍:此视频为Havenask入门教程系列的第9节课《问题排查》,将对Havenask使用中4块内容进行讲解。 ● Hape运维脚本 ● 集群 ● 表创建 ● 数据写入与查询 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云 OpenSearch 官网:https://www.aliyun.com/product/opensearch 官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:78c5cfa61c64a55cdeb0655ac7eb2849.png
Havenask入门课程第4节:创建表
Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask入门课程第4节《创建表》,共讲解2部分内容。 -创建直写表 -创建全量表 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云 OpenSearch 官网:https://www.aliyun.com/product/opensearch 官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:
行业实践专场(二)
行业实践专场将由美的、芒果 TV、喜马拉雅、曹操出行、米哈游、腾讯、字节跳动、中原银行、上海汽车集团、中南电力、跨越速运、传音、传智教育等多行业实时计算领域专家详细解读 Flink 在不同企业和行业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授,帮助开发者更全面和深入地了解 Flink 技术如何在实际生产场景中落地。
AI 特征工程专场
AI 特征工程专场由来自蚂蚁金服、数澜科技、字节跳动、阿里云智能、B 站的技术专家带来基于 Flink 的实时特征工程平台的建设思路与深度应用实践。
FY23阿里云暑期夏令营精彩瞬间(上)
来自全国不同高校的学生们相聚在阿里云园区,一声同学,一份关切,情意绵长,美好永在!了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso
基于检索分析服务Elasticsearch版,创建你的第一个仪表板!
点此免费试用 ->保姆级教程!通过本教程您将通过学习免费开通阿里云检索分析服务Elasticsearch版、登录Kibana添加样例数据并学习创建仪表板,了解从你自己的数据创建仪表板的最常用方法。
云上StarRocks,极速湖仓meetup - 北京站
来自水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家,针对开源 OLAP 技术架构、 StarRocks 产品硬核技术及 EMR StarRocks 进行分享。EMR Serverless StarRocks 免费公测讲师/嘉宾简介水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家
StarRocks 3.0 极速统一的湖仓新范式
讲师简介张友东:StarRocks Active Contributor内容简介在线讲解从 shared-nothing 到 shared-data 的湖仓分析新范式如何帮助用户实现“极速统一“的价值。动手实践EMR Serverless StarRocks 免费测试https://developer.aliyun.com/article/1191440
Flink Forward 行业实践 “Flink在新能源场站运维的应用”
Flink Forward 行业实践 “Flink在新能源场站运维的应用”姚远工程师,注册测绘师
Flink Forward 平台建设 “小米基于Flink的实时数仓建设实践”
Flink Forward 平台建设 “小米基于Flink的实时数仓建设实践”周超小米软件开发工程师
Flink Forward 平台建设 “货拉拉基于Flink计算引擎的应用与优化实践”
Flink Forward 平台建设 “货拉拉基于Flink计算引擎的应用与优化实践”王世涛货拉拉大数据实时研发平台负责人
Flink Forward 核心技术 “Flink state的优化与remote state的探索”
Flink Forward 核心技术 “Flink state的优化与remote state的探索”张杨bilibili 资深开发工程师
Flink Forward 平台建设“Flink实时计算平台在知乎演进”
Flink Forward 平台建设“Flink实时计算平台在知乎演进”贾承昆 知乎大数据架构负责人
Flink Forward 平台建设“Flink 在蚂蚁大规模金融场景的平台建设”
Flink Forward 平台建设“Flink 在蚂蚁大规模金融场景的平台建设”李志刚 蚂蚁集团高级技术专家
Flink Forward 平台建设“阿里实时计算平台建设实践”
Flink Forward 平台建设“阿里实时计算平台建设实践”周凯波 阿里云高级技术专家
Flink Forward 核心技术“Flink OLAP 在在字节跳动的查询优化和落地实践”
Flink Forward 核心技术“Fliink OLAP 在在字节跳动的查询优化和落地实践”何润康 字节跳动基础架构工程师
Flink Forward 行业案例“FlinkSQL在米哈游的平台建设和应用实践”
Flink Forward 行业案例“FlinkSQL在米哈游的平台建设和应用实践”张剑 米哈游实时计算团队负责人
Flink Forward 实时湖仓“快手基于Apache Flink 的实时数仓建设实践”
Flink Forward 实时湖仓“快手基于Apache Flink 的实时数仓建设实践”羊艺超 快手实时数据开发工程师冯立 快手实时数据开发工程师
Flink Forward Asia 实时风控专场 “京东物流实时风控实践”
Flink Forward Asia 实时风控专场 “京东物流实时风控实践”周文跃 风控数据产品组架构师
Flink Forward Asia 生产实践专场 “抖音实时数仓保障与治理实践”
Flink Forward Asia 生产实践专场 “抖音实时数仓保障与治理实践”茅旭辉 字节跳动实时数据研发工程师李建国 字节跳动实时数据研发工程师
《开源大数据热力报告 2022》解读
11 月 5 日,开放原子开源基金会、X-lab 开放实验室、阿里巴巴开源联合发布了《开源大数据热力报告 2022》。该报告收集了2015 年至 2022 年的相关公开数据进行关联分析,研究开源大数据进入“后 Hadoop 时代”的技术趋势,以及开源社区的运作模式对技术走向的助推作用。 本周四,我们将以直播的方式,就《开源大数据热力报告 2022》的结论进行延申,讨论应如何提高开源开发者活跃度,提升开源项目热力。讲师/嘉宾简介赵生宇(X-lab开放实验室核心成员、开源社成员、同济大学计算机在读博士生、OpenDigger开源项目发起人)燕青(Apache Kyuubi PPMC、Apache Spark Committer、Apache Submarine Committer、网易技术专家)、赵恒(StarRocks PMC、StarRocks产品负责人)徐榜江(雪尽)(Flink CDC Maintainer、Apache Flink Committer、阿里云技术专家)、徐昱(StarRocks Active Contributor,Apache Hudi Contributor,华米科技高级大数据工程师 )
Flink Forward Asia 2022 数据集成 11.27 上午
云原生为数据集成领域注入了全新生命力,本专场邀请小红书、小米、科杰科技、易车、京东、顺丰、XTransfer、阿里等技术专家分享基于 Flink 的数据集成系统探索与实践。讲师/嘉宾简介王林红|易车数据平台负责人韩飞|京东资深技术专家,Apache Flink Contributor唐尚文|顺丰科技 大数据平台研发高级工程师孙家宝|XTransfer 基础架构团队 技术专家
Flink Forward Asia 2022 生产实践 11.27
快手、美团、字节跳动、小米、运满满、蔚来汽车、中泰证券、中原银行、中信建投、中南电力设计院等多行业实时计算领域专家详细解读 Flink 在不同企业和行业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授。讲师/嘉宾简介张蛟|小米高级软件工程师,Apache Flink Contributor张芒|快手大数据架构工程师刘大龙|阿里云工程师刘畅|字节跳动基础架构工程师钟旭阳|阿里云开发工程师,Apache Flink Contributor
Flink Forward Asia 2022 核心技术
由 Apache Flink 核心贡献者与来自阿里巴巴、字节跳动、华为、Shopee、bilibili、美团等公司的一线技术专家解析 Flink 技术动向与应用实践,回归技术本质,打造全方位技术盛宴。讲师/嘉宾简介梅源|阿里云 Flink 存储引擎团队的负责人,Apache Flink 引擎架构师,Apache Flink PMC & Committer宋辛童|阿里云高级技术专家,Apache Flink PMC Member & Committer朱翥|阿里云高级技术专家,Apache Flink PMC & Committer曹帝胄|字节跳动基础架构工程师付典|阿里云高级技术专家,Apache Flink PMC & Committer
Apache Flink Meetup 北京站《Flink Table Store 典型应用场景》
Apache Flink Meetup 北京站主题:Flink Table Store 典型应用场景讲师:李劲松 阿里巴巴高级技术专家
ApacheCon Asia 2022 阿帕奇亚洲大会流处理论坛 7/30
作为当今大数据领域的趋势,流式数据处理的潜在价值正在被不断发掘。如今,很多企业都渴望更及时地洞察自己的数据,曾经的“批处理”思维也正在迅速被流式处理所取代。越来越多的公司,无论大小,都在重新思考技术架构时把实时性作为第一考量,并开始用强大的开源引擎如 Apache Flink, Apache Spark, Apache Kafka, Apache Pulsar, Apache Storm 等构建自己的实时计算平台。 在本次 ApacheCon 上,Apache 软件基金会成员、阿里云 EMR 平台技术及 Flink 存储引擎团队负责人李钰将携手专家团带来“流处理”分论坛分享。在该分论坛中,您将了解到一线大厂把这些 Apache 项目应用到其生产环境中的实际经验,以及这些 Apache 项目生态的最新发展和流计算技术未来的发展方向。 讲师/嘉宾简介 徐榜江(雪尽)- 基于 Flink CDC 和 Hudi 高效地构建实时数据湖 盛宇帆 - 使用 Apache Pulsar 开发基于 Apache Flink 的流批一体化应用 毕岩(寻径) - 基于数据湖格式构建流式增量数仓——CDC 张雨霏 - 介绍用于 Pulsar 和 PulsarCatalog 的 Flink SQL 连接器 赵波 - 让 Flink 在 K8s 上运行的更好 付睿 - 以云原生的方式使用 Apache Pulsar 函数
阿里云云原生一体化数仓 — 数据治理新能力解读
本场公开课会介绍大数据开发治理平台DataWorks在数据治理领域的最新产品进展,包括基于事前、事中、事后的全链路理念构建的核心产品功能和数据治理量化评估机制解读,以及围绕降本增效的成本治理最佳实践。讲师/嘉宾简介唐晨 阿里云智能 产品专家
Delta Lake数据湖基础介绍(商业版)【Databricks 数据洞察公开课】
公开课第五讲:介绍 Lakehouse 搜索引擎的设计思想,探讨其如何使用缓存,辅助数据结构,存储格式,动态文件剪枝,以及 vectorized execution 达到优越的处理性能。加入技术交流群下期预告《如何快速搭建流批一体数据仓库》讲师/嘉宾简介:李洁杏 Databricks 资深软件工程师
如何快速搭建云原生企业级数据湖架构及实践分享
众所周知,数据湖技术在大数据领域炙手可热,随着在云上的广泛部署和应用,其业务价值逐渐获得业界共识。如何快搭建数据湖架构被越来越多的企业探讨。本次演讲主要分享快速搭建云原生企业级数据湖架构及实践分享。讲师简介王震 -- 阿里云计算平台事业部 开源大数据平台 技术专家
Hologres系列课程(十六)性能调优手段总结
本次主要介绍在Hologres中外表、内表常用的性能调优手段,提升自助化调优能力,实现资源更高效利用讲师简介余骏(清芬),阿里巴巴技术专家,多年分布式系统经历,对系统调优有丰富的经验
Hologres系列课程(十九)企业级运维与安全之数据脱敏
本次主要介绍在Hologres如何使用数据脱敏,以及如何通过数据保护伞实现企业级安全管控讲师花名简介杨源秦(渝香),阿里巴巴技术专家,长期从事Hologres引擎开发工作
Hologres系列课程(二十)使用最佳实践总结
本次主要总结Hologres各项功能的使用最佳实践,了解Hologres的开发体系、优化体系和运维体系,助力快速搭建企业级一站式实时数仓讲师简介胡求,阿里巴巴开发工程师,从事于Hologres引擎开发工作
开源大数据社区 & 阿里云 E-MapReduce 系列直播 第7期
云原生数据湖构建与分析最佳实践讲师花名健身--阿里巴巴计算平台事业部 EMR技术专家
Elasticsearch生态&技术峰会主论坛
以“开源共生,云聚未来”为主题,业界资深专家相聚云端,共话云上Elasticsearch生态与技术的未来。峰会面向CIO/CTO、技术负责人、搜索开发工程师群体。讲师介绍贾扬清 阿里巴巴集团副总裁、阿里云智能高级研究员Shay Banon Elastic创始人&CEO邓万禧 阿里巴巴资深技术专家张锐 阿里云智能全球生态联盟总经理Doug Farber Elastic全球渠道联盟副总裁朱杰 Elastic首席解决方案架构师
Intel MLlib:构建平台优化的Spark机器学习
Intel MLlib是一个为Apache Spark MLlib优化的软件包。它在保持和Spark MLlib兼容的同时,在底层利用原生算法库来实现在CPU和GPU上的最优化算法,同时使用Collective Communication来实现效率更高的节点间通信。我们的初步结果表明,该软件包在最小化应用改动的基础上,可以极大地提升MLlib算法的性能。讲师介绍吴晓昶英特尔亚太研发有限公司大数据部门的高级软件工程师,主要研究方向为并行计算,大数据系统和机器学习,CPU和GPU的性能优化。目前关注Spark和机器学习的系统性能优化。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。