《数据湖存储架构选型》

数据湖技术在大数据领域炙手可热,随着在云上的广泛部署和应用,其业务价值逐渐获得业界共识。传统的大数据平台如何基于数据湖架构进行平台升级,享受新一轮的技术发展红利?郑老师着重跟大家分享了数据湖架构和应用在存储上面临的主要挑战,以及方案选型和最佳实践。嘉宾简介:郑锴,花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC。深耕分布式系统开发和开源大数据多年,目前专注于在阿里云上研发业界领先的 Hadoop/Spark 大数据平台和数据湖解决方案产品。

969 0
|
机器学习/深度学习
|

藏经阁电子书发布会第十期:AI是灵药还是猛兽?

时间:2020年9月2日 19:00-20:00讲师简介:黄博远,阿里云机器学习平台PAI产品负责人。十二年大数据与AI领域技术经验,十年技术管理经验,先后供职于微软、阿里巴巴集团,从是展示广告、搜索广告、电商广告、搜索、云计算等相关领域的技术工作。现任阿里云智能飞天AI平台(PAI)产品负责人、一站式大数据智能研发与治理平台DataWorks产品负责人。主题简介:AI是什么?AI赋予了很多商业业务宝贵的价值,我们日常用的搜索引擎就是应用AI的最大受益者;在电商领域,AI可以做推荐;在金融领域,AI可以做风控等等。对于很多新人来说,AI到底是什么?它似乎涵盖许多很高深的技术,学习AI需要学很多东西,想要抓住AI的风口,学AI甚至想玩转AI,有机会吗?阿里云机器学习平台技术专家给的答案是肯定的。首先,AI(人工智能)是什么呢?AI的本源是一门研究如何用机器来模拟人的智能的技术,让有以下能力:听——语音识别方面看——文字识别、图像识别等方面说——语音合成、人机对话等方面思考——推导数学公式、人机对弈等方面学习以及行动——自动驾驶等整个人工智能技术基本上围绕这些领域展开和迭代。其次,人人都能玩转AI吗?答案也是肯定的。学习AI需要解决算力、算法和数据的问题,加上真实场景来磨练。互联网尤其是移动互联网和换联网的迅猛发展辅助解决海量高质数据的问题;云计算和异构计算的发展辅助解决计算力的问题。而科技发展让整个生产率不断提高的同时不断地降低学习或使用技术的门槛。如同50多年以前,开车是一项非常重要或特殊的技能,司机备受大众敬仰,而今还会有很多人认为会开车的身份很特殊吗?可能不会了,反而是不会开车的人会让人觉得其身份特殊。AI其实也一样,它背后没有什么特别神秘的技术,技术的发展也使其使用和学习门槛在不断地降低。想深入了解AI源于何方、能够解决的典型问题?探讨AI是否能够替代或控制人类的话题?想知道如何像开车、用电脑、用智能手机一样掌握AI的技术?阿里云机器学习平台大神来给你降维讲解,带你了解AI历史,体验AI能力,并为你带来了《阿里云机器学习PAI-DSW入门指南》电子书的发布,带你进入人人都能玩儿AI的时代。教你如何轻松上手并告别纸上谈兵!

4580 57
来自: 人工智能平台PAI  版块

阿里巴巴大数据技术关键进展及展望 | 大数据技术专场

阿里巴巴大数据技术关键进展及展望-关涛_大数据技术专场嘉宾介绍关涛

1565 0
来自: 大数据计算 MaxCompute  版块

重磅发布:阿里云智能大数据 & AI 产品发布-李京梅

重磅发布:阿里云智能大数据 & AI 产品发布-李京梅

2303 0
来自: 大数据计算 MaxCompute  版块
|
监控 大数据 MaxCompute
|

日志数据如何同步到MaxCompute | 2019大数据技术公开课第五季

本次直播主要讲解日志文件如何通过Loghub/Datahub同步数据到MaxCompute的参数介绍和详细同步过程等内容。直播嘉宾刘建伟,阿里云智能 技术支持工程师

1468 0
|
大数据
|

当各行各业遇到大数据 | 大数据技术公开课第二季

大数据技术公开课第二季直播详情>>>

5268 0
来自: 大数据计算 MaxCompute  版块
|
大数据
|

从 Apache ORC 到 Apache Calcite | 第三讲 海胜专访《MaxCompute 与大数据查询引擎的技术和故事》

【直播主题】海胜专访《MaxCompute 与大数据查询引擎的技术和故事》【分享嘉宾】苑海胜 阿里云智能计算平台 高级技术专家 / Apache Calcite Committer / 前 Greenplum 数据库优化器 Team Lead / CMU硕士【直播时间】6月6日 16:00-16:50 【精彩剧透】MaxCompute与MPP数据库的比较分布式系统上Join是如何实现的MaxCompute 针对 Join 和聚合引入的 Hash 和 Range Clustering 的优化从中国到日本,再到美国,工作经历和体验有何差别

3466 57
来自: 大数据计算 MaxCompute  版块
|
9月前
|

DataWorks 数据资产治理

DataWorks 数据资产治理(原数据治理中心)可根据预先配置的治理计划,自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,还提供业务资产管理、资产分析、任务资源消耗明细、费用预估等功能,帮助您有效掌握各类资源的使用详情。

321 58
|
9月前
|

2024FFA-分论坛-核心技术专场1

FFA2024核心技术专场由Apache Flink核心贡献者与来自阿里云智能、小红书、哔哩哔哩、Shopee、蚂蚁金服等公司的一线技术专家解析Flink技术动向与应用实践,重点探讨Flink的核心技术在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。

666 0
来自: 实时计算 Flink  版块
|
9月前
|

2024FFA主论坛

适逢Apache Flink诞生10周年,今年的FFA与广大开发者分享Flink过去十年在技术和生态方面的演进历程及关键成果。同时,基于当前AI时代的新场景,展望未来十年Flink的发展方向和规划。大会还将为您提供全面了解Flink2.0版本的机会,并与业界领袖共同探讨Apache Flink的过去、现在及未来,以及其在实际应用中的潜力。

457 0
来自: 实时计算 Flink  版块

轻量实时数据分析方案介绍

轻量实时数据分析方案介绍

285 0

数据集成专场

数据集成专场邀请了阿里云智能、飞轮科技、Oceanbase、B 站的技术专家分享基于 Flink 的数据集成系统探索与实践。

556 0
来自: 实时计算 Flink  版块
|
Python
|

【第7讲】是真的!Python可以创建Excel了,1行代码就能模拟真实数据,AI自动化办公还会远吗?

【第7讲】是真的!Python可以创建Excel了,1行代码就能模拟真实数据,AI自动化办公还会远吗?

371 0

Streaming Lakehouse Meetup

本次 Meetup 邀请了来自阿里巴巴、字节跳动的七位技术专家,聚焦大规模 CDC 数据入湖实践、Flink 一站式湖仓一体构建、流式数据湖关键特性以及统一的 RSS 等,全方位解析 Streaming Lakehouse 最前沿的技术,最新的产业实践!Flink、Paimon、Celeborn、Flink CDC、StarRocks 多个开源项目汇聚在一起,会碰撞出怎样的火花?敬请期待! 讲师: 李劲松 阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家 徐榜江 阿里云 Flink 数据通道负责人 刘大龙 阿里云研发工程师 李国君 字节跳动基础架构工程师 周克勇 阿里云/数据湖Spark引擎负责人 曾庆栋 阿里云高级开发工程师 王洪顺 阿里云大数据开发工程师

1537 2
来自: 实时计算 Flink  版块

Flink Forward 核心技术 “基于Log的通用增量Checkpoint”

Flink Forward 核心技术 “基于Log的通用增量Checkpoint”俞航翔Apache Flink Contributor

528 0
来自: 实时计算 Flink  版块

Flink Forward 行业实践“中原银行OLAP架构实时化演进”

Flink Forward 行业实践“中原银行OLAP架构实时化演进”杜威科 中原银行实时计算平台负责人

397 0
来自: 实时计算 Flink  版块

Flink Forward 数据集成“顺丰基于 Flink CDC + Hudi 推进实时业务落地”

Flink Forward 数据集成“顺丰基于 Flink CDC + Hudi 推进实时业务落地”唐尚文 顺丰科技大数据平台研发工程师

505 0
来自: 实时计算 Flink  版块

Flink Forward 核心技术“Apache Flink 1.16 功能解读”

Flink Forward 核心技术“Apache Flink 1.16 功能解读”黄兴勃 阿里云高级开发工程师

84107 0
来自: 实时计算 Flink  版块

Flink Forward 行业案例“集度汽车Flink on native k8s 的应用与实践”

Flink Forward 行业案例“集度汽车Flink on native k8s 的应用与实践”顾云 集度汽车数据开发专家周磊 集度汽车数据部门实时方向负责人

1148 1
来自: 实时计算 Flink  版块

Flink Forward 行业案例“Flink在蔚来自动驾驶AO部门的运用”

Flink Forward 行业案例“Flink在蔚来自动驾驶AO部门的运用”林志浩 蔚来资深数据开发工程师

826 0
来自: 实时计算 Flink  版块

Flink Forward Asia 实时风控专场 “京东物流实时风控实践”

Flink Forward Asia 实时风控专场 “京东物流实时风控实践”周文跃 风控数据产品组架构师

770 0
来自: 实时计算 Flink  版块

阿里云数创先锋大数据实战营专场(第一场)

阿里云数创先锋大数据实战营专场(第一场)

84340 0
来自: 大数据计算 MaxCompute  版块

Flink Forward Asia 2022 流批一体 11.26 下午

流批一体专场由来自快手、京东、数禾、Shopee、蚂蚁集团等企业的技术专家为你呈现流批一体的大规模应用实践案例,详细拆解落地难点和应对方案。另有来自阿里巴巴的技术专家手把手教你如何基于 Hive SQL on Flink 构建流批一体引擎。讲师/嘉宾简介张静|快手技术专家,Apache Flink/Calcite Committer马年圣|蚂蚁集团数据技术专家,实时数仓架构师王鑫|蚂蚁集团高级技术专家,Apache Storm PMC,Apache RocketMQ Committer,Apache IoTDB Committer杨涵冰|上海数禾信息科技有限公司 大数据架构师张颖|京东数据分析优化部算法开发工程师,Alink、DeepLearning on Flink Contributor

4332 0
来自: 实时计算 Flink  版块

基于Elasticsearch+Flink的日志全观测最佳实践

如何通过云上ELK+Flink的能力解决全观测—日志场景的痛点讲师/嘉宾简介沐泽 阿里云高级产品经理

1813 50

Flink Forward Asia 2021 生产实践

本专场集结阿里巴巴、腾讯、快手、小米、美团的技术专家探讨超大规模Flink集群运维与大规模作业稳定性优化实践等议题。讲师/嘉宾简介1.《阿里超大规模 Flink 集群运维体系介绍》王华 - 阿里云实时计算高级运维专家2.《Flink 引擎在快手的深度优化与生产实践》刘建刚 - 快手实时计算团队技术专家3.《大规模作业的稳定性优化实践》邱从贤 - 腾讯数据平台高级开发工程师,Apache Flink Committer4.《小米基于 Flink 的稳定性优化与实践》张蛟 - 小米大数据部高级软件工程师,Apache Flink Contributor5.《美团 Flink 大作业部署与状态稳定性优化实践》冯斐 - 美团数据平台计算引擎组工程师王非凡 - 美团数据平台计算引擎工程师,Apache Flink Contributor

5999 0
来自: 实时计算 Flink  版块

阿里云EMR系列直播 - 精讲 Databricks数据洞察(介绍及案例分析)

Databricks数据洞察是企业级全托管的Spark高性能大数据分析平台,来自Apache Spark创始公司Databricks。引擎采用Databricks Runtime,性能与社区版相比,最高可达50倍提升,高效而稳定。本次直播将重点展开介绍该产品,并针对代表性案例进行分析。讲师介绍韩宗泽(棕泽),阿里云技术专家,计算平台事业部开放平台-生态企业团队负责人

817 0

数据湖JindoFS+OSS 实操干货36讲 第二课

【第二课直播主题】1、如何将 HDFS 数据归档到 OSS2、如何将 Hive 数据按分区归档到 OSS【背景】为了让更多开发者了解并使用 JindoFS,由阿里云 JindoFS+OSS 团队打造的专业公开课【数据湖 JindoFS+OSS 实操干货36讲】会在每周二16:00准时开讲!从五大板块入手,玩转数据湖!讲师介绍辰石 - 阿里巴巴计算平台事业部 EMR 技术专家健身 - 阿里巴巴计算平台事业部 EMR 技术专家

1109 0

从0到1解锁内容行业智能推荐

【开发者优惠来了】全网最低价,阿里云爆款服务器低至8.1元/月,更有针对学生的专享福利全面升级,戳:http://click.aliyun.com/m/1000188819/介绍智能推荐在内容行业的业务价值、实践案例和快速上手指南讲师信息讲师:王亚宁花名:栀露头衔:阿里巴巴集团产品专家

2636 2
来自: 智能搜索推荐  版块

云数据仓库+实时搜索 — 持续定义SaaS模式云数据仓库MaxCompute

本次直播将为您介绍云数据仓库在实时搜索业务中的应用场景,并结合SaaS 模式云数据仓库MaxCompute 的优势和特点来讲解MaxCompute + Elasticsearch 最佳实践。分享人:孟硕 阿里云智能 产品专家

1539 0
来自: 大数据计算 MaxCompute  版块

智能推荐系列公开课——智能推荐在电商的经典打法与实践

智能推荐在电商的经典打法与实践: 阿里巴巴搜索推荐产品团队带来系列公开课,教你提高运营效率,精准匹配海量用户喜好。

1835 0
来自: 智能搜索推荐  版块

MaxCompute Spark与Spark SQL对比分析及使用注意事项

【直播主题】MaxCompute Spark与Spark SQL对比分析及使用注意事项【直播时间】2月19日 16:00-17:00【分享嘉宾】吴雷(沐行) 阿里云智能 高级售后技术工程师【直播简介】本次直播主要介绍Spark on MaxCompute和开源Spark上的区别,讲解加实战演示 Spark on MaxCompute如何使用。大数据技术公开课第一季《从开源到云原生,你不得不知的大数据实战》点击观看系列课程地址:https://yqh.aliyun.com/zhibo# J_9574411510加入「云栖号在线课堂」圈子,带你快速入门云计算!https://c.tb.cn/F3.Z8gvnK

4673 49
来自: 大数据计算 MaxCompute  版块

The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

开源大数据生态专场”数据爆炸“时代下如何进行有效地大规模数据处理问题?大量数据处理技术与软件应运而生,形成当前百花齐放的开源大数据生态。本专场将围绕大数据开源生态、技术生态、商业生态探讨当下开源大数据的发展趋势与未来动向,并展现大数据相关技术在一线生产场景的优秀实践。讲师介绍陈玉兆,Apache Calcite PMC,Apache Flink Contributor,阿里巴巴高级开发工程师更多直播信息开源大数据生态专场专场>>>YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场流处理基准测试 | 开源大数据生态专场Apache Flink and the Apache Way | 开源大数据生态专场Delivering stream data reliably with Pravega | 开源大数据生态专场Deep dive into Pyflink & integration with Zeppelin | 开源大数据生态专场Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场趣头条基于 Apache Flink+ClickHouse 构建实时数据分析平台 | 开源大数据生态专场基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

1490 0
来自: 实时计算 Flink  版块

基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场

开源大数据生态专场”数据爆炸“时代下如何进行有效地大规模数据处理问题?大量数据处理技术与软件应运而生,形成当前百花齐放的开源大数据生态。本专场将围绕大数据开源生态、技术生态、商业生态探讨当下开源大数据的发展趋势与未来动向,并展现大数据相关技术在一线生产场景的优秀实践。讲师介绍申毅杰,StreamNative资深工程师更多直播信息开源大数据生态专场专场>>>YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场流处理基准测试 | 开源大数据生态专场Apache Flink and the Apache Way | 开源大数据生态专场Delivering stream data reliably with Pravega | 开源大数据生态专场Deep dive into Pyflink & integration with Zeppelin | 开源大数据生态专场Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场趣头条基于 Apache Flink+ClickHouse 构建实时数据分析平台 | 开源大数据生态专场基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

2028 2
来自: 实时计算 Flink  版块

YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场

开源大数据生态专场”数据爆炸“时代下如何进行有效地大规模数据处理问题?大量数据处理技术与软件应运而生,形成当前百花齐放的开源大数据生态。本专场将围绕大数据开源生态、技术生态、商业生态探讨当下开源大数据的发展趋势与未来动向,并展现大数据相关技术在一线生产场景的优秀实践。讲师介绍杨巍威,Cloudera 资深软件工程师杨弢,阿里巴巴技术专家更多直播信息开源大数据生态专场专场>>>YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场流处理基准测试 | 开源大数据生态专场Apache Flink and the Apache Way | 开源大数据生态专场Delivering stream data reliably with Pravega | 开源大数据生态专场Deep dive into Pyflink & integration with Zeppelin | 开源大数据生态专场Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场趣头条基于 Apache Flink+ClickHouse 构建实时数据分析平台 | 开源大数据生态专场基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

2174 0
来自: 实时计算 Flink  版块

AI 加持的阿里云飞天大数据平台技术揭秘-关涛 徐晟

AI 加持的阿里云飞天大数据平台技术揭秘-关涛 徐晟

2503 39
来自: 大数据计算 MaxCompute  版块

第二届云上编程大赛颁奖礼

第二届云上编程大赛颁奖礼

1972 0
来自: 大数据计算 MaxCompute  版块
|
大数据
|

阿里云新品发布会第57期:DataWorks 实时数据开发平台发布会

查看产品:DataWorks点击了解:Stream Studio重磅发布有奖问答:互联网大数据时代的实时计算需求,你打算用什么方式来应对?点击了解:“阿里云新品发布会频道”点击订阅:阿里云新品发布·周刊发布会议程简介15:00-16:00 《阿里云DataWorks Stream Studio —— 一站式流任务开发平台》介绍实时计算任务开发的困难、问题和背景,引出使用Stream Studio可以大大加快实时任务的开发速度,降低开发和维护门槛,同时结合DataWorks的整体能力,能够实现实时数仓、实时监控、实时分析、实时大屏等实时大数据场景的一站式开发。讲师简介王喆(喆别)+阿里巴巴产品专家扫码加入阿里云Stream Studio用户群

17214 0
来自: 大数据计算 MaxCompute  版块
|
4月前
|

Apache Doris 的智能管理工具--Doris Manager v24.3 功能演示

作为 Apache Doris 的智能管理工具,Doris Manager 提供一键部署、实时监控、弹性扩缩容、升级重启等核心功能,并支持告警、日志、审计、巡检等高级运维能力。历经千家企业验证,24.3 版本更稳定高效,让集群管理更简单!在新的版本中,Doris Manager 丰富了集群巡检,监控等能力。

142 0
|
6月前
|
人工智能 搜索推荐 数据处理
|

阿里云 OpenSearch 智能问答版 ➕ DeepSeek R1——打造 B站 UP 主题爆款选题器

阿里云OpenSearch智能问答版+DeepSeek R1,支持多模态数据和联网搜索。以B站up主题爆款选题器为例,打造你的个人专属AI助手,开启你的智能搜索之旅,让AI赋能你的开发! (转载自哔哩哔哩,已获得原作者@老麦的工具库 授权。原视频地址:https://www.bilibili.com/video/BV1M8QmYJEzm/)

339 2
来自: 智能搜索推荐  版块
|
9月前
|

2024FFA分论坛-数据集成2

FFA2024数据集成专场由Apache Flink核心贡献者与来自阿里云智能、杭州银行、光大银行、货拉拉、数新智能、镜舟科技等公司的一线技术专家聚焦于实时技术在数据集成场景的价值与发展,讨论实时技术如何提升数据处理的全链路时效性,分析如何基于 Flink 设计实时数据集成框架,以及实时数据集成技术在不同业务领域的最佳实践。

238 0
来自: 实时计算 Flink  版块

生产实践专场(二)

生产实践专场集结字节跳动、华为、蚂蚁金服、Shopee、B站、快手、腾讯、京东物流、小红书的技术专家探讨基于 Flink 的实时场景下技术优化及实践。

567 0
来自: 实时计算 Flink  版块

流批一体专场

流批一体专场由来自阿里云智能、小红书、字节跳动、小米等企业的技术专家为你呈现流批一体的大规模应用实践案例,了解业务在数仓建设过程中的痛点与思考。另有来自阿里云智能高级技术专家将分享流批融合的理念与优势,结合全增量一体数据处理场景介绍流批融合的技术挑战与设计方案,以及 Flink 社区在这方面的最新进展与未来规划。

1340 0
来自: 实时计算 Flink  版块

如何开通实时计算Flink免费试用版

本视频将教会你如何在aliyun.com开通实时计算Flink免费试用版。

281 0
来自: 实时计算 Flink  版块

自动化AutoTalk第三期-自动化实践Tips

云上自动化的四个层次; 自动化实践过程的关键点; 不同规模企业如何规划自动化; 自动化时间过程中的角色责任; 自动化实践过程中的工作流程。

793 1

同时查找100个Excel,阁下如何应对?1行Python搞定

同时查找100个Excel,阁下如何应对?1行Python搞定

401 1
|
Python
|

Python快速入门教程09

Python入门-文件管理

284 0

FY24阿里云暑期夏令营“学生说”第四集

听一听参与夏令营的同学们怎么说,阿里云在这里期待迎接更多优秀的同学们!了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso

356 0

FY24阿里云暑期夏令营“学生说”第三集

听一听参与夏令营的同学们怎么说,阿里云在这里期待迎接更多优秀的同学们!了解更多夏令营信息请点击:https://edu.aliyun.com/learning/topic/xialy?spm=5176.20960838.0.0.1122305e1NNFso

387 0
|
Python
|

如何更新Python第三方库?1行命令搞定

pip install python-office -U

351 0

在现场!2023世界人工智能大会

打卡2023世界人工智能大会# 除了马斯克的机器人,大模型无疑是最热的话题,本次大会将有30多款大模型亮相,我们明天下午将走进《以模型为中心的AI开发新范式 》论坛,看看模型对人工智能行业发展到底有什么意义!欢迎关注我们!

920 4
来自: 人工智能平台PAI  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

8
今日
67116
内容
127
活动
439230
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务