|
数据采集 数据可视化 数据管理
|

25-爬虫Spider-Requests模块-COOKIE.

cookie 模拟登录

460 0

洞悉 Spark 任务调度新能力|Apache Spark + DolphinScheduler Meetup

洞悉 Spark 任务调度新能力|Apache Spark + DolphinScheduler Meetup特邀 - 阿里云 EMR 数据开发平台团队负责人孙一凡、BIGO 大数据研发工程师许名勇、阿里云 EMR Spark 引擎负责人周克勇 ,通过他们的分享让用户能更快更好更便捷的使用 Apahce Spark + Apahce DolphinScheduler 。讲师/嘉宾简介孙一凡(Evans 忆梵) 阿里云 EMR 数据开发平台团队负责人周克勇(一锤) 阿里云 EMR Spark 引擎负责人许名勇 BIGO 大数据研发工程师

3814 2

Apache Flink Meetup 深圳站

8月7日,Apache Flink Meetup 深圳站来啦!本场 Meetup 邀请了来自腾讯、第四范式、阿里巴巴的 4 位资深行业技术专家,将分享 Flink 如何帮助腾讯搭建万亿级实时数据入湖利器 Auto Optimizer Service,以及开发智能化的故障诊断和配置监控工具;又如何帮助第四范式建立 OpenMLDB 数据库实时更新系统。除了企业实践的分享外,Flink 1.14 版本的新特性预览也将会在本场 Meetup 中带给大家。活动亮点【爆款话题】• Flink 如何帮忙腾讯搭建万亿级实时数据入湖利器 Auto Optimizer• Flink 如何帮助腾讯开发智能化的故障诊断和配置监控工具• Flink 如何帮助第四范式建立 OpenMLDB 数据库实时更新系统• Flink 1.14 版本将会带来哪些值得期待的功能特性与体验优化;【多重大礼】丰富周边等你拿,加入钉钉交流群就有机会获得超多 Flink 社区定制的精美周边!Meetup 技术交流群:(Apache Flink 社区)活动议程合作伙伴

16996 0
来自: 实时计算 Flink  版块

Hologres系列课程(二十)使用最佳实践总结

本次主要总结Hologres各项功能的使用最佳实践,了解Hologres的开发体系、优化体系和运维体系,助力快速搭建企业级一站式实时数仓讲师简介胡求,阿里巴巴开发工程师,从事于Hologres引擎开发工作

4347 2
来自: 实时数仓 Hologres  版块

Elasticsearch生态&技术峰会主论坛

以“开源共生,云聚未来”为主题,业界资深专家相聚云端,共话云上Elasticsearch生态与技术的未来。峰会面向CIO/CTO、技术负责人、搜索开发工程师群体。讲师介绍贾扬清 阿里巴巴集团副总裁、阿里云智能高级研究员Shay Banon Elastic创始人&CEO邓万禧 阿里巴巴资深技术专家张锐 阿里云智能全球生态联盟总经理Doug Farber Elastic全球渠道联盟副总裁朱杰 Elastic首席解决方案架构师

820 0

OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能

讲师介绍:陈海锋,英特尔亚太研发有限公司大数据部门的高级软件架构师,开发经理,主要研究和关注基于Hadoop和Spark的大数据框架的分析和优化,Apache社区的长期贡献者。沈祥翔,英特尔亚太研发有限公司大数据部门的高级软件工程师,主要担任OAP项目的开发。分享介绍:简单介绍OAP的总体蓝图。同时详细介绍其中的一个具体优化,使用索引和缓存来解决交互式查询性能挑战。英特尔和社区合作,为Spark SQL实现了索引和数据源缓存,通过为关键查询列创建并存储完整的B +树索引,并使用智能的细粒度数据缓存策略,我们可以极大的提升基于Spark SQL的交互式查询的性能。

1420 0

JindoFS 存储策略和读写优化

本次分享主要介绍数据读写在计算存储分离的场景下所面临的常见问题以及相关的优化手段,并结合应用场景介绍对数据缓存加速的相关技术和策略。讲师介绍姚舜扬,花名辰山,阿里巴巴计算平台事业部 EMR 高级开发工程师,目前从事大数据存储方面的开发和优化工作

773 0

【Elasticsearch入门公开课 】10 | 基本概念:节点、集群、分片及副本

Elasticsearch 是一款非常强大的开源搜索及分析引擎,在 Search Engine 分类中长期位列第一。而Elasticsearch 除了搜索以外,结合生态 Kibana、Logstash和Beats,Elasticsearch还被广泛运用在大数据近实时分析场景中,包括日志分析、运维监控、信息安全等多个领域。本次入门课程主要帮大家从概念入手,并穿插底层技术讲解及教学实操,让您更深入的了解并如何运用Elasticsearch。为了让更多用户能够跟着教程边学边做,阿里云开发者社区为大家准备了阿里云Elasticsearch 3节点1核2G,1个月的免费实验环境。本节课主要为您讲解产品特征及发展历史公司愿景与商业模式【新用户开通】阿里云Elasticsearch 3节点1核2G免费1个月开通条件:新注册用户付费模式:包年包月服务选择:商业通用版,3节点1核2G版本【讲师简介】阮一鸣,eBay Pronto 平台技术负责人。极客时间《Elasticsearch 核心技术与实战》课程讲师Pronto平台目前管理了eBay 内部上百个Elasticsearch 集群,包括4000多个数据节点。这些集群目前被广泛使用在 eBay 的生产环境中。涵盖了网站搜索,商品推荐,日志管理,风险控制,IT运维,安全监控等多个领域钉钉扫码加入ES交流群,获取课程资料【课程收益】1、从概念到实操,轻松入门2、灵活运用ELK进行搜索与大数据分析3、阿里云开发者社区免费提供云ES(3节点1核2G )1个月免费实战环境课程目录3月03日 周二 19:30——20:30【01 | 课程介绍Elasticsearch核心技术与实战】3月03日 周二 19:45——20:00【02 | 内容综述及学习建议】3月03日 周二 20:00——20:15【03 | Elasticsearch简介及其发展历史】3月03日 周二 20:15——20:30【04 | Elastic Stack家族成员及其应用场景】3月04 周三 19:30——20:00【05 | Elasticsearch的安装与简单配置】3月05日 周四 19:30——20:00【06 | Kibanan的安装与界面快速浏览】3月09日 周一 19:30——20:00【07 | 在Docker容器中运行Elasticsearch Kibana和 Cerebro】3月10日 周二 19:30——20:00【08 | Logstash安装与导入数据】3月11日 周三 19:30——20:00【09 | 基本概念:索引、文档和REST API】3月12日 周四 19:30——20:00【10 | 基本概念:节点、集群、分片及副本】3月16日 周一 19:30——20:00【11 | 文档的基本CRUD与批量操作】3月17日 周二 19:30——20:00【12 | 倒排索引介绍】3月18日 周三 19:30——20:00【13 | 通过Analyzer进行分词】3月19日 周四 19:30——20:00【14 | Search API概览】3月23日 周一 19:30——20:00【15 | URI Search详解】3月24日 周二 19:30——20:00【16 | Request Body与Query DSL简介】3月25日 周三 19:30——20:00【17 | Query String&Simple Query String查询】3月26日 周四 19:30——20:00【18 | Dynamic Mapping和常见字段类型】3月30日 周一 19:30——20:00【19 | 显式Mapping设置与常见参数介绍】3月31日 周二 19:30——20:00【20 | 多字段特性及Mapping中配置自定义Analyzer】4月01日 周三 19:30——20:00【21 | Index Template和Dynamic Template】4月02日 周四 19:30——20:00【22 | Elasticsearch聚合分析简介】4月06日 周一 19:30——20:00【23 | 课程总结】

4415 0

Apache Flink 在字节跳动的实践与优化 | 企业实践专场

企业实践专场企业实践专场将邀请知名企业一线技术专家,分享大数据及人工智能最新技术进展和实践,详细解读Apache Flink在各行业的应用与落地,包括应用场景、业务痛点、面临挑战、如何破局等宝贵经验,并就大数据与人工智能等技术的发展趋势进行探讨和展望。讲师介绍张光辉,字节跳动流式计算技术负责人更多直播信息企业实践专场>>>Apache Flink 在字节跳动的实践与优化 | 企业实践专场Apache Flink在快手实时多维分析场景的应用 | 企业实践专场bilibili 实时平台的架构与实践 | 企业实践专场Apache Flink在滴滴的应用与实践 | 企业实践专场Apache Flink 在网易的实践 | 企业实践专场Apache Flink在中国农业银行的探索和实践 | 企业实践专场基于Apache Flink的爱奇艺实时计算平台建设实践 | 企业实践专场实时计算在贝壳的实践 | 企业实践专场基于Flink构建CEP引擎的挑战和实践 | 企业实践专场

3664 0
来自: 实时计算 Flink  版块

阿里巴巴在 Apache Flink 大规模持久化存储的实践之道 | Apache Flink 核心技术专场

Apache Flink核心技术专场数据的价值在于数据分析,而数据分析的挑战之一在于支撑大数据处理的平台技术。深度技术专题将邀请下一代大数据计算引擎Apache Flink创始团队及业界资深专家解析Flink技术动向,并回归技术本质,打造Flink全方位技术盛宴。讲师介绍唐云,Apache Flink Contributor,阿里巴巴高级开发工程师更多直播信息Apache Flink 核心技术专场>>>Pluggable Shuffle Service and Unaligned Checkpoint | Apache Flink 核心技术专场New Source API – Make it Easy! | Apache Flink 核心技术专场Stateful Functions | Apache Flink 核心技术专场Apache Flink新场景——OLAP引擎 | Apache Flink 核心技术专场New Feature and Improvements on State Backends in Flink 1.10 | Apache Flink 核心技术专场阿里巴巴在 Apache Flink 大规模持久化存储的实践之道 | Apache Flink 核心技术专场深入探索 Apache Flink SQL 流批统一的查询引擎与最佳实践 | Apache Flink 核心技术专场Using Apache Flink as a Unified Data Processing Platform | Apache Flink 核心技术专场Apache Flink 流批一体的资源管理与任务调度 | Apache Flink 核心技术专场

1588 2
来自: 实时计算 Flink  版块

实时数仓建设以及典型场景应用

本次分享会介绍实时数仓的思路以及一些实践,包括SparkStreaming SQL引擎,以及对Delta/Kudu/Druid/阿里云多种存储组件的深度整合;同时会在这个基础上介绍一些典型案例应用讲师介绍宋军,花名嵩林 阿里云EMR高级技术专家。从事Spark内核优化,对SparkCore/SprakSQL有深入了解,Spark Contributor

2405 0
|
大数据 MaxCompute
|

阿里云大数据数仓建设性能优化方式

阿里云大数据数仓建设性能优化方式

1480 0
来自: 大数据计算 MaxCompute  版块
|
大数据
|

从 Apache ORC 到 Apache Calcite | 第三讲 海胜专访《MaxCompute 与大数据查询引擎的技术和故事》

【直播主题】海胜专访《MaxCompute 与大数据查询引擎的技术和故事》【分享嘉宾】苑海胜 阿里云智能计算平台 高级技术专家 / Apache Calcite Committer / 前 Greenplum 数据库优化器 Team Lead / CMU硕士【直播时间】6月6日 16:00-16:50 【精彩剧透】MaxCompute与MPP数据库的比较分布式系统上Join是如何实现的MaxCompute 针对 Join 和聚合引入的 Hash 和 Range Clustering 的优化从中国到日本,再到美国,工作经历和体验有何差别

3599 57
来自: 大数据计算 MaxCompute  版块
|
12月前
|
SQL 数据可视化 架构师
|

DataWorks Notebook

DataWorks的Notebook提供了一个交互式、灵活且可复用的数据处理和分析环境,增强了直观性、模块化和交互性,帮助您更轻松地进行数据处理、探索、可视化和模型构建。

224 0
|
12月前
|

2024FFA分论坛-云原生

FFA2024云原生专场由Apache Flink核心贡献者与来自阿里云、网易游戏、小红书、美团、哔哩哔哩等公司的一线技术专家带来,聚焦Flink与云原生技术的结合,探讨如何在云原生环境中高效部署和深度优化Flink流批任务。通过实战经验分享,帮助开发者利用容器化、K8s、Serverless等工具,在稳定、性能、成本之间取得平衡。

519 0
来自: 实时计算 Flink  版块

[oeasy]ai大模型服务哪家大厂好_大模型服务平台横向评测_字节跳动扣子

[oeasy]ai大模型服务哪家大厂好_大模型服务平台横向评测_字节跳动扣子_百度千帆_阿里百炼

564 54

EMR StarRocks VS 开源版本功能差异介绍

EMR StarRocks 线上公开课 第2期直播亮点Serverless StarRocks 客户案例分享Serverless StarRocks VS 开源版本能力介绍讲师简介弘锐 - 阿里云 E-MapReduce 产品专家

537 0

生产实践专场(一)

生产实践专场集结字节跳动、华为、蚂蚁金服、Shopee、B站、快手、腾讯、京东物流、小红书的技术专家探讨基于 Flink 的实时场景下技术优化及实践。

907 1
来自: 实时计算 Flink  版块

批量识别发票,自动保存到Excel中

批量识别发票,自动保存到Excel中

407 0
|
Python
|

Python快速入门教程04

Python入门-流程控制语句(条件与循环)

366 0
|
Python
|

【第5讲】100个Word转PDF,Python批量办公自动化,告别无意义加班

【第5讲】100个Word转PDF,Python批量办公自动化,告别无意义加班

508 47

Flink Forward 核心技术 “Flink state的优化与remote state的探索”

Flink Forward 核心技术 “Flink state的优化与remote state的探索”张杨bilibili 资深开发工程师

634 0
来自: 实时计算 Flink  版块
|
人工智能 数据可视化 大数据
|

阿里云产业智能OpenTrek——数字医疗引擎Hdata

医疗健康数智平台Hdata提供符合医疗行业数据特性的数据治理和服务全套工具,具备简单易用、生态开放、算法智能、数据安全等特性,帮客户真正的管理好数据、用好数据、发挥好数据智能的价值。

4848 2

Flink Forward 核心技术“Apache Flink 1.16 功能解读”

Flink Forward 核心技术“Apache Flink 1.16 功能解读”黄兴勃 阿里云高级开发工程师

84153 0
来自: 实时计算 Flink  版块

Flink Forward Asia 生产实践专场 “How To Write Fast Flink SQL”

Flink Forward Asia 生产实践专场 “How To Write Fast Flink SQL”贺小令 阿里云高级技术专家

63124 0
来自: 实时计算 Flink  版块

Flink Forward Asia 2021 开源解决方案 2

开源大数据生态专场,来自 Pravega、Pulsar、TiDB、Zeppelin 等社区的技术专家围绕 Flink 的生态融合,探讨当下大数据的发展趋势与未来动向,并展现相关技术在一线生产场景的最佳实践。讲师/嘉宾简介1.《Mars on Flink:实时数据流上的 Pandas》付典 - 阿里巴巴高级技术专家,Apache Flink PMC2.《蚂蚁实时计算 Flink on OceanBase》陶然 - 阿里巴巴高级开发工程师,Apache Spark/Apache Flink Contributor周跃跃 - 蚂蚁集团 OceanBase 架构师3.《双剑合璧:Flink + StarRocks 构建实时数仓解决方案》谢寅 - StarRocks 解决方案架构师4.《使用 Apache Atlas 追踪 Apache Flink 的实时数据仓库血缘》刘岩 - Cloudera 解决方案工程师,Apache Hive/Apache Flink Contributor

3343 0
来自: 实时计算 Flink  版块

SaaS模式云数据仓库 MaxCompute 应用场景实践——基于MaxCompute + Hologres 的人群圈选和数据服务实践

介绍如何通过MaxCompute进行海量人群的标签加工,通过Hologres进行分析建模,从而支持大规模人群复杂圈选场景下的交互式体验,以及基于API的数据服务最佳实践。讲师简介刘一鸣 阿里云智能 高级产品专家

1450 51
来自: 大数据计算 MaxCompute  版块
|
大数据
|

外部工具连接SaaS模式云数仓MaxCompute—ETL工具篇

本次直播将介绍MaxCompute支持的三款开源ETL工具Kettle、Airflow、Azkaban以及连接示例。讲师简介龙青云 阿里云智能 技术支持经理

972 0
来自: 大数据计算 MaxCompute  版块

数据湖JindoFS+OSS 实操干货36讲 第二课

【第二课直播主题】1、如何将 HDFS 数据归档到 OSS2、如何将 Hive 数据按分区归档到 OSS【背景】为了让更多开发者了解并使用 JindoFS,由阿里云 JindoFS+OSS 团队打造的专业公开课【数据湖 JindoFS+OSS 实操干货36讲】会在每周二16:00准时开讲!从五大板块入手,玩转数据湖!讲师介绍辰石 - 阿里巴巴计算平台事业部 EMR 技术专家健身 - 阿里巴巴计算平台事业部 EMR 技术专家

1200 0

智能搜索引擎驱动电商业务增长实践

1、了解阿里云开放搜索2、通过在淘系产品搜索的最佳实践,介绍如何高效搭建智能搜索引擎,带动业务指数级增长3、如何通过开放搜索电商行业搜索增强模板快速构建更高水准的电商搜索服务讲师介绍阿里巴巴技术专家 徐希杰(希杰)

2551 0
来自: 智能搜索推荐  版块

第一节课:走进开源大数据平台 EMR

本节主要介绍EMR产品历史、选择理由、产品形态介绍开营介绍:夏俊鸾,花名亦龙,阿里云智能资深技术专家讲师:王晓平,花名子关,阿里巴巴 EMR 产品专家

1208 0

Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析

Spark Shuffle RPMem扩展提供了一个基于PMem 和RDMA 来加速Shuffle的方案,它采用PMem 作为Shuffle的存储介质,利用PMDK 用户态编程库进行数据读写,减小用户态、内核态切换与文件系统开销;用基于RDMA网络协议异构的传输层实现高性能数据传输;还将RDMA直接注册在PMem上,减少内存拷贝。本次直播介绍如何利用持久化内存与高性能RDMA 网络来加速Spark Shuffle。讲师介绍:张建,英特尔亚太研发有限公司大数据部门的软件工程经理,专注于大数据和机器学习中存储方案优化

2302 58
|
机器学习/深度学习
|

藏经阁电子书发布会第十期:AI是灵药还是猛兽?

时间:2020年9月2日 19:00-20:00讲师简介:黄博远,阿里云机器学习平台PAI产品负责人。十二年大数据与AI领域技术经验,十年技术管理经验,先后供职于微软、阿里巴巴集团,从是展示广告、搜索广告、电商广告、搜索、云计算等相关领域的技术工作。现任阿里云智能飞天AI平台(PAI)产品负责人、一站式大数据智能研发与治理平台DataWorks产品负责人。主题简介:AI是什么?AI赋予了很多商业业务宝贵的价值,我们日常用的搜索引擎就是应用AI的最大受益者;在电商领域,AI可以做推荐;在金融领域,AI可以做风控等等。对于很多新人来说,AI到底是什么?它似乎涵盖许多很高深的技术,学习AI需要学很多东西,想要抓住AI的风口,学AI甚至想玩转AI,有机会吗?阿里云机器学习平台技术专家给的答案是肯定的。首先,AI(人工智能)是什么呢?AI的本源是一门研究如何用机器来模拟人的智能的技术,让有以下能力:听——语音识别方面看——文字识别、图像识别等方面说——语音合成、人机对话等方面思考——推导数学公式、人机对弈等方面学习以及行动——自动驾驶等整个人工智能技术基本上围绕这些领域展开和迭代。其次,人人都能玩转AI吗?答案也是肯定的。学习AI需要解决算力、算法和数据的问题,加上真实场景来磨练。互联网尤其是移动互联网和换联网的迅猛发展辅助解决海量高质数据的问题;云计算和异构计算的发展辅助解决计算力的问题。而科技发展让整个生产率不断提高的同时不断地降低学习或使用技术的门槛。如同50多年以前,开车是一项非常重要或特殊的技能,司机备受大众敬仰,而今还会有很多人认为会开车的身份很特殊吗?可能不会了,反而是不会开车的人会让人觉得其身份特殊。AI其实也一样,它背后没有什么特别神秘的技术,技术的发展也使其使用和学习门槛在不断地降低。想深入了解AI源于何方、能够解决的典型问题?探讨AI是否能够替代或控制人类的话题?想知道如何像开车、用电脑、用智能手机一样掌握AI的技术?阿里云机器学习平台大神来给你降维讲解,带你了解AI历史,体验AI能力,并为你带来了《阿里云机器学习PAI-DSW入门指南》电子书的发布,带你进入人人都能玩儿AI的时代。教你如何轻松上手并告别纸上谈兵!

4643 57
来自: 人工智能平台PAI  版块

飞天大数据产品价值解读 — 云原生HSAP实时数仓 Hologres

分享人:李姗姗 阿里云智能 高级产品经理本次直播的主要内容将介绍从Lambda架构到HSAP实时数仓,以及Hologres产品架构、典型场景和客户案例。

2496 51
来自: 实时数仓 Hologres  版块

MaxCompute Spark与Spark SQL对比分析及使用注意事项

【直播主题】MaxCompute Spark与Spark SQL对比分析及使用注意事项【直播时间】2月19日 16:00-17:00【分享嘉宾】吴雷(沐行) 阿里云智能 高级售后技术工程师【直播简介】本次直播主要介绍Spark on MaxCompute和开源Spark上的区别,讲解加实战演示 Spark on MaxCompute如何使用。大数据技术公开课第一季《从开源到云原生,你不得不知的大数据实战》点击观看系列课程地址:https://yqh.aliyun.com/zhibo# J_9574411510加入「云栖号在线课堂」圈子,带你快速入门云计算!https://c.tb.cn/F3.Z8gvnK

4763 49
来自: 大数据计算 MaxCompute  版块

Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场

开源大数据生态专场”数据爆炸“时代下如何进行有效地大规模数据处理问题?大量数据处理技术与软件应运而生,形成当前百花齐放的开源大数据生态。本专场将围绕大数据开源生态、技术生态、商业生态探讨当下开源大数据的发展趋势与未来动向,并展现大数据相关技术在一线生产场景的优秀实践。讲师介绍李锐,Apache Hive PMC,Apache Flink Contributor,阿里巴巴技术专家王刚,阿里巴巴高级开发工程师更多直播信息开源大数据生态专场专场>>>YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场流处理基准测试 | 开源大数据生态专场Apache Flink and the Apache Way | 开源大数据生态专场Delivering stream data reliably with Pravega | 开源大数据生态专场Deep dive into Pyflink & integration with Zeppelin | 开源大数据生态专场Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场趣头条基于 Apache Flink+ClickHouse 构建实时数据分析平台 | 开源大数据生态专场基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

1307 0
来自: 实时计算 Flink  版块

Apache Flink 流批一体的资源管理与任务调度 | Apache Flink 核心技术专场

Apache Flink核心技术专场数据的价值在于数据分析,而数据分析的挑战之一在于支撑大数据处理的平台技术。深度技术专题将邀请下一代大数据计算引擎Apache Flink创始团队及业界资深专家解析Flink技术动向,并回归技术本质,打造Flink全方位技术盛宴。讲师介绍徐帅,阿里巴巴高级技术专家宋辛童,Apache Flink Contributor,阿里巴巴高级开发工程师更多直播信息Apache Flink 核心技术专场>>>Pluggable Shuffle Service and Unaligned Checkpoint | Apache Flink 核心技术专场New Source API – Make it Easy! | Apache Flink 核心技术专场Stateful Functions | Apache Flink 核心技术专场Apache Flink新场景——OLAP引擎 | Apache Flink 核心技术专场New Feature and Improvements on State Backends in Flink 1.10 | Apache Flink 核心技术专场阿里巴巴在 Apache Flink 大规模持久化存储的实践之道 | Apache Flink 核心技术专场深入探索 Apache Flink SQL 流批统一的查询引擎与最佳实践 | Apache Flink 核心技术专场Using Apache Flink as a Unified Data Processing Platform | Apache Flink 核心技术专场Apache Flink 流批一体的资源管理与任务调度 | Apache Flink 核心技术专场

2422 0
来自: 实时计算 Flink  版块

【EMR打造高效云原生数据分析引擎】

EMR-Jindo 是 EMR 推出的云原生 OLAP 引擎。凭借该引擎,EMR 成为第一个云上 TPC-DS 成绩提交者。经过持续不断地内核优化,目前基于最新 EMR-Jindo 引擎的 TPC-DS 成绩又有了大幅提高,达到了3615071,成本降低到 0.76 CNY。本次分享将介绍 EMR-Jindo 引擎背后的相关技术以及以 EMR-Jindo 为核心的云上大数据架构方案。主讲人辛现银(辛庸),阿里巴巴计算平台事业部 EMR 技术专家。Apache Hadoop,Apache Spark contributor。对 Hadoop、Spark、Hive、Druid 等大数据组件有深入研究。目前从事大数据云化相关工作,专注于计算引擎、存储结构、数据库事务等内容。

1336 0
|
大数据
|

开源大数据专场

围绕大数据的开源生态、技术生态、商业生态,分享当下开源大数据技术的发展趋势,并展示一线生产场景的最佳实践。

1314 0
来自: 大数据计算 MaxCompute  版块
|
8月前
|

DataWorks X MCP:数据开发治理Agent发布!

DataWorks X MCP产品演示:使用DataWorks MCP Server和Hologres MCP Server来自动化完成数据集成实时数据同步任务开发和Hologres数据分析。

456 0
|
9月前
|
人工智能 搜索推荐 数据处理
|

阿里云 OpenSearch 智能问答版 ➕ DeepSeek R1——打造 B站 UP 主题爆款选题器

阿里云OpenSearch智能问答版+DeepSeek R1,支持多模态数据和联网搜索。以B站up主题爆款选题器为例,打造你的个人专属AI助手,开启你的智能搜索之旅,让AI赋能你的开发! (转载自哔哩哔哩,已获得原作者@老麦的工具库 授权。原视频地址:https://www.bilibili.com/video/BV1M8QmYJEzm/)

441 2
来自: 智能搜索推荐  版块

2024FFA-分论坛-流式湖仓1

FFA2024流式湖仓专场由Apache Flink核心贡献者与来自淘天集团、抖音集团、vivo、小米、中原银行、阿里云智能、蚂蚁集团、贝壳找房、货拉拉等公司的一线技术专家解析流批一体、存算分离、湖仓融合的实时湖仓架构,探讨以Apache Paimon为流批一体湖存储的湖仓架构建设实践,如何帮助业务获得更实时的数据来驱动业务决策,并实现数据管理的降本增效。

759 0
来自: 实时计算 Flink  版块
|
Python
|

免费制作国庆微信头像,1行Python代码搞定,小白可用

免费制作国庆微信头像,1行Python代码搞定,小白可用

453 1
|
Python
|

【第6讲】把PPT转成1张长图,用Python只需要1行代码,小白入门必学

【第6讲】把PPT转成1张长图,用Python只需要1行代码,小白入门必学

378 1

Apache Paimon Meetup online:新一代流式数据湖平台开发动态及生产实践

Apache Paimon Meetup(第一期) 邀请到三位各大行业专家给大家带来主题分享。本次分享会介绍:Paimon 0.4 已经发布!本次 Meetup 会介绍 Paimon 0.4 的核心能力,用户场景,欢迎大家试用和反馈!字节在 Paimon 上提供了一个完整的 Streaming Warehouse 一致性视图,本次 Meetup 将会分享字节相关的实践和经验。来自同程的老师大规模落地了 Paimon,他将会介绍落地 Paimon 的生产实践。讲师/嘉宾简介阿里巴巴高级技术专家,Apache Flink PMC 李劲松(花名:之信)字节跳动基础架构工程师李明同程旅行大数据计算组负责人吴祥平

3423 2
来自: 实时计算 Flink  版块

3分钟开通阿里云检索分析服务Elasticsearch版免费试用

点此免费试用 ->保姆级教程!3分钟开通阿里云检索分析服务Elasticsearch版免费试用。阿里云检索分析服务Elasticsearch版兼容开源 ELK 功能,免运维全托管,适用于业务峰谷明显,提升企业数据检索与运维分析能力。

5454 1

Flink Forward 平台建设“小米基于Flink的实时计算资源治理实践”

Flink Forward 平台建设“小米基于Flink的实时计算资源治理实践”张蛟 小米高级软件工程师

1597 1
来自: 实时计算 Flink  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
67629
内容
128
活动
439468
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务