开源大数据平台 E-MapReduce-博文-第3页-阿里云开发者社区-阿里云

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求速卖通商品详情数据方法，速卖通商品详情API接口，速卖通API接口申请指南

438 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求lazada商品详情数据方法，lazada商品详情API接口，lazadaAPI接口申请指南

375 0 0

winx_19970108018

|

XML JSON 缓存

|

博文

Json实现根据商品ID请求拼多多商品详情数据方法，拼多多商品详情API接口，拼多多API接口申请指南

695 0 0

灵杰开发者

|

分布式计算资源调度 Kubernetes

|

博文

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生

网易数帆软件工程师潘成，在 ASF CommunityOverCode Asia 2023（北京）的分享。

1139 0 0

扬流

|

SQL 运维 DataWorks

|

博文

EMR Serverless StarRocks + DataWorks 开启极速分析新体验

EMR Serverless StarRocks + DataWorks ，开启极速分析体验

1676 0 0

扬流

|

存储分布式计算大数据

|

博文

CommunityOverCode Asia 精彩回顾｜阿里云开源大数据 EMR 技术实践分享

阿里云开源大数据 EMR 在 CommunityOverCode Asia 的精彩分享。

945 0 0

扬流

|

分布式计算 DataWorks 对象存储

|

博文

全链路数据湖开发治理解决方案2.0重磅升级，全面增强数据入湖、调度和治理能力

阿里云全链路数据湖开发治理解决方案能力持续升级，发布2.0版本。解决方案包含开源大数据平台E-MapReduce(EMR) ，一站式大数据数据开发治理平台DataWorks ，数据湖构建DLF，对象存储OSS等核心产品。支持EMR新版数据湖DataLake集群（on ECS）、自定义集群（on ECS）、Spark集群（on ACK）三种形态，对接阿里云一站式大数据开发治理平台DataWorks，沉淀阿里巴巴十多年大数据建设方法论，为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力，帮助客户提升数据的应用效率。

1930 1 2

扬流

|

存储 Cloud Native 数据挖掘

|

博文

直播｜深入解析 StarRocks 存算分离--云原生湖仓 Meetup#2

8月17日19点，云原生湖仓线上Meetup，深入解析 StarRocks 存算分离，多位大咖分享，干货满满，快来报名！~

859 1 1

行十三

|

存储弹性计算运维

|

博文

EMR Serverless StarRocks体验报告

本次测评报告我将从功能、稳定性、性能、运维、成本和收益等方面对EMR Serverless StarRocks进行评估，以确保该产品能够满足业务需求并提供有用的参考信息。通过本次测评，我希望能够为用户提供有用的参考信息，帮助他们做出明智的决策。

654 58 58

扬流

|

SQL 分布式计算监控

|

博文

EMR Workflow 开启公测，100%兼容开源 Apache DolphinScheduler

EMR Workflow 是一个全托管的工作流和任务调度服务，100%兼容开源 Apache DolphinScheduler。它提供了易于使用的调度服务，您可以通过可视化的操作界面轻松地管理工作流和任务，高效构建数据仓库，并为生产任务的稳定运行提供保障。

936 1 1

扬流

|

运维数据挖掘 OLAP

|

博文

上海 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

7月15日下午14:00-17:00，《上海线下Meetup I 云上StarRocks极速湖仓》，欢迎参加！

870 0 0

eisc

|

Ubuntu Linux

|

博文

centos ubuntu 自动安装 gcc12 g++12 make4 cmake3.2

自动适配编译安装

1561 0 0

扬流

|

存储 SQL 数据可视化

|

博文

EMR Serverless StarRocks 5000CU*时免费试用——体验极致性能和全面 OLAP 分析

EMR Serverless StarRocks 5000CU*H 计算资源，48000GB*H存储资源免费试用进行中，提供极致的性能和丰富的 OLAP 场景模型，包括 OLAP 多维分析、数据湖分析、高并发查询以及实时数据分析，快来体验吧！

1986 0 0

开心工作室V(kaic_kaic)

|

SQL 运维安全

|

博文

基于web漏洞扫描及分析系统设计_kaic

随着信息技术的发展和网络应用在我国的普及，针对我国境内信息系统的恶意网络攻击也越来越多，并且随着黑客攻击技术的不断地更新，网络犯罪行为变得越来越难以应对，用户日常访问的网站是否安全对于普通网民而言难以辨别，保护人民不受不法侵害也是难上加难。如何识别网站的潜在危险性，以及网站出现安全性问题该如何防御，尽可能减少网站被攻击后造成的实际损失，是目前迫切需要解决的难题。本文使用VMware虚拟机技术模拟真实的网络环境，使用渗透测试技术对模拟网络进行薄弱点测试信息收集、攻击测试等，再现了渗透测试的重要流程和技术方法。在对目标主机实施渗透测试时，会从系统层面和Web层面两个维度进行测试，扫描出存在的漏洞

621 0 0

扬流

|

SQL 分布式计算运维

|

博文

面向未来的开源 OLAP 技术架构探讨以及选型实践

本文详细介绍了开源大数据OLAP的演化过程和最佳实践。

10800 57 59

扬流

|

SQL 运维监控

|

博文

开源大数据平台 E-MapReduce Serverless StarRocks 产品介绍

本文将分享阿里云与 StarRocks 社区合作打造的云上 StarRocks 极速湖仓的云原生产品实践。主要包括四个部分，第一部分介绍 StarRocks 全托管形态，以及免运维服务的 OLAP 云产品；第二部分介绍 StarRocksManager 的实例管理、诊断分析、元数据管理、安全中心等功能；第三部分介绍在社交、在线教育、电商等场景的使用案例；最后是对产品的长短期规划。

7413 0 0

编程达人

|

分布式计算算法数据可视化

|

博文

带你读《2022年开源大数据热力报告》——研究目标和研究模型

1437 0 0

编程达人

|

存储数据可视化大数据

|

博文

带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

516 0 0

编程达人

|

存储分布式计算数据可视化

|

博文

带你读《2022年开源大数据热力报告》——热力趋势一：用户需求多样化推动技术多元化

463 0 0

编程达人

|

存储运维分布式计算

|

博文

带你读《2022年开源大数据热力报告》——热力趋势二：一体化演进迈入2.0时代

473 0 0

编程达人

|

存储分布式计算 Kubernetes

|

博文

带你读《2022年开源大数据热力报告》——热力趋势三：云原生大规模重构开源技术栈

498 0 0

编程达人

|

大数据

|

博文

带你读《2022年开源大数据热力报告》——开源大数据项目热力TOP30

419 0 0

编程达人

|

机器学习/深度学习存储 SQL

|

博文

带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究

376 0 0

扬流

|

SQL 关系型数据库 MySQL

|

博文

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

猿辅导大数据平台团队负责人申阳分享了猿辅导基于EMR StarRocks 的 OLAP 演进之路。

13373 5 9

扬流

|

存储运维资源调度

|

博文

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-4月刊

开源大数据EMR产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

946 1 1

扬流

|

SQL 存储监控

|

博文

水滴筹基于阿里云 EMR StarRocks 实战分享

水滴筹大数据部门的数据开发工程师韩园园老师为大家分享水滴筹基于阿里云EMR StarRocks的实战经验。

7073 3 4

扬流

|

存储机器学习/深度学习人工智能

|

博文

阿里云智能数据湖入选第六届数字中国建设峰会“十大硬核科技”

阿里云首创并推动的智能数据湖解决方案因“引领业界技术上创新”入选第六届数字中国建设峰会的“十大硬核科技”，这也是历届峰会中首次有数据湖产品入选。智能数据湖是阿里云在大数据和 AI 融合的时代背景下推出，底层融合存储和计算全新技术体系，业务侧融合多元计算，对接数据科学计算引擎。支撑在线教育、互联网广告、新媒体、网络游戏等近万家行业用户在快速发展过程中的业务需求，为企业数字化转型提供源动力。

1155 1 1

扬流

|

存储人工智能运维

|

博文

免费公测｜阿里云EMR Serverless StarRocks 公测正式开启！

阿里云EMR Serverless StarRocks 免费公测已开启，向所有用户开放！您可通过EMR控制台直接创建实例，轻松体验全托管、免运维的服务。

8382 1 1

扬流

|

数据挖掘 OLAP

|

博文

北京 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

4月19日（周三）下午，水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家，将针对开源 OLAP 技术架构、 StarRocks 产品硬核技术及 EMR StarRocks 实战经验等一系列超干货内容，为大家带来诚意满满的技术盛宴。

1070 0 0

扬流

|

存储分布式计算运维

|

博文

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-3月刊

开源大数据EMR产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

48947 4 6

扬流

|

SQL 分布式计算监控

|

博文

阿里云EMR自定义日志投递与使用实践分享

EMR目前支持了日志管理，即日志客户SLS投递的功能，基于此功能，客户可以将需要的各种大数据组件日志收集到自身SLS中，做查询和分析。基于此功能，客户可以自定义日志路径、规则，对集群设备上的日志自行接收和消费。本文以采集指标文件为例，帮助您快速上手自定义日志投递与使用。

796 1 1

扬流

|

SQL JSON 分布式计算

|

博文

通过云监控CloudMonitor实时捕获EMR集群的状态变化

通过结合CloudMonitor以及FC，可以实时捕获EMR集群的生命周期变化，如集群的创建和停止，扩容和缩容以及其他类型的集群状态变更等。

6878 2 2

扬流

|

存储缓存算法

|

博文

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

12037 5 6

扬流

|

SQL 消息中间件分布式计算

|

博文

基于阿里云 CloudMonitor云监控自定义监控大盘对 EMR 自定义监控实践

本文旨在分享 EMR 平台大数据服务基于阿里云 CloudMonitor 的监控实践，给客户提供除了 EMR 平台默认监控以外，自建监控方式，适用于统一多个阿里云服务的监控监控场景。

1210 2 2

扬流

|

存储 SQL 缓存

|

博文

阿里云EMR 2.0：定义下一代云原生智能数据湖

本次分享主要介绍了阿里云云原生数据湖分析解决方案的三个核心要素：全托管，湖存储；一站式，湖管理；多模态，湖计算。

30618 1 5

阿里云大数据Al技术

|

存储分布式计算 Cloud Native

|

博文

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

本文整理自阿里云 EMR 数据开发团队负责人孙一凡（Evans 忆梵），在 Apache Spark & DS Meetup 的分享

2172 1 1

扬流

|

SQL 弹性计算分布式计算

|

博文

阿里云开源大数据平台E-MapReduce 产品新动态及开源大数据前沿技术分享 2023-2月刊

开源大数据平台 EMR 产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

10689 8 8

扬流

|

SQL 运维资源调度

|

博文

开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化

在本篇文章中，我们将介绍大数据集群领域所需的可观测性，实践大数据集群可观测所需要的条件和面临的挑战，以及阿里云EMR 产品如何通过 EMR Doctor 实现大数据可观测并向用户提供相关能力。

17987 4 5

扬流

|

SQL 存储分布式计算

|

博文

阿里云EMR 2.0：兼容开源，贡献开源，超越开源

本文整理自阿里云资深技术专家吴威(无谓)在阿里云EMR2.0线上发布会的分享。本文从开源的角度出发，分享了阿里云EMR团队的工作。

1498 0 0

扬流

|

SQL 消息中间件分布式计算

|

博文

基于数据湖格式构建流式增量数仓—CDC

该文章内容源于 Apache Con ASIA 2022上的分享，整理归纳成文章。

15670 5 8

扬流

|

存储 SQL 弹性计算

|

博文

阿里云EMR2.0平台：让大数据更简单

作为国内开源大数据领域的引领者，EMR2.0在平台体验、数据开发、产品形态及数据分析等方面做了全面突破与创新，重新定义了新一代开源大数据平台。本文介绍如何利用EMR新平台实现更加低成本、高效率、智能化的大数据集群管控和应用开发。

1780 0 1

扬流

|

存储 SQL 分布式计算

|

博文

StarRocks 2.5 LTS 版本新特性介绍及阿里云EMR Serverless StarRocks火热邀测中

StarRocks 2.5 LTS 版本于近期发布，阿里云EMR Serverless StarRocks也在火热邀测中。本文将重点介绍StarRocks 2.5版本核心功能以及阿里云EMR Serverless StarRocks特性。

1540 0 0

扬流

|

存储分布式计算 Kubernetes

|

博文

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

69990 0 7

阿里云大数据Al技术

|

存储分布式计算 Kubernetes

|

博文

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

1050 0 0

扬流

|

SQL 存储弹性计算

|

博文

阿里云EMR 2.0：重新定义新一代开源大数据平台

本次分享主要介绍了阿里云E-MapReduce的开发历程，EMR 2.0的新特性、产品架构，以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新，重新定义新一代开源大数据平台。

3547 0 2

扬流

|

分布式计算大数据 Apache

|

博文

直播预约｜Apache Spark + DolphinScheduler Meetup 1月11日正式上线

洞悉 Spark 任务调度新能力｜Apache Spark + DolphinScheduler Meetup 将于 1 月 11 日在线上举办

353 1 1

项羽@阿里云大数据

|

存储人工智能运维

|

博文

阿里云开源大数据平台升级EMR2.0发布性能最高可提升6倍

阿里云EMR2.0为用户提供了全新的平台、开发、资源形态、分析场景等更优的产品体验，通过EMR Doctor健康检查、全面的服务巡检和事件通知、节点故障补偿等运维能力的升级，预估运维成本可降低20%-30%。新平台致力于为客户快速构建高性价比、安全可靠、兼容生态的开源大数据平台。

1169 0 0

扬流

|

分布式计算大数据 Java

|

博文

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark Meetup | 1 月线上直播报名通道已开启，赶快报名预约吧！

964 0 1

扬流

|

分布式计算大数据 Java

|

博文

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark Meetup | 1 月线上直播报名通道已开启，赶快报名预约吧！

1018 0 0

bigdatatang

|

存储运维大数据

|

博文

大数据上云存算分离演进思考与探讨-2022

当前大数据上云与存算分离的技术趋势越来越成为行业标准与发展方向。作为大数据商业化的践行者，从存算分离的演进/定义/价值/架构应用/实践/对比等多个维度来分析与探讨其发展历程与组成体系。为大数据存算分离技术整体发展添砖加瓦。

4179 2 8

开源大数据平台 E-MapReduce

最新

博文

用户案例

免费试用

问答

视频

电子书

学习

活动

Json实现根据商品ID请求速卖通商品详情数据方法，速卖通商品详情API接口，速卖通API接口申请指南

Json实现根据商品ID请求lazada商品详情数据方法，lazada商品详情API接口，lazadaAPI接口申请指南

Json实现根据商品ID请求拼多多商品详情数据方法，拼多多商品详情API接口，拼多多API接口申请指南

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生

EMR Serverless StarRocks + DataWorks 开启极速分析新体验

CommunityOverCode Asia 精彩回顾｜阿里云开源大数据 EMR 技术实践分享

全链路数据湖开发治理解决方案2.0重磅升级，全面增强数据入湖、调度和治理能力

直播｜深入解析 StarRocks 存算分离--云原生湖仓 Meetup#2

EMR Serverless StarRocks体验报告

EMR Workflow 开启公测，100%兼容开源 Apache DolphinScheduler

上海 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

centos ubuntu 自动安装 gcc12 g++12 make4 cmake3.2

EMR Serverless StarRocks 5000CU*时免费试用——体验极致性能和全面 OLAP 分析

基于web漏洞扫描及分析系统设计_kaic

面向未来的开源 OLAP 技术架构探讨以及选型实践

开源大数据平台 E-MapReduce Serverless StarRocks 产品介绍

带你读《2022年开源大数据热力报告》——研究目标和研究模型

带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

带你读《2022年开源大数据热力报告》——热力趋势一：用户需求多样化推动技术多元化

带你读《2022年开源大数据热力报告》——热力趋势二：一体化演进迈入2.0时代

带你读《2022年开源大数据热力报告》——热力趋势三：云原生大规模重构开源技术栈

带你读《2022年开源大数据热力报告》——开源大数据项目热力TOP30

带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-4月刊

水滴筹基于阿里云 EMR StarRocks 实战分享

阿里云智能数据湖入选第六届数字中国建设峰会“十大硬核科技”

免费公测｜阿里云EMR Serverless StarRocks 公测正式开启！

北京 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-3月刊

阿里云EMR自定义日志投递与使用实践分享

通过云监控CloudMonitor实时捕获EMR集群的状态变化

数据湖存储的安全写入之道

基于阿里云 CloudMonitor云监控自定义监控大盘对 EMR 自定义监控实践

阿里云EMR 2.0：定义下一代云原生智能数据湖

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

阿里云开源大数据平台E-MapReduce 产品新动态及开源大数据前沿技术分享 2023-2月刊

开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化

阿里云EMR 2.0：兼容开源，贡献开源，超越开源

基于数据湖格式构建流式增量数仓—CDC

阿里云EMR2.0平台：让大数据更简单

StarRocks 2.5 LTS 版本新特性介绍及阿里云EMR Serverless StarRocks火热邀测中

Spark+Celeborn：更快，更稳，更弹性

Spark+Celeborn：更快，更稳，更弹性

阿里云EMR 2.0：重新定义新一代开源大数据平台

直播预约｜Apache Spark + DolphinScheduler Meetup 1月11日正式上线

阿里云开源大数据平台升级EMR2.0发布 性能最高可提升6倍

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

大数据上云存算分离演进思考与探讨-2022

活跃用户

相关产品

阿里云开源大数据平台升级EMR2.0发布性能最高可提升6倍