开源大数据平台 E-MapReduce-博文-第3页-阿里云开发者社区-阿里云

开心工作室V(kaic_kaic)

|

SQL 运维安全

|

博文

基于web漏洞扫描及分析系统设计_kaic

随着信息技术的发展和网络应用在我国的普及，针对我国境内信息系统的恶意网络攻击也越来越多，并且随着黑客攻击技术的不断地更新，网络犯罪行为变得越来越难以应对，用户日常访问的网站是否安全对于普通网民而言难以辨别，保护人民不受不法侵害也是难上加难。如何识别网站的潜在危险性，以及网站出现安全性问题该如何防御，尽可能减少网站被攻击后造成的实际损失，是目前迫切需要解决的难题。本文使用VMware虚拟机技术模拟真实的网络环境，使用渗透测试技术对模拟网络进行薄弱点测试信息收集、攻击测试等，再现了渗透测试的重要流程和技术方法。在对目标主机实施渗透测试时，会从系统层面和Web层面两个维度进行测试，扫描出存在的漏洞

467 0 0

扬流

|

SQL 分布式计算运维

|

博文

面向未来的开源 OLAP 技术架构探讨以及选型实践

本文详细介绍了开源大数据OLAP的演化过程和最佳实践。

10465 57 59

扬流

|

SQL 运维监控

|

博文

开源大数据平台 E-MapReduce Serverless StarRocks 产品介绍

本文将分享阿里云与 StarRocks 社区合作打造的云上 StarRocks 极速湖仓的云原生产品实践。主要包括四个部分，第一部分介绍 StarRocks 全托管形态，以及免运维服务的 OLAP 云产品；第二部分介绍 StarRocksManager 的实例管理、诊断分析、元数据管理、安全中心等功能；第三部分介绍在社交、在线教育、电商等场景的使用案例；最后是对产品的长短期规划。

7175 0 0

编程达人

|

分布式计算算法数据可视化

|

博文

带你读《2022年开源大数据热力报告》——研究目标和研究模型

1346 0 0

编程达人

|

存储数据可视化大数据

|

博文

带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

439 0 0

编程达人

|

存储分布式计算数据可视化

|

博文

带你读《2022年开源大数据热力报告》——热力趋势一：用户需求多样化推动技术多元化

399 0 0

编程达人

|

存储运维分布式计算

|

博文

带你读《2022年开源大数据热力报告》——热力趋势二：一体化演进迈入2.0时代

395 0 0

编程达人

|

存储分布式计算 Kubernetes

|

博文

带你读《2022年开源大数据热力报告》——热力趋势三：云原生大规模重构开源技术栈

398 0 0

编程达人

|

大数据

|

博文

带你读《2022年开源大数据热力报告》——开源大数据项目热力TOP30

357 0 0

编程达人

|

机器学习/深度学习存储 SQL

|

博文

带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究

314 0 0

扬流

|

SQL 关系型数据库 MySQL

|

博文

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

猿辅导大数据平台团队负责人申阳分享了猿辅导基于EMR StarRocks 的 OLAP 演进之路。

12872 4 8

扬流

|

存储运维资源调度

|

博文

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-4月刊

开源大数据EMR产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

854 1 1

扬流

|

SQL 存储监控

|

博文

水滴筹基于阿里云 EMR StarRocks 实战分享

水滴筹大数据部门的数据开发工程师韩园园老师为大家分享水滴筹基于阿里云EMR StarRocks的实战经验。

6733 3 4

扬流

|

存储机器学习/深度学习人工智能

|

博文

阿里云智能数据湖入选第六届数字中国建设峰会“十大硬核科技”

阿里云首创并推动的智能数据湖解决方案因“引领业界技术上创新”入选第六届数字中国建设峰会的“十大硬核科技”，这也是历届峰会中首次有数据湖产品入选。智能数据湖是阿里云在大数据和 AI 融合的时代背景下推出，底层融合存储和计算全新技术体系，业务侧融合多元计算，对接数据科学计算引擎。支撑在线教育、互联网广告、新媒体、网络游戏等近万家行业用户在快速发展过程中的业务需求，为企业数字化转型提供源动力。

1062 1 1

扬流

|

存储人工智能运维

|

博文

免费公测｜阿里云EMR Serverless StarRocks 公测正式开启！

阿里云EMR Serverless StarRocks 免费公测已开启，向所有用户开放！您可通过EMR控制台直接创建实例，轻松体验全托管、免运维的服务。

8072 1 1

扬流

|

数据挖掘 OLAP

|

博文

北京 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

4月19日（周三）下午，水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家，将针对开源 OLAP 技术架构、 StarRocks 产品硬核技术及 EMR StarRocks 实战经验等一系列超干货内容，为大家带来诚意满满的技术盛宴。

951 0 0

扬流

|

存储分布式计算运维

|

博文

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-3月刊

开源大数据EMR产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

48831 4 6

扬流

|

SQL 分布式计算监控

|

博文

阿里云EMR自定义日志投递与使用实践分享

EMR目前支持了日志管理，即日志客户SLS投递的功能，基于此功能，客户可以将需要的各种大数据组件日志收集到自身SLS中，做查询和分析。基于此功能，客户可以自定义日志路径、规则，对集群设备上的日志自行接收和消费。本文以采集指标文件为例，帮助您快速上手自定义日志投递与使用。

652 1 1

扬流

|

SQL JSON 分布式计算

|

博文

通过云监控CloudMonitor实时捕获EMR集群的状态变化

通过结合CloudMonitor以及FC，可以实时捕获EMR集群的生命周期变化，如集群的创建和停止，扩容和缩容以及其他类型的集群状态变更等。

6793 2 2

扬流

|

存储缓存算法

|

博文

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

11851 5 6

扬流

|

SQL 消息中间件分布式计算

|

博文

基于阿里云 CloudMonitor云监控自定义监控大盘对 EMR 自定义监控实践

本文旨在分享 EMR 平台大数据服务基于阿里云 CloudMonitor 的监控实践，给客户提供除了 EMR 平台默认监控以外，自建监控方式，适用于统一多个阿里云服务的监控监控场景。

1061 2 2

扬流

|

存储 SQL 缓存

|

博文

阿里云EMR 2.0：定义下一代云原生智能数据湖

本次分享主要介绍了阿里云云原生数据湖分析解决方案的三个核心要素：全托管，湖存储；一站式，湖管理；多模态，湖计算。

30249 1 5

阿里云大数据Al技术

|

存储分布式计算 Cloud Native

|

博文

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

本文整理自阿里云 EMR 数据开发团队负责人孙一凡（Evans 忆梵），在 Apache Spark & DS Meetup 的分享

1832 1 1

扬流

|

SQL 弹性计算分布式计算

|

博文

阿里云开源大数据平台E-MapReduce 产品新动态及开源大数据前沿技术分享 2023-2月刊

开源大数据平台 EMR 产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

10557 8 8

扬流

|

SQL 运维资源调度

|

博文

开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化

在本篇文章中，我们将介绍大数据集群领域所需的可观测性，实践大数据集群可观测所需要的条件和面临的挑战，以及阿里云EMR 产品如何通过 EMR Doctor 实现大数据可观测并向用户提供相关能力。

17751 4 5

扬流

|

SQL 存储分布式计算

|

博文

阿里云EMR 2.0：兼容开源，贡献开源，超越开源

本文整理自阿里云资深技术专家吴威(无谓)在阿里云EMR2.0线上发布会的分享。本文从开源的角度出发，分享了阿里云EMR团队的工作。

1353 0 0

扬流

|

SQL 消息中间件分布式计算

|

博文

基于数据湖格式构建流式增量数仓—CDC

该文章内容源于 Apache Con ASIA 2022上的分享，整理归纳成文章。

15502 5 8

扬流

|

存储 SQL 弹性计算

|

博文

阿里云EMR2.0平台：让大数据更简单

作为国内开源大数据领域的引领者，EMR2.0在平台体验、数据开发、产品形态及数据分析等方面做了全面突破与创新，重新定义了新一代开源大数据平台。本文介绍如何利用EMR新平台实现更加低成本、高效率、智能化的大数据集群管控和应用开发。

1604 0 1

扬流

|

存储 SQL 分布式计算

|

博文

StarRocks 2.5 LTS 版本新特性介绍及阿里云EMR Serverless StarRocks火热邀测中

StarRocks 2.5 LTS 版本于近期发布，阿里云EMR Serverless StarRocks也在火热邀测中。本文将重点介绍StarRocks 2.5版本核心功能以及阿里云EMR Serverless StarRocks特性。

1283 0 0

扬流

|

存储分布式计算 Kubernetes

|

博文

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

69631 0 7

阿里云大数据Al技术

|

存储分布式计算 Kubernetes

|

博文

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

934 0 0

扬流

|

SQL 存储弹性计算

|

博文

阿里云EMR 2.0：重新定义新一代开源大数据平台

本次分享主要介绍了阿里云E-MapReduce的开发历程，EMR 2.0的新特性、产品架构，以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新，重新定义新一代开源大数据平台。

3277 0 2

扬流

|

分布式计算大数据 Apache

|

博文

直播预约｜Apache Spark + DolphinScheduler Meetup 1月11日正式上线

洞悉 Spark 任务调度新能力｜Apache Spark + DolphinScheduler Meetup 将于 1 月 11 日在线上举办

281 1 1

项羽@阿里云大数据

|

存储人工智能运维

|

博文

阿里云开源大数据平台升级EMR2.0发布性能最高可提升6倍

阿里云EMR2.0为用户提供了全新的平台、开发、资源形态、分析场景等更优的产品体验，通过EMR Doctor健康检查、全面的服务巡检和事件通知、节点故障补偿等运维能力的升级，预估运维成本可降低20%-30%。新平台致力于为客户快速构建高性价比、安全可靠、兼容生态的开源大数据平台。

1059 0 0

扬流

|

分布式计算大数据 Java

|

博文

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark Meetup | 1 月线上直播报名通道已开启，赶快报名预约吧！

772 0 1

扬流

|

分布式计算大数据 Java

|

博文

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark Meetup | 1 月线上直播报名通道已开启，赶快报名预约吧！

897 0 0

bigdatatang

|

存储运维大数据

|

博文

大数据上云存算分离演进思考与探讨-2022

当前大数据上云与存算分离的技术趋势越来越成为行业标准与发展方向。作为大数据商业化的践行者，从存算分离的演进/定义/价值/架构应用/实践/对比等多个维度来分析与探讨其发展历程与组成体系。为大数据存算分离技术整体发展添砖加瓦。

3665 2 8

扬流

|

存储运维分布式计算

|

博文

阿里云开源大数据平台EMR全面升级性能最高可提升6倍

12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0，升级后的开源大数据平台在成本持平的情况下，扩缩容性能最高可提升6倍。

877 0 0

扬流

|

分布式计算 Cloud Native 数据可视化

|

博文

直播预约｜阿里云EMR 2.0 重磅发布

面向未来，构建新一代开源大数据基础设施！阿里云EMR 2.0 发布会将于12月27日14点在线上举办。

477 0 0

扬流

|

存储 SQL 缓存

|

博文

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

本文为作者在 StarRocks Summit Asia 2022 上的分享

1573 0 0

扬流

|

存储弹性计算数据管理

|

博文

直播预告｜数据仓库？数据湖？停止纠结，流批融合的极速 Lakehouse来了！

无需数据导入，即可体验性能堪比数仓的数据湖分析！2022年12月8日19点，StarRocks Lakehouse Meetup - 极速湖仓分析技术专场线上直播重磅开启，精彩不容错过！

544 0 0

扬流

|

SQL 存储运维

|

博文

EMR-StarRocks 与 Flink 在汇量实时写入场景的最佳实践

本文详细介绍了 EMR-StarRocks 与 Flink 在汇量实时写入场景的最佳实践。

2589 1 3

阿里云大数据Al技术

|

存储分布式计算资源调度

|

博文

Spark on k8s 在阿里云 EMR 的优化实践

本文整理自阿里云技术专家范佚伦在7月17日阿里云数据湖技术专场交流会的分享。

1992 0 0

阿里云大数据Al技术

|

SQL 存储 JSON

|

博文

基于 Delta Lake 构建数据湖仓体系

本文整理自阿里云开源大数据平台技术专家毕岩在7月17日阿里云数据湖技术专场交流会的分享。

1333 0 1

扬流

|

存储缓存运维

|

博文

基于EMR的新一代数据湖存储加速技术详解

本文整理自阿里云开源大数据平台数据湖存储团队孙大鹏在7月17日阿里云数据湖技术专场交流会的分享。

993 0 0

扬流

|

存储 SQL 分布式计算

|

博文

数据湖管理及优化

本文整理自阿里云开源大数据高级开发工程师杨庆苇在7月17日阿里云数据湖技术专场交流会的分享。

1330 0 0

扬流

|

SQL 存储弹性计算

|

博文

EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器

E-MapReduce 推出面向开源大数据集群的智能运维诊断系统 E-MapReduce Doctor，有效提升大数据集群运维效率，辅助 EMR 用户完善集群监控体系。

3829 0 0

扬流

|

SQL 存储分布式计算

|

博文

数据湖统一元数据与权限

本文整理自阿里云数据湖构建与分析研发熊佳树在7月17日阿里云数据湖技术专场交流会的分享。

2151 0 0

扬流

|

存储 SQL 分布式计算

|

博文

数据湖架构及概念简介

本文整理自阿里云开源大数据技术专家陈鑫伟在7月17日阿里云数据湖技术专场交流会的分享。

4212 0 4

安妮Annie

|

人工智能达摩院算法

|

博文

2022世界人工智能大会大模型主题论坛星光云集，共话大模型的创新与生态发展！

本次“大规模预训练模型”主题论坛由阿里巴巴集团主办，世界人工智能大会组委会指导，整体围绕“大规模预训练模型的创新、落地和开源开放”展开，将探讨的边界延伸至算法模型、大数据及训练框架等方向，邀请到来自阿里巴巴，澜舟科技，清华大学，粤港澳大湾区数字经济研究院，深势科技，复旦大学等机构，在大规模预训练模型领域深耕多年的领军人物，通过keynote演讲和圆桌论坛两个环节，展示国产大模型多元生态下的技术成果和思考。

1883 0 0

开源大数据平台 E-MapReduce

最新

博文

E-MapReduce

视频

免费试用

全部内容

问答

电子书

活动

学习

基于web漏洞扫描及分析系统设计_kaic

面向未来的开源 OLAP 技术架构探讨以及选型实践

开源大数据平台 E-MapReduce Serverless StarRocks 产品介绍

带你读《2022年开源大数据热力报告》——研究目标和研究模型

带你读《2022年开源大数据热力报告》——热力“摩尔定律”和热力图谱

带你读《2022年开源大数据热力报告》——热力趋势一：用户需求多样化推动技术多元化

带你读《2022年开源大数据热力报告》——热力趋势二：一体化演进迈入2.0时代

带你读《2022年开源大数据热力报告》——热力趋势三：云原生大规模重构开源技术栈

带你读《2022年开源大数据热力报告》——开源大数据项目热力TOP30

带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-4月刊

水滴筹基于阿里云 EMR StarRocks 实战分享

阿里云智能数据湖入选第六届数字中国建设峰会“十大硬核科技”

免费公测｜阿里云EMR Serverless StarRocks 公测正式开启！

北京 Meetup 邀你来｜阿里云 × StarRocks 云上StarRocks极速湖仓

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-3月刊

阿里云EMR自定义日志投递与使用实践分享

通过云监控CloudMonitor实时捕获EMR集群的状态变化

数据湖存储的安全写入之道

基于阿里云 CloudMonitor云监控自定义监控大盘对 EMR 自定义监控实践

阿里云EMR 2.0：定义下一代云原生智能数据湖

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

阿里云开源大数据平台E-MapReduce 产品新动态及开源大数据前沿技术分享 2023-2月刊

开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化

阿里云EMR 2.0：兼容开源，贡献开源，超越开源

基于数据湖格式构建流式增量数仓—CDC

阿里云EMR2.0平台：让大数据更简单

StarRocks 2.5 LTS 版本新特性介绍及阿里云EMR Serverless StarRocks火热邀测中

Spark+Celeborn：更快，更稳，更弹性

Spark+Celeborn：更快，更稳，更弹性

阿里云EMR 2.0：重新定义新一代开源大数据平台

直播预约｜Apache Spark + DolphinScheduler Meetup 1月11日正式上线

阿里云开源大数据平台升级EMR2.0发布 性能最高可提升6倍

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

Apache Spark + 海豚调度：PB 级数据调度挑战，教你如何构建高效离线工作流

大数据上云存算分离演进思考与探讨-2022

阿里云开源大数据平台EMR全面升级 性能最高可提升6倍

直播预约｜阿里云EMR 2.0 重磅发布

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

直播预告｜数据仓库？数据湖？停止纠结，流批融合的极速 Lakehouse来了！

EMR-StarRocks 与 Flink 在汇量实时写入场景的最佳实践

Spark on k8s 在阿里云 EMR 的优化实践

基于 Delta Lake 构建数据湖仓体系

基于EMR的新一代数据湖存储加速技术详解

数据湖管理及优化

EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器

数据湖统一元数据与权限

数据湖架构及概念简介

2022世界人工智能大会大模型主题论坛星光云集，共话大模型的创新与生态发展！

活跃用户

相关产品

阿里云开源大数据平台升级EMR2.0发布性能最高可提升6倍

阿里云开源大数据平台EMR全面升级性能最高可提升6倍