开源大数据平台 E-MapReduce的搜索结果_热门

阿里云大数据

|

1月前

|

博文

|

来自：大数据与机器学习

EMR AI助手开启公测：用AI重塑大数据运维，更简单、更智能

EMR AI 助手开启公测，通过合理利用 EMR AI 助手的各项功能，可以快速查询资源信息、唤起相关操作、诊断组件异常、获取技术支持等，能帮您提升运维效率和操作体验。

# 开源大数据平台 E-MapReduce # 人工智能 # 弹性计算 # 运维 # 自然语言处理 # 大数据

开源大数据EMR

|

博文

|

来自：大数据与机器学习

使用Spark Streaming SQL进行PV/UV统计

PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析，例如广告主可以通过PV值预估投放广告网页所带来的流量以及广告收入。另外一些场景需要对访问的用户作分析，比如分析用户的网页点击行为，此时就需要对UV做统计。

# 开源大数据平台 E-MapReduce # 云数据库 Tair（兼容 Redis） # 日志服务 # 分布式计算 # Spark # SQL # 流计算 # NoSQL # Redis

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Hive性能优化（全面）

Hadoop的计算框架特性下的HIve有效的优化手段

# 开源大数据平台 E-MapReduce # 日志服务 # SQL # 分布式计算 # 负载均衡 # 算法 # Oracle # Hadoop # 关系型数据库 # 调度 # HIVE # Spark

开发者说

|

博文

|

来自：大数据与机器学习

使用Databricks作为分析平台

SPARK+AI SUMMIT 2020中文精华版线上峰会将会带领大家一起回顾2020年的SPARK又产生了怎样的最佳实践，技术上取得了哪些突破，以及周边的生态发展。本文是阿里巴巴高级技术专家章剑锋做的相关分享，介绍了YipitData公司基于Databricks平台搭建的分析平台。

# 开源大数据平台 E-MapReduce # 大数据开发治理平台 DataWorks # 存储 # JSON # 分布式计算 # DataWorks # 数据挖掘 # API # Spark # 数据格式 # Python # 人工智能

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

多数据源一站式入湖

通过一站式入湖，将不同数据源的数据统一归并到以OSS对象存储为基础架构的集中式数据湖存储中，解决了企业面临的数据孤岛问题，为统一的数据分析打好了基础.

# 开源大数据平台 E-MapReduce # 对象存储 # 表格存储 # 日志服务 # 存储 # SQL # 分布式计算 # NoSQL # 关系型数据库 # 数据库 # 对象存储 # 流计算 # Spark # RDS

扬流

|

博文

|

来自：大数据与机器学习

阿里云EMR 2.0：重新定义新一代开源大数据平台

本次分享主要介绍了阿里云E-MapReduce的开发历程，EMR 2.0的新特性、产品架构，以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新，重新定义新一代开源大数据平台。

# 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # 实时计算 Flink版 # 对象存储 # 开源大数据平台 E-MapReduce # SQL # 存储 # 弹性计算 # 运维 # 分布式计算 # DataWorks # 大数据 # 数据挖掘 # API # Spark

扬流

|

博文

|

来自：大数据与机器学习

王日宇：基于 StarRocks 和 Paimon 打造湖仓分析新范式

本文根据 StarRocks Summit 2023 演讲实录整理而成，主要分享了基于 StarRocks 和 Paimon 打造湖仓分析方案及背后的技术原来和未来规划。

# 对象存储 # 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 存储 # SQL # Java # 对象存储 # C++

aliyun4381607004

|

博文

阿里云E-MapReduce Trino专属集群外连引擎及权限控制踩坑实践

本文以云厂商售后技术支持的角度，从客户的需求出发，对于阿里云EMR-Trino集群的选型，外连多引擎的场景、Ldap以及Kerberos鉴权等问题进行了简要的实践和记录，模拟客户已有的业务场景，满足客户需求的同时对过程中的问题点进行解决、记录和分析，包括但不限于Mysql、ODPS、Hive connector的配置，Hive、Delta及Hudi等不同表格式读取的兼容，aws s3、阿里云 oss协议访问异常的解决等。

# 对象存储 # 云数据库 RDS MySQL 版 # 开源大数据平台 E-MapReduce # 云服务器 ECS # SQL # 分布式计算 # 关系型数据库 # HIVE # 对象存储

蚂蚁数据智能技术

|

博文

|

来自：大数据与机器学习

从数据积累到大模型的智能飞跃，你准备好了吗？

在数据驱动的时代，人工智能（AI）正重塑世界。蚂蚁集团的师文汇在「DATA+AI」论坛上发表演讲，阐述了《数据驱动的AI原生应用与开放框架》。他指出，AI应用经历了从数据积累到大模型的智能飞跃，数据已成为智能应用成功的关键。师文汇强调，构建智能应用需结合优质大模型与行业数据。演讲还介绍了AI原生应用的研发变革与挑战，包括编程模型转变、研发范式的不确定性及与现有系统的交互等问题。此外，他还分享了AI原生应用框架的思考与探索，提出了泛ETL、实验反馈机制及应对不确定性等解决方案，并展示了DB-GPT在政企、金融等多个领域的应用案例。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 人工智能 # 自然语言处理 # BI # 数据处理 # 索引

尼不要逗了

|

博文

|

来自：大数据与机器学习

分布式快照算法: Chandy-Lamport

Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照（Distributed Snapshot）算法 Chandy-Lamport 算法，那么分布式快照算法可以用来解决什么问题呢？

# 开源大数据平台 E-MapReduce # 分布式计算 # 算法 # 大数据 # 流计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce