开源大数据平台 E-MapReduce的搜索结果_热门

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Apache Spark中国技术交流群升级到企业群啦！！！！！！

普通群容量已满足不了Spark群众日益增长的热情，因此我们做了一个重要的决定，将全部群成员转移到企业群

# 开源大数据平台 E-MapReduce # 分布式计算 # 机器人 # Linux # 应用服务中间件 # Apache # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

钉钉群直播【Koalas 介绍】

将每个关联结果都作为relational cache构建代价太大，并不现实，我们需要找到一种方式可以通过单个Relational Cache支持优化多个关联查询的方式，从而在加速用户查询的同时，减少创建和更新relational cache的代价。

# 开源大数据平台 E-MapReduce # 分布式计算 # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

7月31日Spark钉钉群直播【Apache Spark 在存储计算分离趋势下的数据缓存】

在数据上云的大背景下，存储计算分离逐渐成为了大数据处理的一大趋势，计算引擎需要通过网络读写远端的数据，很多情况下 IO 成为了整个计算任务的瓶颈，因而数据缓存成为此类场景下的一个重要的优化手段。本次分享将介绍 Spark 在数据缓存上的一些做法，并将介绍 EMR 自研的 Jindo 存储系统在数据缓存上的应用。

# 开源大数据平台 E-MapReduce # 存储 # 缓存 # 分布式计算 # Apache # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

钉钉群直播【Structured Steaming的进阶与实践】

structured steaming因其低时延和提供的SQL API等特性被越来越多的企业所使用，作为实时计算的首选。本次分享structured steaming的使用，包含spark 2.4 structured streaming的新特性，API原理和使用场景等的介绍。

# 开源大数据平台 E-MapReduce

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Spark Relational Cache实现亚秒级响应的交互式分析

阿里云E-MapReduce (EMR) 是构建在阿里云云服务器 ECS 上的开源 Hadoop、Spark、HBase、Hive、Flink 生态大数据 PaaS 产品。提供用户在云上使用开源技术建设数据仓库、离线批处理、在线流式处理、即时查询、机器学习等场景下的大数据解决方案。在2019杭州云栖大会大数据生态专场上，阿里巴巴技术专家王道远为大家分享了阿里云EMR的Spark Relational Cache实现亚秒级响应的交互式分析。

# 开源大数据平台 E-MapReduce # 分布式计算 # Spark # 存储 # 缓存 # SQL # 数据挖掘 # 对象存储 # 数据库 # 索引 # 大数据

开源大数据EMR

|

博文

|

来自：大数据与机器学习

8月28日社区直播【Spark Streaming SQL流式处理简介】

本次直播将简要介绍EMR Spark Streaming SQL，主要包含Streaming SQL的语法和使用，最后做demo演示

# 开源大数据平台 E-MapReduce # 流计算 # 分布式计算 # Spark # SQL

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

7月10日直播【E-MapReduce产品探秘，扩展开源生态云上的能力】

E-MapReduce的产品能力介绍，通过EMR来构建高效的云上大数据平台，优化云上的使用成本，更快的计算效率。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute

bean_stalk

|

博文

|

来自：大数据与机器学习

Spark Codegen浅析

Codegen是Spark Runtime优化性能的关键技术，核心在于动态生成java代码、即时compile和加载，把解释执行转化为编译执行。Spark Codegen分为Expression级别和WholeStage级别，分别针对表达式计算和全Stage计算做代码生成，都取得了数量级的性能提升。本文浅析Spark Codegen技术原理。

# 开源大数据平台 E-MapReduce # Java # 分布式计算 # Spark

云栖社区直播

|

博文

|

来自：大数据与机器学习

Delta元数据解析

本文介绍Delta的元数据管理相关内容，包括文件夹结构，元数据类型以及元数据产生流程等

# 开源大数据平台 E-MapReduce # 云解析DNS # 数据格式 # JSON # 流计算 # 存储 # 数据管理 # 分布式计算 # Spark # Apache # 大数据

CiiLii西里网

|

博文

|

来自：大数据与机器学习

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型，预训练于多样化数据集，支持18亿至720亿参数规模。在多模态英文任务中表现出色，且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互，提供智能体验。然而，模型在逻辑题和指令理解上存在不足，需在特定领域进行优化。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 搜索推荐 # 机器人

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce