开源大数据平台 E-MapReduce的搜索结果_文章

墨祤

|

博文

|

基于OpenLake的Flink+Paimon+EMR StarRocks流式湖仓分析

阿里云OpenLake解决方案建立在开放可控的OpenLake湖仓之上，提供大数据搜索与AI一体化服务。通过元数据管理平台DLF管理结构化、半结构化和非结构化数据，提供湖仓数据表和文件的安全访问及IO加速，并支持大数据、搜索和AI多引擎对接。本文为您介绍以Flink作为Openlake方案的核心计算引擎，通过流式数据湖仓Paimon（使用DLF 2.0存储）和EMR StarRocks搭建流式湖仓。

# 云原生数据仓库AnalyticDB MySQL版 # 域名与网站 # 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 实时计算 Flink版 # 专有网络VPC # SQL # 流计算 # 关系型数据库 # MySQL # 数据库

赵渝强老师

|

博文

|

来自：大数据与机器学习

【赵渝强老师】部署Hadoop的本地模式

本文介绍了Hadoop的目录结构及本地模式部署方法，包括解压安装、设置环境变量、配置Hadoop参数等步骤，并通过一个简单的WordCount程序示例，演示了如何在本地模式下运行MapReduce任务。

# 开源大数据平台 E-MapReduce # 分布式计算 # 资源调度 # Hadoop # Java

扬流

|

博文

|

来自：大数据与机器学习

EMR Serverless Spark：一站式全托管湖仓分析利器

本文根据2024云栖大会阿里云 EMR 团队负责人李钰（绝顶）演讲实录整理而成

# 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 开源大数据平台 E-MapReduce # 函数计算 # 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # Serverless # 调度 # Spark

扬流

|

博文

|

来自：大数据与机器学习

降本60% ，阿里云 EMR StarRocks 全新发布存算分离版本

阿里云 EMR Serverless StarRocks 现已推出全新存算分离版本，该版本不仅基于开源 StarRocks 进行了全面优化，实现了存储与计算解耦架构，还在性能、弹性伸缩以及多计算组隔离能力方面取得了显著进展。

# 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 函数计算 # 对象存储 # SQL # 存储 # 缓存 # Serverless # 对象存储

扬流

|

博文

|

来自：大数据与机器学习

阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse

讲师焦明烨介绍了StarRocks的数据湖能力，如何使用阿里云EMR StarRocks构建基于Paimon的极速实时湖仓，StarRocks与Paimon的最新进展及未来规划。

# 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 函数计算 # 对象存储 # SQL # 存储 # 缓存 # Serverless # 对象存储

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

大数据&AI产品月刊【2024年9月】

大数据& AI 产品技术月刊【2024年9月】，涵盖本月技术速递、2024云栖大会实录、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

# 云原生数据仓库AnalyticDB MySQL版 # 大数据开发治理平台 DataWorks # 开源大数据平台 E-MapReduce # 函数计算 # 实时数仓 Hologres # 云原生大数据计算服务 MaxCompute # 人工智能 # 分布式计算 # 大数据 # Serverless # 云栖大会

蚂蚁数据智能技术

|

博文

|

来自：大数据与机器学习

从数据积累到大模型的智能飞跃，你准备好了吗？

在数据驱动的时代，人工智能（AI）正重塑世界。蚂蚁集团的师文汇在「DATA+AI」论坛上发表演讲，阐述了《数据驱动的AI原生应用与开放框架》。他指出，AI应用经历了从数据积累到大模型的智能飞跃，数据已成为智能应用成功的关键。师文汇强调，构建智能应用需结合优质大模型与行业数据。演讲还介绍了AI原生应用的研发变革与挑战，包括编程模型转变、研发范式的不确定性及与现有系统的交互等问题。此外，他还分享了AI原生应用框架的思考与探索，提出了泛ETL、实验反馈机制及应对不确定性等解决方案，并展示了DB-GPT在政企、金融等多个领域的应用案例。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 人工智能 # 自然语言处理 # BI # 数据处理 # 索引

蚂蚁数据智能技术

|

博文

|

来自：大数据与机器学习

DB-GPT v0.6.0 版本更新，发布六大核心新特性！

DB-GPT v0.6.0 版本已发布，这是一个开源的AI原生数据应用开发框架，带来了多项新特性，包括AWEL协议升级至2.0，支持复杂编排；改进的数据应用创建与生命周期管理，支持多模式构建；GraphRAG增强图社区摘要与混合检索，图索引成本降低50%；丰富的Agent Memory类型；支持Text2NLU与Text2GQL微调；GPT-Vis前端可视化升级。这些更新助力企业快速构建智能数据应用，推动数字化转型。

# 开源大数据平台 E-MapReduce # 人工智能 # 数据可视化 # 前端开发 # 知识图谱 # 索引

扬流

|

博文

|

来自：大数据与机器学习

云栖实录 | 阿里云 OpenLake 解决方案重磅发布：多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

阿里云 OpenLake 解决方案重磅发布，构建大数据、搜索、AI 一体化的能力体系，实现多模态数据统一纳管、多种计算引擎平权计算、大数据 AI 一体化开发，助力企业基于数据资产构筑竞争力。

# 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 存储 # 人工智能 # 分布式计算 # 数据管理 # 大数据

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR Serverless Spark 版正式开启商业化

阿里云 EMR Serverless Spark 版正式开启商业化，内置 Fusion Engine，100% 兼容开源 Spark 编程接口，相比于开源 Spark 性能提升300%；提供 Notebook 及 SQL 开发、调试、发布、调度、监控诊断等一站式数据开发体验！

# 云原生数据仓库AnalyticDB MySQL版 # 函数计算 # 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # SQL # 分布式计算 # Serverless # 调度 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce