Spark的搜索结果_文章_第5页-阿里云开发者社区

游客u7dljxi6kiud6

|

6月前

|

博文

本文介绍了爱奇艺大数据OLAP服务负责人林豪在StarRocks年度峰会上的分享，重点讲述了爱奇艺OLAP引擎的演进及引入StarRocks后的显著效果。在广告业务中，StarRocks替换Impala+Kudu后，接口性能提升400%，P90查询延迟缩短4.6倍；在“魔镜”数据分析平台中，StarRocks替代Spark达67%，P50查询速度提升33倍，P90提升15倍，节省4.6个人天。未来，爱奇艺计划进一步优化存算一体和存算分离架构，提升整体数据处理效率。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 运维 # OLAP # Spark

aliyun6039169770-29419

|

6月前

|

博文

|

来自：大数据与机器学习

基于云服务器的数仓搭建-hive/spark安装

本文介绍了在本地安装和配置MySQL、Hive及Spark的过程。主要内容包括： - **MySQL本地安装**：详细描述了内存占用情况及安装步骤，涉及安装脚本的编写与执行，以及连接MySQL的方法。 - **Hive安装**：涵盖了从上传压缩包到配置环境变量的全过程，并解释了如何将Hive元数据存储配置到MySQL中。 - **Hive与Spark集成**：说明了如何安装Spark并将其与Hive集成，确保Hive任务由Spark执行，同时解决了依赖冲突问题。 - **常见问题及解决方法**：列举了安装过程中可能遇到的问题及其解决方案，如内存配置不足、节点间通信问题等。

# 云原生数据仓库AnalyticDB MySQL版 # 云服务器 ECS # SQL # 分布式计算 # 关系型数据库 # HIVE # Spark

技术小达人

|

6月前

|

博文

湖仓实时化升级：Uniflow 构建流批一体实时湖仓

# 云原生数据仓库AnalyticDB MySQL版 # 存储 # 分布式计算 # 数据处理 # 流计算 # Spark

技术小达人

|

6月前

|

博文

官宣｜Apache Paimon 1.0 发布公告

# SQL # 分布式计算 # 流计算 # Spark # 索引

技术小达人

|

7月前

|

博文

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用

# 函数计算 # 对象存储 # 日志服务 # SQL # 分布式计算 # Serverless # 调度 # Spark

Echo_Wish

|

7月前

|

博文

|

来自：大数据与机器学习

从Excel到Hadoop：数据规模的进化之路

# 分布式计算 # Hadoop # 大数据 # 数据库 # Spark

赵渝强老师

|

7月前

|

博文

|

来自：大数据与机器学习

【赵渝强老师】Spark RDD的缓存机制

Spark RDD通过`persist`或`cache`方法可将计算结果缓存，但并非立即生效，而是在触发action时才缓存到内存中供重用。`cache`方法实际调用了`persist(StorageLevel.MEMORY_ONLY)`。RDD缓存可能因内存不足被删除，建议结合检查点机制保证容错。示例中，读取大文件并多次调用`count`，使用缓存后执行效率显著提升，最后一次计算仅耗时98ms。

# 存储 # 缓存 # 分布式计算 # Spark

阿里云大数据

|

7月前

|

博文

|

来自：大数据与机器学习

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # 函数计算 # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 物联网 # Serverless # Spark

Echo_Wish

|

7月前

|

博文

|

来自：大数据与机器学习

大数据与云计算：无缝结合，开启数据新纪元

# 云原生大数据计算服务 MaxCompute # 日志服务 # 存储 # 分布式计算 # 大数据 # 云计算 # Spark

Echo_Wish

|

7月前

|

博文

|

来自：大数据与机器学习

从Excel到大数据：别让工具限制你的思维！

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # 数据处理 # Spark # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark