Spark的搜索结果_文章_第4页-阿里云开发者社区

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

Hadoop生态系统：从小白到老司机的入门指南

# SQL # 分布式计算 # Hadoop # 大数据 # Spark

阿里云基础设施.

|

6月前

|

博文

月之暗面Kimi大模型海量数据预处理实践

加速大模型的训练迭代，在模型数据预处理方面，需要高性价比、弹性灵活的 CPU 和 GPU 算力满足模型迭代的业务实践。

# 数据采集 # 分布式计算 # 监控 # 对象存储 # Spark

游客kufrkwrbkmpsa

|

6月前

|

博文

【YashanDB知识库】Hive 命令工具insert崖山数据库报错

# SQL # 分布式计算 # 数据库 # HIVE # Spark

游客u7dljxi6kiud6

|

6月前

|

博文

vivo 湖仓架构的性能提升之旅

聚焦 vivo 大数据多维分析面临的挑战、StarRocks 落地方案及应用收益。在 **即席分析** 场景，StarRocks 使用占比达 70%，查询速度提升 3 倍，P50 耗时从 63.77 秒缩短至 22.30 秒，查询成功率接近 98%。在 **敏捷 BI** 领域，StarRocks 已完成 25% 切换，月均查询成功数超 25 万，P90 查询时长缩短至 5 秒，相比 Presto 提升 75%。在 **研发工具平台** 方面，StarRocks 支持准实时数据查询，数据可见性缩短至 3 分钟，查询加速使 P95 延迟降至 400 毫秒，开发效率提升 30%。

# 云原生数据仓库AnalyticDB MySQL版 # SQL # 缓存 # 分布式计算 # BI # Spark

游客pb5c4iyea3ani

|

6月前

|

博文

【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错

# SQL # 分布式计算 # 数据库 # HIVE # Spark

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Hadoop # 大数据 # Spark

阿里云基础设施.

|

6月前

|

博文

打破资源边界、告别资源浪费：ACK One 多集群Spark和AI作业调度

ACK One多集群Spark作业调度，可以帮助您在不影响集群中正在运行的在线业务的前提下，打破资源边界，根据各集群实际剩余资源来进行调度，最大化您多集群中闲置资源的利用率。

# 容器服务Kubernetes版 # 人工智能 # 分布式计算 # 调度 # Spark # 容器

瓴羊Dataphin

|

6月前

|

博文

Dataphin功能Tips系列（47）-支持通过Spark本地客户端提交Spark Batch任务

支持通过Spark本地客户端提交Spark Batch任务

# 分布式计算 # 监控 # Java # Spark # 容器

瓴羊Dataphin

|

6月前

|

博文

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

# SQL # 分布式计算 # 资源调度 # HIVE # Spark

蓝易云

|

6月前

|

博文

如何在IDE中通过Spark操作Hive

通过以上方法和代码示例，你可以在IDE中成功通过Spark操作Hive，实现大规模数据处理和分析。确保理解每一步的实现细节，应用到实际项目中时能有效地处理各种复杂的数据场景。

# SQL # 分布式计算 # IDE # HIVE # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark