Spark的搜索结果_热门_第6页-阿里云开发者社区

【方向】

|

博文

Python数据预处理：使用Dask和Numba并行化加速

本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度，非常直观，可供参考。

# 数据采集 # 大数据 # Python # 数据处理 # 程序员 # 机器学习/深度学习 # 分布式计算 # Spark # 网络协议 # C++

yq传送门

|

博文

长脸了！阿里云这位英雄拿下了世界第一 | 7月16号云栖夜读

今天的首篇文章，讲述了：阿里云数据库又被顶级机构点名了！近日，全球最知名的数据管理系统评测标准化TPC组织公布了数据库领域分析性能基准测试最新排名，阿里云超大规模分析型数据库AnalyticDB登上榜首，是全球首个通过TPC严格审计认证的云数据库产品。

# SQL # 分布式计算 # 数据库 # 对象存储 # Spark

mvpydq

|

博文

sparksql-cache小表实现mapjoin优化性能

# SQL # 分布式计算 # Spark

yexiang

|

博文

|

来自：数据库

阿里云MongoDB与EMR的HelloWorld

越来越多的应用采用MongoDB作为数据存储层，性能高，扩展性强，通过WriteCocern参数还可以控制写入持久级别，CAP上灵活配置。文档型的存储结构又是特别适合物联网，游戏等领域，这些数据也蕴藏这巨大的价值，就像是金矿一样，需要挖掘。虽然MongoDB提供了MapReduce功能，但功能相对薄

# 云数据库 MongoDB 版 # 云服务器 ECS # 对象存储 # 分布式计算 # NoSQL # Java # 对象存储 # Spark

周志湖

|

博文

Spark修炼之道（高级篇）——Spark源码阅读：第一节 Spark应用程序提交流程

作者：摇摆少年梦微信号： zhouzhihubeyond spark-submit 脚本应用程序提交流程在运行Spar应用程序时，会将spark应用程序打包后使用spark-submit脚本提交到Spark中运行，执行提交命令如下： root@sparkmaster:/hadoopLearning/spark-1.5.0-bin-hadoop2.4/bin# .

# 分布式计算 # Java # Spark # 网络架构

傲海

|

博文

|

来自：大数据与机器学习

【教程】5分钟在PAI算法市场发布自定义算法

概述在人工智能领域存在这样的现象，很多用户有人工智能的需求，但是没有相关的技术能力。另外有一些人工智能专家空有一身武艺，但是找不到需求方。这意味着在需求和技术之间需要一种连接作为纽带。今天PAI正式对外发布了“AI市场”以及“PAI自定义算法”两大功能，可以帮助用户5分钟将线下的spark算法或是pyspark算法发布成算法组件，并且支持组件发布到AI市场供更多用户使用。

# 人工智能平台 PAI # SQL # 人工智能 # 分布式计算 # 算法 # Spark

mvpydq

|

博文

Spark结合源码解决数据倾斜造成Too Large Frame

# 分布式计算 # Spark # Hadoop

百遇

|

博文

开源大数据技术专场（下午）:Databricks、Intel、阿里、梨视频的技术实践

本论坛第一次聚集阿里Hadoop、Spark、Hbase、Jtorm各领域的技术专家，讲述Hadoop生态的过去现在未来及阿里在Hadoop大生态领域的实践与探索。

# 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 分布式计算 # 大数据 # Spark # 流计算 # API # 对象存储 # Hadoop # SQL # 搜索推荐

新手站长网

|

博文

阿里云网络增强型云服务器计算型、通用型和内存型有什么区别？

阿里云网络增强型云服务器具有网络延迟低超强的网路收发包能力，网络增强型云服务器又分为计算型、通用型和内存型，那么三者有什么区别？新手站长网分享计算型、通用型和内存型网络增强云服务器的区别：计算型、通用型和内存型之间的区别计算型、通用型和内存型网络增强型云服务器的详细区别可以对比：ECS云服务器实例规格族官方详解 - 阿里云，官方有详细的对比说明：相同之处CPU处理器：2.

# 云服务器 ECS # 弹性计算 # 数据挖掘 # 数据库 # 前端开发 # 缓存 # 分布式计算 # Spark # 编解码 # Hadoop # 数据处理

云学习小组

|

博文

专访HDFS committer Intel 研发经理郑锴：EC之后，HDFS下一步新思考

在作为HDFS诞生以来的最大改进——支持了纠删码（erasure coding）之后，面对这个比较完善但并不十全十美的方案，面对Hadoop开源生态，HDFS的下一步将走向何处呢？

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Hadoop # 大数据 # Apache # Spark # 开发者 # 机器学习/深度学习 # 固态存储 # Java

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark