Spark

首页 标签 Spark
# Spark #
关注
9105内容
Python数据预处理:使用Dask和Numba并行化加速
本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度,非常直观,可供参考。
长脸了!阿里云这位英雄拿下了世界第一 | 7月16号云栖夜读
今天的首篇文章,讲述了:阿里云数据库又被顶级机构点名了!近日,全球最知名的数据管理系统评测标准化TPC组织公布了数据库领域分析性能基准测试最新排名,阿里云超大规模分析型数据库AnalyticDB登上榜首,是全球首个通过TPC严格审计认证的云数据库产品。
| |
来自: 数据库
阿里云MongoDB与EMR的HelloWorld
越来越多的应用采用MongoDB作为数据存储层,性能高,扩展性强,通过WriteCocern参数还可以控制写入持久级别,CAP上灵活配置。文档型的存储结构又是特别适合物联网,游戏等领域,这些数据也蕴藏这巨大的价值,就像是金矿一样,需要挖掘。虽然MongoDB提供了MapReduce功能,但功能相对薄
Spark修炼之道(高级篇)——Spark源码阅读:第一节 Spark应用程序提交流程
作者:摇摆少年梦 微信号: zhouzhihubeyond spark-submit 脚本应用程序提交流程 在运行Spar应用程序时,会将spark应用程序打包后使用spark-submit脚本提交到Spark中运行,执行提交命令如下: root@sparkmaster:/hadoopLearning/spark-1.5.0-bin-hadoop2.4/bin# .
【教程】5分钟在PAI算法市场发布自定义算法
概述 在人工智能领域存在这样的现象,很多用户有人工智能的需求,但是没有相关的技术能力。另外有一些人工智能专家空有一身武艺,但是找不到需求方。这意味着在需求和技术之间需要一种连接作为纽带。 今天PAI正式对外发布了“AI市场”以及“PAI自定义算法”两大功能,可以帮助用户5分钟将线下的spark算法或是pyspark算法发布成算法组件,并且支持组件发布到AI市场供更多用户使用。
开源大数据技术专场(下午):Databricks、Intel、阿里、梨视频的技术实践
本论坛第一次聚集阿里Hadoop、Spark、Hbase、Jtorm各领域的技术专家,讲述Hadoop生态的过去现在未来及阿里在Hadoop大生态领域的实践与探索。
阿里云网络增强型云服务器计算型、通用型和内存型有什么区别?
阿里云网络增强型云服务器具有网络延迟低超强的网路收发包能力,网络增强型云服务器又分为计算型、通用型和内存型,那么三者有什么区别?新手站长网分享计算型、通用型和内存型网络增强云服务器的区别: 计算型、通用型和内存型之间的区别 计算型、通用型和内存型网络增强型云服务器的详细区别可以对比:ECS云服务器实例规格族官方详解 - 阿里云,官方有详细的对比说明: 相同之处CPU处理器:2.
专访HDFS committer Intel 研发经理郑锴:EC之后,HDFS下一步新思考
在作为HDFS诞生以来的最大改进——支持了纠删码(erasure coding)之后,面对这个比较完善但并不十全十美的方案,面对Hadoop开源生态,HDFS的下一步将走向何处呢?
免费试用