数据挖掘

首页 标签 数据挖掘
# 数据挖掘 #
关注
26756内容
KMeans算法的Mapreduce实现
在本文中我使用KMeans算法实现搜狗搜索数据集上的MapReduce程序。K-Means算法输入聚类个数k,以及源数据,并将源数据分为k类输出。在分类后的数据中,同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
Dremio架构分析
一.Dremio架构 Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
阿里云发布竞价实例:面向专业客户的高性价比之选
在云栖大会广东分会上,阿里云宣布推出“竞价实例”,该产品充分利用云计算的规模效应,客户将有机会用低至平时1折的价格做灵活的小时级短期计算,首批产品将定向邀请使用。
色彩让生活多姿多彩
2017年2月22日云栖TechDay29期,阿里云交互设计师、用户体验研究专员行休/雩烜和大家一起谈谈设计师如何玩数据。本文主要从色彩是什么样的开始谈起,接着阐述了为什么色彩做导购,着重分享了提案细节,最后对创作过程等做了总结。
免费试用