KMeans算法的Mapreduce实现
在本文中我使用KMeans算法实现搜狗搜索数据集上的MapReduce程序。K-Means算法输入聚类个数k,以及源数据,并将源数据分为k类输出。在分类后的数据中,同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
Dremio架构分析
一.Dremio架构
Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
色彩让生活多姿多彩
2017年2月22日云栖TechDay29期,阿里云交互设计师、用户体验研究专员行休/雩烜和大家一起谈谈设计师如何玩数据。本文主要从色彩是什么样的开始谈起,接着阐述了为什么色彩做导购,着重分享了提案细节,最后对创作过程等做了总结。