大数据环境下该如何优雅地设计数据分层
发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对数据仓库有一定的重视,而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式,它是一整套包括了etl、调度、建模在内的完整的理论体系。
XGBOOST原理解析
1.引言最近,因为一些原因,自己需要做一个小范围的XGBoost的实现层面的分享,于是干脆就整理了一下相关的资料,串接出了这份report,也算跟这里的问题相关,算是从一个更偏算法实现的角度,提供一份参考资料吧。
阿里十年经验输出,大数据平台“数加”的前世今生
阿里云大数据业务资深专家张金银和王峰在 “云栖大会上海峰会”的深度分享。核心是从历史发展的角度解读集阿里巴巴十年的大数据能力以及上万名工程师实战检验于一身,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条的阿里云一站式大数据平台“数加”。