诠释数据降维算法:一文讲尽t-分布邻域嵌入算法(t-SNE)如何有效利用
t-分布领域嵌入算法(t-SNE, t-distributed Stochastic Neighbor Embedding )是目前一个非常流行的对高维度数据进行降维的算法, 由Laurens van der Maaten和 Geoffrey Hinton于2008年提出。这个算法已经在机器学习领域
2017 CIKM机器学习大赛分析与总结
1 前言与背景
为提升对前沿算法技术的研究和理解,去年以个人参赛的方式参加了CIKM 国际数据挖掘大赛AnalytiCup,尝试在7月-8月的一个月时间内,利用业余时间,独立搭建了一套简单的自然语言学习框架,最终在与169支队伍竞技中获得第16名的成绩。
这次比赛是我个人的第一次简单尝试,由于业务较紧,年前没有时间写下来,现在回过头来总结
宏宝莱:快销企业的上云之路
四平宏宝莱饮品股份有限公司(以下简称宏宝莱)始建于1992年,经过多年不懈努力,宏宝莱行销区域遍及东北、华北、华东等全国大部分区域,多次被评为最受消费者喜爱饮料及冷饮品牌之一。
袋鼠云数据中台专栏(一) :浅析数据中台策略与建设实践
袋鼠云数据中台建设与策略已经脱离了一个单纯的产品概念范畴,更多的是关注于企业的整体数据化建设工作,希望通过数栈产品和七大数据服务贴身参与用户全方位与全过程的数据化建设。同时我们期待这样的数据化建设应当是高效率,高应用价值和低成本的。
它是真实的“盗梦空间”?在这里,一切都可能是数据
阿里妹导读:位于杭州阿里巴巴西溪园区旁边的大型商场“亲橙里”2018年正式开业。和传统的线下综合型商场不同的是,亲橙里从规划之初就定位为数字化商场,通过植入自研的IBOS平台完成建筑内的所有子系统的接入,而让建筑和建筑内的设备、空间、人的“在线”是我们数字化的第一个目标。
平台化三部曲之三流程编排 - 平台化是舞台,流程编排就是导演一场戏
在上两篇ATA中,第一篇讨论了平台的扩展性(《从Eclipse平台看交易平台化》),强调微内核和扩展机制实现,第二篇讨论平台的模块化开发(《Google Guice平台模块化开发的果汁》),强调业务隔离,松耦合。这这第三篇ATA中,想分享下平台化中另一个重要方面,平台的服务流程编排 (*备注:本文.