阿里99大促 | 模型识别背后的样本生成
淘宝大促有近百个模块、上千个页面,模块间具有相似性,并且模块内部具备多种状态,如果想要准确识别每个模块类型,单模块的样本数量至少要达到万级,而人工标注成本高、效率低下、数据量少,纯靠人力是无法满足模型诉求的。基于此,今天,我来介绍下,模型识别背后的大批量数据样本生成的技术方案。
公网数据采集比较(LogHub vs 自建前端机)
对一些应用场景而言,需要实时收集公网数据,例如移动端,HTML网页,PC、服务器、硬件设备、摄像头等实时数据进行处理。
在传统的架构中,一般通过前端服务器+Kafka这样的搭配来实现如上的功能。现在日志服务的LogHub功能能够代替这类架构,并提供更稳定、低成本、弹性、安全的解决方案。我们来比
【译Py】数据科学面试终极指南05
【译Py】数据科学面试终极指南
【译Py】数据科学面试终极指南01
【译Py】数据科学面试终极指南02
【译Py】数据科学面试终极指南03
【译Py】数据科学面试终极指南04
【译Py】数据科学面试终极指南05
【译Py】数据科学面试终极指南06
【译Py】数据科学面试终极指南07
招聘经理的想法
Will Kurt(Quick Sprout公司)访谈
Will Kurt
个人简介:Will Kurt是Quick Sprout的数据科学家。