解读|百分点凭啥能推出「中国首个行业AI决策系统」
早餐君印象里,百分点上一次重大产品发布还是两年前的企业级大数据操作系统(BD-OS)。随后就一直比较低调,直到两周前,百分点又传出个大消息,高调发布了中国首个行业AI决策系统产品Deep Matrix。
推荐系统中不得不说的DSSM双塔模型
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
本文主要介绍项目中用于商业兴趣建模的DSSM双塔模型。作为推荐领域中大火的双塔模型,因为效果不错并且对工业界十分友好,所以被各大厂广泛应用于推荐系统中。
使用Relational Cache加速EMR Spark数据分析
Relational Cache的强大功能赋予了Spark更多的可能,通过Relational Cache,用户可以提前将任意关系型数据(Table/View/Dataset)cache到任意Spark支持的DataSource中,并支持灵活的cache数据组织方式,基于此,Relational Cache可以在诸多应用场景中帮助用户加速Spark数据分析。
海量数据处理之蓄水池抽样算法
一、问题由来
这个题目的由来是在《编程珠玑》里遇到的,故记录一下。还可以这么说,”如何从二进制文件中等概率取整数?”或者”在不知道文件总行数的情况下,如何从文件中随机的抽取一行?”这个题目说的有点不清楚实际上是:一个二进制文件中有好多好多整数,你要随机取出一个。
雅捷一体化方案新品提速金融大数据
本文讲的是雅捷一体化方案新品提速金融大数据,3月28日,国内领先的金融大数据应用企业——上海雅捷信息技术股份有限公司在京举办了鸡年的首场新产品发布会。在本次发布会上,雅捷信息发布了三款重磅产品,包括DataTurbine大数据并行处理平台2.0版本以及DataTurbines-P、DataTurbines-D两种软硬件一体化解决方案。