关于MapReduce,sql官方内部使用方法的问题
回1楼jxu的帖子
我们现在就想构造一些简单的特征,首先建立一个最基本的(user,brand)对的表格,表格包含了所有user,brand对,然后每一行就是每天该用户对于该品牌的四种行为,假设共有120天,那么就有120*4维的数据,每一维对应于当天点击,购买,收藏或者加入购物车的次数。如果粗暴的建立的话,我们也能建立出来,但是想用点简单的方法,比如循环什么的,但是ODPS貌似没有,不知有什么办法解决类似的问题?现在和数据作斗争的时间远远超过算法时间啊,自己想做的完全实现不了,很是尴尬。
赞0
踩0