【请教】最最基本的数据处理
Re【请教】最最基本的数据处理
所有歌曲的播放总量是指每个艺人的单独每首歌曲的播放总量,还是艺人下面所有歌曲加起来的播放总量?
我还没有统计艺人的每首歌单独的播放量,我只统计了艺人所有歌曲在每一天的播放总量和:
从mysql读的,很慢,读出来存为csv了
我的
两张表跟给定数据结构完全一样:
1、先用 “SELECT DISTINCT artist_id from songs ” 从songs表中读出艺人列表,这个很快,songs表数据不多
2、再对艺人列表循环,对每个艺人统计,sql如下
sql = 'SELECT user_actions.song_id, user_actions.action_type, user_actions.date, songs.artist_id ' +
'from user_actions inner join songs on user_actions.song_id = songs.song_id ' +
'where songs.artist_id = \'' + artists
+ '\'';
上述sql可以取出一个艺人的所有播放记录(),你可以参考下然后再用hashmap,分日期统计,统计后我再保存为csv挺慢,在4GB,双核2.8GHZ的PC上花了大概一下午吧。
赞0
踩0