开发者社区> 问答> 正文

【请教】最最基本的数据处理

想查找50名艺人所有歌曲的播放总量,如果用python该怎么做/SQL该怎么做。小白求教

展开
收起
爬梯 2016-05-25 13:56:46 4421 0
3 条回答
写回答
取消 提交回答
  • 回 2楼思丞的帖子
    谢谢思丞的详细解答。刚接触确实很多不会,有个不情之请,能不能把你统计的csv格式的结果发我邮箱一份, 530357172@qq.com 不胜感激~!
    2016-05-25 20:28:22
    赞同 展开评论 打赏
  • Re【请教】最最基本的数据处理
    所有歌曲的播放总量是指每个艺人的单独每首歌曲的播放总量,还是艺人下面所有歌曲加起来的播放总量?

    我还没有统计艺人的每首歌单独的播放量,我只统计了艺人所有歌曲在每一天的播放总量和:

    从mysql读的,很慢,读出来存为csv了

    我的 两张表跟给定数据结构完全一样:


    1、先用 “SELECT DISTINCT artist_id from songs ” 从songs表中读出艺人列表,这个很快,songs表数据不多


    2、再对艺人列表循环,对每个艺人统计,sql如下

    sql = "SELECT user_actions.song_id, user_actions.action_type, user_actions.date, songs.artist_id " +
                        "from user_actions inner join songs on user_actions.song_id = songs.song_id " +
                        "where songs.artist_id = \"" + artists + "\"";



    上述sql可以取出一个艺人的所有播放记录(),你可以参考下
    然后再用hashmap,分日期统计,统计后我再保存为csv


    挺慢,在4GB,双核2.8GHZ的PC上花了大概一下午吧。
    2016-05-25 18:00:38
    赞同 展开评论 打赏
  • Re【请教】最最基本的数据处理
    sum(播放次数)
    group by 艺人
    大概这样?
    2016-05-25 15:57:50
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
《前端智能化实践》——逻辑代码生成 立即下载
朱翥、贺小令|更快更稳更易用:Flink 自适应批处理能力演 立即下载
函数计算最佳实践:快速开发一个分布式 Puppeteer 网页截图服务 立即下载