快下班了,正好准备去买彩票,就顺手写了2个脚本,一个用来下载最近的彩票数据,一个用来统计彩票数字,分享给大家!
彩票数据获取并写入excel表格
数据来源自己看吧~用外链通不过。。。
所用库:xlwt,requests,lxml
有几点需要注意的:
1、构建列表。因为存入excel文件的时候用的是列表,所以新建一个函数,分别取网页5个数据:时间、期数、开奖数123,然后每一页嵌套写入列表类似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取所有的数据!注意构建列表的形式和列表结果,这个在你写入表格的时候很重要!
2、写入数据。xlwt写入文件的方法为ws.write(行,列,数据),按行写入文件,所以新建一个变量line(代码第36行),每写入一行自增1。
其他方面都很简单,没有反爬,就是为了获取数据,好做分析!
最后excel表中的数据,是这样的:
最后大概有4840行数据,足够我们分析的了!
数据处理
用xlrd库就可以~话说xlwt库和xlrd库好像就是一个写数据,一个读数据。。。
就写了一个抓热门数字的,也就是取频率最高的。如果您有更好的想法或者玩法,可以自行去实现哦!
先读取数据,然后取到每一行的2.3.4列,每一列写入一个列表(现在有些后悔,不该写那么多数据进来),然后3个列表合并一个总列表,这样我们就有了4个列表,取出每一个列表中出现次数最多的那个数字,代码如下:
第1个数字频率最高的是 [3]
第2个数字频率最高的是 [6]
第3个数字频率最高的是 [8]
单个数字频率最高的是 [3]
因为赶时间下班。。就全部用了列表推导式,也没有用pandas库或者可视化库做出很炫酷的图表,等我研究出完美的预测方案的时候在做【手动哭泣】,不过依现在的趋势,是没什么希望了。。。
最后要说的是,从开始研究分析各种数据到现在习惯性的买彩票,没中过大奖(超过200的都算大奖)!果然童话都是骗人的……还是学python比较好玩!