春节前,各大基金都创下了历史新高,基民们群情激愤,奋力冲向基金市场,一时间,基金成了最热的话题,貌似热搜都上过好几次。无奈,春节后,基金又遭遇了杀估值的暴跌,起起伏伏,上上下下,基民只哭的稀里哗啦。
其实,波动是资本市场的最爱,没有波动就没有利润(亏损),基金投资是一门很深的学问。今天,我爬取了天天基金网所有开放基金的全部数据送给大家,读者大人们有时间可以通过python或者excel分析分析数据,让自己精进,成为高手,早日实现财富自由。
天天基金爬取的界面为:
这里面7495只开放基金,如图:
下面我们就用Python爬虫来实现对这7495只基金的爬取。具体代码如下:
from selenium import webdriverimport timeimport pandas as pd #启动chrome浏览器driver=webdriver.Chrome()driver.start_client()driver.get('http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;s6yzf;pn10000;ddesc;qsd20200313;qed20210313;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb')#通过等待时间来控制页面加载time.sleep(1)#通过find_elements_by_css_selector方法找到相关表格wtb=driver.find_elements_by_css_selector('#dbtable > tbody >tr')#定义一个列表whole_text=[]for tb in wtb: tt=tb.text.replace('\n',' ') kk=tt.split() whole_text.append(kk)#加上列标题col=['序号','基金代码','基金简称','日期','单位净值','累计净值','日增长率','近1周','近1月','近3月','近6月','近1年','近2年','近3年','今年来','成立来','自定义','手续费']df=pd.DataFrame(whole_text)df.columns=coldf.to_excel('所有开放基金.xls',index=False)
爬取最终结果如下:
COPY下代码用python跑一下吧😄
没有安装python的小伙伴,如果想获得数据,可以后台回复:基金,即可获得相应excel数据链接,期待你财富自由的一天。好了,本期到这里,下期再见!(BTW:如果有人想问我为何没用requests爬取,因为爬不到!)