实战
第一步:确定要采集的目标,请求数据
今天我们要采集的网站关于基金股票一类的。
链接奉上:http://www.sse.com.cn/
今天我们要抓取的就是展示该图像的背后数据,Go 搞起。大家记得关注呀👍👍将持续更新。😁
import requests
url = 'http://yunhq.sse.com.cn:32041//v1/sh1/line/000001?begin=0&end=-1&select=time%2Cprice%2Cvolume&_=1635851354208'
# 请求网页
json_str = requests.get(url, headers={'Referer': 'http://www.sse.com.cn/market/price/trends/'}).text
print(json_str)
第二步:解析数据
import json
# 转换
data = json.loads(json_str)
print(data['line'])
第三步:保存数据
保存数据可以参照我前面写的爬虫博客;
有openpyxl、xlwt、pandas等excel保存方式;
也有讲txt、doc文档等保存方式。
如果不想保存数据,大家可以直接通过matplotlib、seaborn、pyecharts等绘制数据分析可视化图像。