Pandas爬虫:某浪财经机构持股汇总

简介: Pandas爬虫:某浪财经机构持股汇总

本期,我们用python中的pandas实现的对网页的爬虫,用Pandas爬取表格数据有一定的局限性,它只适合抓取Table表格型数据。网站结构类似于以下:


<table class="..." id="...">     <thead>     <tr>     <th>...</th>     </tr>     </thead>     <tbody>        <tr>            <td>...</td>        </tr>        <tr>...</tr>        <tr>...</tr>        ...        <tr>...</tr>        <tr>...</tr>    </tbody></table>

我们以新浪财经的机构持仓汇总为例,来进行一次爬虫。网站为:

具体代码为:


import sslssl._create_default_https_context = ssl._create_unverified_contextimport pandas as pddf = pd.DataFrame()for i in range(1,7):    url=f'http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jgcg/index.phtml?p={i}'    df = pd.concat([df, pd.read_html(url,skiprows=[1,1])[0]]) df.to_csv('机构持股汇总.csv')

这里只截取了7页数据,运行结果为:

好了,本期就到这里,下期再会。

相关文章
|
2月前
|
数据采集 数据挖掘 Python
Python:pandas做爬虫
Python:pandas做爬虫
35 0
|
6月前
|
数据采集 Web App开发 数据可视化
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合
|
6月前
|
数据采集 存储 Web App开发
一键实现数据采集和存储:Python爬虫、Pandas和Excel的应用技巧
一键实现数据采集和存储:Python爬虫、Pandas和Excel的应用技巧
|
6月前
|
数据采集 数据可视化 数据挖掘
Python爬虫之Pandas数据处理技术详解
Python爬虫之Pandas数据处理技术详解
|
数据采集 人工智能 安全
数据安全代表厂商 防勒索+防爬虫领域代表厂商!瑞数信息连续入选国际权威机构报告
近日,全球领先的IT市场研究和咨询公司IDC连续发布了《中国数据安全市场发展趋势,2023》与《中国热点威胁安全检测与防护解决方案,2023》两本报告。
|
数据采集 Python
|
数据采集 Python Java
爬虫练习之数据整理——基于Pandas
上一篇->爬虫练习之数据清洗——基于Pandas 本次以51Job上在东莞地区爬取的以Java为关键词的招聘数据 包括salary company time job_name address字段 目的 本次数据整理的小目标是将薪资数据拿出来单独处理为...
1228 0
|
数据采集 Python Java
爬虫练习之数据清洗——基于Pandas
本次以51Job上在东莞地区爬取的以Java为关键词的招聘数据 包括salary company time job_name address字段 当我把招聘网站上的数据爬下来的时候,内心是很开心的 爬下来的原始数据 但是! What?! 这是什么数据? 而且还不止一条!!! 待清洗数据 待清洗数据 第一次数据清洗 根据上述截图可以发现,脏数据都包含了xx元/小时以及xx元/天。
2961 0
|
17天前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
60 6
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
178 4