备案控制台

开发者社区开发与运维文章正文

python爬虫抓取富贵论坛

2021-08-23 249

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本人是个爬虫小萌新，看了网上教程学着做了一些，如果有什么问题请大佬们反馈，谢谢。

本人是个爬虫小萌新，看了网上教程学着做爬虫爬取富贵论坛www.fgba.net，如果有什么问题请大佬们反馈，谢谢。

以下是用lxml来爬取的。

from lxml import etree

def getHTMLText(url):
    kv = {
        'cookie': 'ssids=1581214855718752; sfroms=JIAOYIMALL001; historyScanGame=%5B%225667%22%2Cnull%5D; session=1581214855718753-7; showFixGuideDialog=true'
        , 'user-agent': 'Mozilla/5.0'}
    r = requests.get(url, headers=kv)
    r.raise_for_status()
    r.encoding = 'utf-8'
    return r.text

def shixian(url):
    htmls = etree.HTML(url)
    mc = htmls.xpath(
        '//div[@class="wrap"]/div[@class="mod-con sel-content "]/div[@class="bd"]/ul[@class="list-con specialList"]/li[@name="goodsItem"]/span[@class="name"]/span[@class="is-account"]/a/text()')
    price = htmls.xpath(
        '//div[@class="wrap"]/div[@class="mod-con sel-content "]/div[@class="bd"]/ul[@class="list-con specialList"]/li[@name="goodsItem"]/span[@class="price"]')
    count = 0
    tplt = "{:4}\t{:12}\t{:20}"
    print(tplt.format("富贵论坛"))
    for i in range(len(mc)):
        count = count + 1
        print(tplt.format(count, price[i].text, mc[i], chr(12288)))

if __name__ == '__main__':
    url='https://www.fgba.net/'
    lists=[]
    url=url+'-n'+'1'+'.html'
    html=getHTMLText(url)
    shixian(html)

文章标签：

Python

数据采集

关键词：

Python抓取

Python爬虫

爬虫python

爬虫抓取

Python爬虫抓取

dasein58

目录

相关文章

叫个什么名字

|

6天前

|

数据采集 XML 数据处理

使用Python实现简单的Web爬虫

本文将介绍如何使用Python编写一个简单的Web爬虫，用于抓取网页内容并进行简单的数据处理。通过学习本文，读者将了解Web爬虫的基本原理和Python爬虫库的使用方法。

叫个什么名字

54 13 13

老板这功能得加钱

|

1天前

|

开发工具 Python

国外的大学图书馆也像国内的一样吗？用Python脚本抓取期刊的主题标题！

国外的大学图书馆也像国内的一样吗？用Python脚本抓取期刊的主题标题！

老板这功能得加钱

18 7 7

1941623231718325

|

4天前

|

数据采集数据挖掘 Python

使用Python构建简单网页爬虫的技术指南

【5月更文挑战第17天】使用Python构建简单网页爬虫的教程，涉及`requests`和`BeautifulSoup4`库。首先安装所需库，然后发送HTTP GET请求获取HTML内容。利用`BeautifulSoup`解析HTML，找到目标元素，如`<h2>`标签内的新闻标题。处理相对链接，将它们转化为绝对URL。添加异常处理以应对网络问题，同时遵循网站的`robots.txt`规则。此爬虫适用于数据分析和市场研究等场景。

1941623231718325

25 7 7

小白学大数据

|

6天前

|

数据采集 Web App开发数据处理

Lua vs. Python：哪个更适合构建稳定可靠的长期运行爬虫？

Lua vs. Python：哪个更适合构建稳定可靠的长期运行爬虫？

小白学大数据

199 4 4

小白学大数据

|

6天前

|

数据采集 Web App开发 Java

Python 爬虫：Spring Boot 反爬虫的成功案例

Python 爬虫：Spring Boot 反爬虫的成功案例

小白学大数据

35 0 0

叫个什么名字

|

6天前

|

数据采集 Python

使用Python实现简单的Web爬虫

本文将介绍如何使用Python编写一个简单的Web爬虫，用于抓取网页上的信息。通过分析目标网页的结构，利用Python中的requests和Beautiful Soup库，我们可以轻松地提取所需的数据，并将其保存到本地或进行进一步的分析和处理。无论是爬取新闻、股票数据，还是抓取图片等，本文都将为您提供一个简单而有效的解决方案。

叫个什么名字

21 0 0

叫个什么名字

|

6天前

|

数据采集存储 XML

如何利用Python构建高效的Web爬虫

本文将介绍如何使用Python语言以及相关的库和工具，构建一个高效的Web爬虫。通过深入讨论爬虫的基本原理、常用的爬虫框架以及优化技巧，读者将能够了解如何编写可靠、高效的爬虫程序，实现数据的快速获取和处理。

叫个什么名字

24 0 0

小白学大数据

|

6天前

|

数据采集 Web App开发数据可视化

Python爬虫技术与数据可视化：Numpy、pandas、Matplotlib的黄金组合

Python爬虫技术与数据可视化：Numpy、pandas、Matplotlib的黄金组合

小白学大数据

228 0 0

东方睿赢

|

6天前

|

数据采集存储大数据

Python爬虫：数据获取与解析的艺术

本文介绍了Python爬虫在大数据时代的作用，重点讲解了Python爬虫基础、常用库及实战案例。Python因其简洁语法和丰富库支持成为爬虫开发的优选语言。文中提到了requests（发送HTTP请求）、BeautifulSoup（解析HTML）、Scrapy（爬虫框架）、Selenium（处理动态网页）和pandas（数据处理分析）等关键库。实战案例展示了如何爬取电商网站的商品信息，包括确定目标、发送请求、解析内容、存储数据、遍历多页及数据处理。最后，文章强调了遵守网站规则和尊重隐私的重要性。

东方睿赢

31 2 2

游客xusvbxsoy3qma

|

6天前

|

数据采集定位技术 Python

Python爬虫IP代理技巧，让你不再为IP封禁烦恼了！

本文介绍了Python爬虫应对IP封禁的策略，包括使用代理IP隐藏真实IP、选择稳定且数量充足的代理IP服务商、建立代理IP池增加爬虫效率、设置合理抓取频率以及运用验证码识别技术。这些方法能提升爬虫的稳定性和效率，降低被封禁风险。

游客xusvbxsoy3qma

59 0 0

热门文章

最新文章

高德地图爬虫实践：Java多线程并发处理策略

【AI大模型应用开发】【LangChain系列】实战案例2：通过URL加载网页内容 - LangChain对爬虫功能的封装

使用Python打造爬虫程序之破茧而出：Python爬虫遭遇反爬虫机制及应对策略

Golang爬虫代理接入的技术与实践

Python爬虫面试：requests、BeautifulSoup与Scrapy详解

【专栏】随着技术发展，Scrapy将在网络爬虫领域持续发挥关键作用

人工智能：原理、应用与Python代码实现

Python小项目：利用tkinter开发测手速小游戏

人工智能：原理、应用与Python代码示例

流畅的 Python 第二版（GPT 重译）（一）(1)

请简述Python中的垃圾回收机制。

Python中如何实现二分查找？请提供代码示例。

Python中如何实现列表去重？请提供至少两种方法

Python中的装饰器：概念、用法和实例

Python中的装饰器：概念、用法及实例

使用Python实现图像处理中的边缘检测算法

Python中如何实现字符串反转？请提供至少两种方法。

在Python中，如何创建一个迭代器？

请解释Python中的迭代器和生成器的区别？并分别举例说明。

在Python中，如何使用装饰器重写类的方法？

相关课程

更多

Python Web开发基础

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

相关实验场景

更多

Python新手入门

Python入门

Python选择及循环结构

Python新手入门（Anolis OS）

网站用户流量分析—适用于电商网站、资讯网站、游戏主站等各类Web站点场景

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考