文档备案控制台

开发者社区问答正文

python爬取糗事百科，该如何正确保存到本地文件夹?报错

我的程序已经可以爬取网络内容,但不太清楚怎么保存到当地文件夹,用网上方法试着做,但是有报错

import urllib
import urllib.request
import requests ##导入requests
from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup
import os


for i in range(35):
    page=i
    headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64)"}
    all_url = 'http://www.qiushibaike.com/hot/page/'+str(page)  ##开始的URL地址
    start_html = requests.get(all_url,headers=headers)
    Soup = BeautifulSoup(start_html.text, 'lxml')
    all_a = Soup.find('div', class_='col1').find_all(class_='content')
    for j in all_a:
        title = j.get_text() #取出a标签的文本
        path = str(title).strip()
        
        os.makedirs(os.path.join("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory", path))
        os.chdir("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory\\"+path) ##切换到上面创建的文件夹
        name = all_url[-9:-4]
        allurl = request.get(all_url,headers=headers)
        f = open(name + '.html', 'ab')
        f.write(allurl.content)
        f.close()

展开

收起

爱吃鱼的程序员 2020-06-08 20:07:56 656 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

报错发出来去掉路径中的空格试试i

2020-06-08 20:08:14

赞同展开评论

问答分类：

Python Windows

问答标签：

Python报错 Python文件夹 Python爬取 Python糗事百科 Python本地文件

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

使用阿里云官方python SDK获取实例订阅消息，如何接收HEX数据？如何转储本地文件？

280

1

0

python 爬取过程中如何保持多个会话？

340

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

233

1

0

函数计算这个文件夹地址是云函数Python运行时依赖包的地址吗？

131

1

0

函数计算python的函数入口可以指定文件夹名称吗？

219

3

0

已经安装了Python3.5，并确认环境变量已经配置了路劲，且将3.8修改为无效文件夹了

380

2

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

327

1

0

机器学习PAI-Designer算法组件自定义Python脚本组件不能保存提示文件上传失败

407

1

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1862

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

932

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

idea qoder cn报错

ECS 带宽跑满导致业务卡顿？CDN 怎么进行分流优化解决高峰期瓶颈？

qoder CN,wiki收费为什么没有提示,以前qoder国际版不是免费的吗,一次跑了几百Cred

阿里云服务器官网在哪？有几种云服务器类型？

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

相关文章

什么是统一终端管理（UEM）？企业为什么需要UEM解决方案？

API 版本管理三大核心实践：兼容旧版、平滑升级与灰度切流

用 Scikit-LLM 和 Groq 搭建情感分析 pipeline

OMI/Aura 1B 级可见光全球地理定位地球反射辐射单轨道 L2 条带 13x24 公里 V003（OML1BRVG）位于 GES DISC

Python爬虫的增量抓取策略：如何高效处理百万级商品的数据更新

还有其他疑问?