文档备案控制台

开发者社区问答正文

python爬取糗事百科，该如何正确保存到本地文件夹?报错

我的程序已经可以爬取网络内容,但不太清楚怎么保存到当地文件夹,用网上方法试着做,但是有报错

import urllib
import urllib.request
import requests ##导入requests
from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup
import os


for i in range(35):
    page=i
    headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64)"}
    all_url = 'http://www.qiushibaike.com/hot/page/'+str(page)  ##开始的URL地址
    start_html = requests.get(all_url,headers=headers)
    Soup = BeautifulSoup(start_html.text, 'lxml')
    all_a = Soup.find('div', class_='col1').find_all(class_='content')
    for j in all_a:
        title = j.get_text() #取出a标签的文本
        path = str(title).strip()
        
        os.makedirs(os.path.join("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory", path))
        os.chdir("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory\\"+path) ##切换到上面创建的文件夹
        name = all_url[-9:-4]
        allurl = request.get(all_url,headers=headers)
        f = open(name + '.html', 'ab')
        f.write(allurl.content)
        f.close()

展开

收起

爱吃鱼的程序员 2020-06-08 20:07:56 663 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

报错发出来去掉路径中的空格试试i

2020-06-08 20:08:14

赞同展开评论

问答分类：

Python Windows

问答标签：

Python糗事百科

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

使用阿里云官方python SDK获取实例订阅消息，如何接收HEX数据？如何转储本地文件？

291

1

0

python 爬取过程中如何保持多个会话？

359

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

238

1

0

函数计算这个文件夹地址是云函数Python运行时依赖包的地址吗？

141

1

0

函数计算python的函数入口可以指定文件夹名称吗？

228

3

0

已经安装了Python3.5，并确认环境变量已经配置了路劲，且将3.8修改为无效文件夹了

390

2

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

346

1

0

机器学习PAI-Designer算法组件自定义Python脚本组件不能保存提示文件上传失败

419

1

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1873

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

942

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

QoderCN Jetbrains插件存在EDT反模式

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

什么时候支持本地模型呢？

相关文章

2026最新测试岗薪资曝光：会训练AI的拿80万，只会写用例的在投简历

我用Python + SMTP搭建了一套自动化量化监控系统

Windows 桌面程序为什么不应该自己执行高权限保护动作

Join算法擂台：三种表连接到底谁更适合

还有其他疑问?