文档备案控制台

开发者社区问答正文

Python逐行读取txt中的url文件并进行爬虫

毕设项目需要爬取coursera的课程数据，已经把所有课程的url链接爬下来了，存在了txt中，一行是一个课程的url，现在想要获取每门课程的详细信息，如instructor，syllabus 和detail information这几项，但是都需要点进各个课程的网页链接中取爬取。码渣求大神指导一下，来段伪码就更好啦！thx

展开

收起

a123456678 2016-03-11 11:57:05 6731 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

a123456678

f = open("coursera.txt","r")
urlList = f.readlines()
for url in urlList:
    r = requests.get(url)
    ''''''

2019-07-17 18:58:56

赞同展开评论

问答分类：

数据采集 Python

问答标签：

Python爬虫 Python文件爬虫python Python url Python txt

问答地址：

开发者社区 > 大数据 > 问答

相关问答

如何获取阿里云OSS（对象存储服务）中私有权限文件的公开可读URL（临时有效）？

346

0

0

视觉智能开放平台人脸人体服务如何使用上海地域或者非上海地域OSS链接生成文件URL

203

1

0

视觉智能开放平台上传的是非上海地域OSS文件的本地图片可以使用文件URL处理的方式一

179

1

0

云效是不是maven setting.xml文件需要配置数据库和URL地址指向？

241

1

0

钉钉机器人下载文件，云端返回的url无法通过get请求下载？

376

2

0

轻量应用服务器如何使用url接收文件？

220

3

0

文件简单上传后怎么获取文件的url？

1064

2

0

需要类似获取需要下载文件的url，把url分享给任何人都可以下载的效果，如何操作？

234

1

0

公有文件URL支持设置访问次数吗？

185

1

0

一个文件的URL能直接上传到OSS吗？

197

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

Hermes Agent是什么？怎么部署？2026年新手部署保姆级图文教程

千问大模型是什么？2026年阿里云千问大模型介绍及优惠活动汇总

阿里云大模型Qwen3.5-Omni是什么？2026年阿里云大模型Qwen3.5-Omni介绍及活动

阿里云大模型Qwen3.6-Plus是什么？2026年阿里云大模型Qwen3.6-Plus介绍及优惠

阿里云百炼Coding Plan是什么？2026年阿里云百炼Coding Plan优惠活动说明

相关文章

OpenClaw 2026 Windows 环境一键部署执行手册

2026 OpenClaw（龙虾助手）Windows 一键部署，从 0 到 1 完整教程

零代码 + 免环境：2026 OpenClaw Windows 一键部署，小白一次成功

超详细 2026 OpenClaw Windows 一键部署：零基础也能 5 分钟上线

超详细！2026 OpenClaw Windows 一键部署指南，小白也能会

还有其他疑问?