文档备案控制台

开发者社区问答正文

动态网页内容如何用python抓取：报错

范例url: http://www.sepb.gov.cn/hb/fa/cms/shhj/hjzl_login.jsp?flag=1

用python读取页面，中间空气质量日报都没有，直接查看网页源代码也是没有。

不过用FireFox的FireBug可以看到。

不到大家有相关用python获取动态页面内容的经验没。

谢谢啦。

展开

收起

kun坤 2020-06-07 22:23:24 786 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

因为他是ajax载入的。。。

######
我前段时间刚做过一个类似的，http://www.mayukhbose.com/python/IEC/index.php

请下载后看实例。
######

引用来自“sayhigh”的答案

我前段时间刚做过一个类似的，http://www.mayukhbose.com/python/IEC/index.php

请下载后看实例。

thanks。我试试看
######这个问题不知道你解决了没有，我现在也想寻求这个方法######
这个需要：

1.先了解网页抓取的逻辑过程

可参考：

【整理】关于抓取网页，分析网页内容，模拟登陆网站的逻辑/流程和注意事项

2.再利用工具分析出需要的内容是如何产生的

【总结】浏览器中的开发人员工具（IE9的F12和Chrome的Ctrl+Shift+I）-网页分析的利器

用你所说的Firefox的firebug也可以，但是我用过了，觉得还是没有IE9的F12好用。

3.都分析出来了，找到具体哪个url产生的你所需要的数据了

然后才是用python实现对应的代码。

以上仅仅是给你介绍思路，如果有相关基础，应该可以写出python代码了。

######
后来写了相关的教程，仅供参考：

【教程】抓取网并提取网页中所需要的信息之 Python版

【教程】模拟登陆网站之 Python版（内含两种版本的完整的可运行的代码）

2020-06-07 22:23:29

赞同展开评论

问答分类：

Web App开发 Python

问答标签：

Python抓取 Python报错网页Python Python动态网页 Python内容

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

如何使用Python playwright采集网页数据不被检测到？

950

2

0

modelscope-funasr的python服务端暂时还不支持网页访问吗？

208

0

0

AI Earth使用python版本的aie中循环用for跟map的区别跟gee的网页版的一样吗？

347

4

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1867

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

937

1

0

我在使用了Python的测试代码运行报错

682

1

0

flask程序引入numpy包報錯python版本3.9（本地3.9.8）， flask版本2.0.

1181

1

0

maxcomputer使用key通过 python下载数据列中文内容每次都是乱码需要解析，怎么解决？

843

1

0

python3节点调用阿里云sdk提示模块未找到报错，请问下这是什么原因，路径问题吗？

946

1

0

自定义python processor 通过 urlopen 方式调用 oss存储的文件报错 <

1301

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

阿里云CDN如何加速配置？

建立的网站被DDoS攻击怎么排查？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

相关文章

函数计算冷启动时间过长怎么办？阿里云：依赖精简与预留实例优化指南

Python的异步把我坑惨了，原来async/await和多线程的区别这么大

AI 英语口语 APP的开发

用Python完成网站SEO与GEO基础巡检：检查Sitemap、Canonical和JSON-LD

跨境履约智能化落地实践：基于三维遍历算法的 Taocarts 智能合箱技术解析

还有其他疑问?