文档备案控制台

开发者社区问答正文

python获取html源码中省略文本的内容

浏览器打开该网页，页面可以显示完整的文本。
但用Python获取网页源码时，发现源码中只显示文本的前半部分，后面文本用省略号（...）替代了。
htmlContent = urllib2.urlopen().read().decode('utf-8')
请问用python，要怎么获取完整的文本？
谢谢！

展开

收起

小旋风柴进 2016-03-12 09:58:11 3316 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小旋风柴进

网页可能用了ajax等异步技术来显示页面内容
urllib等获取的时候只能取到当时页面内容，可能页面内容还没有加载完成
这种情况需要用selenium等webdriver机制模拟浏览器来获取所有的页面内容

2019-07-17 19:00:13

赞同展开评论

问答分类：

Python

问答标签：

Python文本 Python源码 Python html HTML源码 HTML文本

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

Python爬zabbix报错404，附源码

411

1

0

机器翻译文本翻译，最大长度5000如果是富文本内容，html标签也会计入这个字符数的是吧？

258

1

0

内容安全SDK文本接口检测字符串有html代码标签导致请求返回没有数据

136

0

0

源码中如何修改Nacos2.4.0.1版本的后端管理页面的html？

333

1

0

阿里云OpenAPI有没有非sdk版的python发短信接口源码？

152

1

0

在阿里函数计算怎么在一个python文件下部署多个html呢？

202

0

0

ModelScope源码要求的Python版本是哪个？FAISS_NO_AVX2环境变量要设置吗？

230

1

0

在阿里云RPA Python 编码如何通过解析HTML 获取表格内容有事例吗？

216

1

0

有没有 python 调用自然语言处理sdk 中的文本纠错功能的代码示例

351

5

0

阿里语音AI的“实时长文本”语音合成服务的流逝返回，有python的sdk吗？

218

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

千问云的 Token Plan 订阅模式对 Qwen3.7-Max 有哪些优惠？月费封顶金额是多少？

阿里云服务器ECS、轻量和GPU收费标准及租用价格一览，2026年最新

2026年阿里云服务器最便宜多少钱一年？最低38元一年，详细计费价格表

阿里云百炼Token Plan 超出套餐额度后如何计费？

AI理解和执行不到位，自以为是的乱操作，重复试错拿我们算力来训练AI？

相关文章

软件开发进阶技能之编程语言深度运用（一）

AI 驱动钓鱼与商业邮件欺诈的演化机理及防御研究

如何从零开发一个工业级的 SKILL

人工智能|BERT的简单介绍

人工智能|YOLOv5必须了解的知识

还有其他疑问?