文档备案控制台

开发者社区问答正文

在字符串中处理html和xml

你想将HTML或者XML实体如 &entity; 或 &#code; 替换为对应的文本。再者，你需要转换文本中特定的字符(比如<, >, 或 &)。

展开

收起

哦哦喔 2020-04-16 19:22:26 1297 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

哦哦喔

如果你想替换文本字符串中的 ‘<’ 或者 ‘>’ ，使用 html.escape() 函数可以很容易的完成。比如：

>>> s = 'Elements are written as "<tag>text</tag>".'
>>> import html
>>> print(s)
Elements are written as "<tag>text</tag>".
>>> print(html.escape(s))
Elements are written as "<tag>text</tag>".

>>> # Disable escaping of quotes
>>> print(html.escape(s, quote=False))
Elements are written as "<tag>text</tag>".
>>>
如果你正在处理的是ASCII文本，并且想将非ASCII文本对应的编码实体嵌入进去， 可以给某些I/O函数传递参数 errors='xmlcharrefreplace' 来达到这个目。比如：

>>> s = 'Spicy Jalapeño'
>>> s.encode('ascii', errors='xmlcharrefreplace')
b'Spicy Jalapeño'
>>>
为了替换文本中的编码实体，你需要使用另外一种方法。 如果你正在处理HTML或者XML文本，试着先使用一个合适的HTML或者XML解析器。 通常情况下，这些工具会自动替换这些编码值，你无需担心。

有时候，如果你接收到了一些含有编码值的原始文本，需要手动去做替换， 通常你只需要使用HTML或者XML解析器的一些相关工具函数/方法即可。比如：

>>> s = 'Spicy "Jalapeño".'
>>> from html.parser import HTMLParser
>>> p = HTMLParser()
>>> p.unescape(s)
'Spicy "Jalapeño".'
>>>
>>> t = 'The prompt is >>>'
>>> from xml.sax.saxutils import unescape
>>> unescape(t)
'The prompt is >>>'
>>>

2020-04-16 19:22:44

赞同展开评论

问答分类：

XML 数据格式

问答标签：

HTML XML XML字符串 HTML字符串字符串HTML XML html

问答地址：

开发者社区 > 大数据 > 问答

相关问答

阿里云RPA怎样把一段字符串的HTML 复制到粘贴板里的时候是CF_HTML格式？

317

2

0

内容安全SDK文本接口检测字符串有html代码标签导致请求返回没有数据

164

0

0

通过api调用通义千问输出的字符串是基于什么格式？markdown？html？

439

0

0

应用研发平台EMAS中热修复 xml中的字符串改变前后打的包，生成补丁，说没有差异，咋回事？

187

1

0

ModelScope中html的字符串带有双引号，modelscope不能正确解析csv文件怎么办？

315

3

0

XML和HTNL有什么关系吗？

715

1

0

XML 和 HTML 之间有什么差异吗？

629

1

0

HTML与xml有什么差异呀？

527

1

0

大家有没有尝试在pg中剥离文本里的 html 字符串标签？用正则还是有什么好用的函数方法来实现?

1093

1

0

如何规定html元素上的属性的字符串值呢？

813

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

我购买了pro+套餐，在vs code中使用提示限额，需要怎么处理？

WordPress站点怎么进行速度优化？

阿里云CDN如何加速配置？

Qodework cn 能不能提供一个 API 接口？

相关文章

LaTeX 公式在 Word 中可编辑的实践指南

基于 YOLO11 的下水管道六类缺陷检测：从数据标注到云上训练实践

【剪映小助手】获取图片动画接口（Get Image Animations）

[鸿蒙从零到一] HarmonyOS 网络请求与 JSON 解析实战：类型安全、错误分层与状态联动

动态代理IP怎么用?3类业务场景的接入配置流程

还有其他疑问?