开发者社区问答正文

Java正则表达式在关闭标记后添加空间（如果不存在）

我有以下html字符串，我想在所有标记（例如缺少空间的地方）之后添加空格，仅在正文内部。如果已经有空间，则不应添加额外的空间。

<html><head><title>test</title></head><body>This <strong>Super</strong> subject can be <strong>super</strong>test into object</body></html>

这应该转换为以下内容：

<html><head><title>test</title></head><body>This <strong>Super</strong> subject can be <strong>super</strong> test into object</body></html>

使用正则表达式可以吗？您可以帮我使用正则表达式吗？

展开

收起

几许相思几点泪 2019-12-05 15:28:59 474 版权

阿里云 AI 助理回答

是的，您可以使用正则表达式来完成这个任务。在Python中，可以使用re模块来实现这一需求。下面是一个简单的示例代码，演示如何在HTML字符串中的单词和紧随其后的标记之间添加缺失的空格，同时确保不会在已有空格的地方添加额外空格。

请注意，处理HTML时直接使用正则表达式可能会遇到一些边缘情况，因为HTML的结构复杂性。但针对您提供的简单场景，以下代码应该能够工作：

import re

def add_spaces(html_content):
    # 正则表达式匹配没有紧跟空格的字母和紧接着的非字母字符（这里简化处理，实际HTML可能包含更多类型的标记）
    pattern = r'([a-zA-Z])([^\s>a-zA-Z])'
    
    # 使用正则表达式的替换功能，在匹配到的模式后添加空格
    result = re.sub(pattern, r'\1 \2', html_content)
    
    return result

# 测试字符串
html_string = "testThis<b>Super</b>subject can be <i>supertest</i> into object"

# 调用函数
fixed_html = add_spaces(html_string)

print(fixed_html)

这段代码会查找所有字母后面紧跟非空格且非字母数字的字符（这通常意味着一个HTML标签的开始），并在它们之间插入一个空格。请根据实际情况调整正则表达式以适应更复杂的HTML结构。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

Java

问答标签：

Java正则表达式 Java表达式 Java空间 Java标记正则表达式java

问答地址：

开发者社区 > 开发与运维 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Java正则表达式在关闭标记后添加空间（如果不存在）

相关文章