开发者社区问答正文

正则表达式

必须使用正则表达式而不使用容器类来解决任务。

输入：文本（可以包含拉丁字母和西里尔字母，不包含_）。输出：源文本，但在所有重复的单词之前加下划线_

将单词视为仅包含字母的序列（单词中不包含所有其他字符）。创建一个将输入转换为输出的静态转换方法。

需要方法

公共静态字符串转换（字符串输入）{...}

输入数据示例

这是一个测试这也是一个测试这些也是测试

输出范例

这个_is _a _test _这个_is _also _a _test _这些是_also _test _test

展开

收起

被纵养的懒猫 2019-10-08 17:10:58 376 版权

阿里云 AI 助理回答

要实现这个功能，我们不能直接使用容器类如List或Set，因为题目要求不使用它们。我们可以依赖Java的正则表达式来完成任务。下面是一个使用Java语言并遵循您的要求的方法示例：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class TextTransformer {

    public static void main(String[] args) {
        String input = "这是一个测试这也是一个测试这些也是测试";
        System.out.println(transform(input));
    }

    public static String transform(String input) {
        // 匹配单词边界(\b)后的任何字母序列(\p{L}+)
        Pattern pattern = Pattern.compile("\\b(\\p{L}+)\\b");
        Matcher matcher = pattern.matcher(input);
        StringBuffer sb = new StringBuffer();

        while (matcher.find()) {
            String word = matcher.group(1);
            // 检查之前是否出现过此单词
            if (input.substring(0, matcher.start()).contains(word)) {
                // 如果出现过，则在该单词前加上下划线
                matcher.appendReplacement(sb, "_" + word);
            } else {
                // 否则，保持原样
                matcher.appendReplacement(sb, word);
            }
        }
        // 将最后匹配的部分添加到结果中
        matcher.appendTail(sb);

        return sb.toString();
    }
}

这段代码首先定义了一个transform方法，它接收一个字符串输入。然后，使用正则表达式\b(\p{L}+)\b来匹配文本中的每个单词（\b表示单词边界，\p{L}+匹配一个或多个字母字符）。通过Matcher对象遍历所有匹配项，并检查当前单词在此前的文本中是否已出现过。如果已出现，则在该单词前添加下划线；否则，保留原样。最后，将处理后的片段拼接成完整的字符串返回。

请注意，这种方法在处理非常大的文本或者极端情况时可能效率不高，因为它需要对每次匹配进行前后文本的搜索以检查重复性。但在一般情况下，它可以满足题目要求。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

容器

问答地址：

开发者社区 > 云原生 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

正则表达式

相关文章