在 C++ 中标记字符串

简介: 标记字符串表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:

小知识,大挑战!本文正在参与“程序员必备小知识”创作活动。


标记字符串表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:


使用字符串流


一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。


下面是 C++ 实现:

#include <bits/stdc++.h>
using namespace std;
int main()
{
  string line = "juejin is a must try";
  vector <string> tokens;
  stringstream check1(line);
  string intermediate;
  while(getline(check1, intermediate, ' '))
  {
    tokens.push_back(intermediate);
  }
  for(int i = 0; i < tokens.size(); i++)
    cout << tokens[i] << '\n';
}
复制代码


输出

juejin
is 
a 
must 
try
复制代码

使用strtok()

// 根据给定的分隔符拆分 str[]。 并返回下一个令牌。 
// 它需要在循环中调用以获取所有令牌。 当没有更多令牌时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码


下面是 C++ 实现:

// 使用 strtok() 分割字符串的 C/C++ 程序
#include <stdio.h>
#include <string.h>
int main()
{
  char str[] = "juejin-for-juejin";
  char *token = strtok(str, "-");
  while (token != NULL)
  {
    printf("%s\n", token);
    token = strtok(NULL, "-");
  }
  return 0;
}
复制代码


输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:

#include <string.h>
#include <stdio.h>
int main()
{
  char gfg[100] = "juejin - for - juejin - Contribute";
  const char s[4] = "-";
  char* tok;
  tok = strtok(gfg, s);
  while (tok != 0) {
    printf(" %s\n", tok);
    tok = strtok(0, s);
  }
  return (0);
}
复制代码


输出

juejin 
for 
juejin 
Contribute
复制代码

使用strtok_r()


就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。


我们可以通过两种方式调用 strtok_r()

// 第三个参数 saveptr 是一个指向 char * 变量的指针,strtok_r() 在内部使用该变量,
// 以便在解析相同字符串的连续调用之间维护上下文。
char *strtok_r(char *str, const char *delim, char **saveptr); 
复制代码


下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:

#include<stdio.h>
#include<string.h>
int main()
{
  char str[] = "juejin for juejin";
  char *token;
  char *rest = str;
  while ((token = strtok_r(rest, " ", &rest)))
    printf("%s\n", token);
  return(0);
}
复制代码


输出

juejin 
for 
juejin
复制代码

使用 std::sregex_token_iterator


在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。


下面是一个简单的 C++ 程序来展示 std::sregex_token_iterator 的使用:

#include <iostream>
#include <regex>
#include <string>
#include <vector>
std::vector<std::string> tokenize(
          const std::string str,
            const std::regex re)
{
  std::sregex_token_iterator it{ str.begin(),
              str.end(), re, -1 };
  std::vector<std::string> tokenized{ it, {} };
  tokenized.erase(
    std::remove_if(tokenized.begin(),
              tokenized.end(),
          [](std::string const& s) {
            return s.size() == 0;
          }),
    tokenized.end());
  return tokenized;
}
int main()
{
  const std::string str = "Break string
        a,spaces,and,commas";
  const std::regex re(R"([\s|,]+)");
  const std::vector<std::string> tokenized =
            tokenize(str, re);
  for (std::string token : tokenized)
    std::cout << token << std::endl;
  return 0;
}
复制代码


输出


Break
string
a
spaces
and
commas



目录
相关文章
|
3月前
|
搜索推荐 编译器 C语言
【C++核心】特殊的元素集合-数组与字符串详解
这篇文章详细讲解了C++中数组和字符串的基本概念、操作和应用,包括一维数组、二维数组的定义和使用,以及C风格字符串和C++字符串类的对比。
85 4
|
2月前
|
缓存 网络协议 API
C/C++ StringToAddress(字符串转 boost::asio::ip::address)
通过上述步骤和示例代码,你可以轻松地在C++项目中实现从字符串到 `boost::asio::ip::address`的转换,从而充分利用Boost.Asio库进行网络编程。
54 0
|
2月前
|
编译器 C语言 C++
C/C++数字与字符串互相转换
C/C++数字与字符串互相转换
|
3月前
|
C++
HTML+JavaScript构建一个将C/C++定义的ANSI字符串转换为MASM32定义的DWUniCode字符串的工具
HTML+JavaScript构建一个将C/C++定义的ANSI字符串转换为MASM32定义的DWUniCode字符串的工具
|
3月前
|
存储 C++
C++(五)String 字符串类
本文档详细介绍了C++中的`string`类,包括定义、初始化、字符串比较及数值与字符串之间的转换方法。`string`类简化了字符串处理,提供了丰富的功能如字符串查找、比较、拼接和替换等。文档通过示例代码展示了如何使用这些功能,并介绍了如何将数值转换为字符串以及反之亦然的方法。此外,还展示了如何使用`string`数组存储和遍历多个字符串。
|
5月前
|
算法 C++
2730. 找到最长的半重复子字符串(c++,滑动窗口)
2730. 找到最长的半重复子字符串(c++,滑动窗口)
|
5月前
|
C++
567. 字符串的排列(c++)滑动窗口
567. 字符串的排列(c++)滑动窗口
|
5月前
|
编译器 C++
【C++】string类的使用④(字符串操作String operations )
这篇博客探讨了C++ STL中`std::string`的几个关键操作,如`c_str()`和`data()`,它们分别返回指向字符串的const char*指针,前者保证以&#39;\0&#39;结尾,后者不保证。`get_allocator()`返回内存分配器,通常不直接使用。`copy()`函数用于将字符串部分复制到字符数组,不添加&#39;\0&#39;。`find()`和`rfind()`用于向前和向后搜索子串或字符。`npos`是string类中的一个常量,表示找不到匹配项时的返回值。博客通过实例展示了这些函数的用法。
|
6月前
|
C++ 容器
C++字符串string容器(构造、赋值、拼接、查找、替换、比较、存取、插入、删除、子串)
C++字符串string容器(构造、赋值、拼接、查找、替换、比较、存取、插入、删除、子串)
|
6月前
|
编译器 C++
【C++进阶】深入STL之string:模拟实现走进C++字符串的世界
【C++进阶】深入STL之string:模拟实现走进C++字符串的世界
39 1