「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战」
在 C++ 中标记字符串
对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:
使用字符串流
一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。
下面是 C++ 实现:
#include <bits/stdc++.h> using namespace std; int main() { string line = "juejin is a must try"; vector <string> tokens; stringstream check1(line); string intermediate; while(getline(check1, intermediate, ' ')){ tokens.push_back(intermediate); } for(int i = 0; i < tokens.size(); i++) cout << tokens[i] << '\n'; } 复制代码
输出
juejin is a must try 复制代码
使用strtok()
// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。 char * strtok(char str[], const char *delims); 复制代码
下面是 C++ 实现:
#include <stdio.h> #include <string.h> int main(){ char str[] = "juejin-for-juejin"; char *token = strtok(str, "-"); while (token != NULL){ printf("%s\n", token); token = strtok(NULL, "-"); } return 0; } 复制代码
输出
juejin for juejin 复制代码
strtok() 的另一个例子:
#include <string.h> #include <stdio.h> int main(){ char gfg[100] = " juejin - for - juejin - Contribute"; const char s[4] = "-"; char* tok; tok = strtok(gfg, s); while (tok != 0) { printf(" %s\n", tok); tok = strtok(0, s); } return (0); } 复制代码
输出
juejin for juejin Contribute 复制代码
使用strtok_r()
就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。
我们可以通过两种方式调用 strtok_r()
下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:
#include<stdio.h> #include<string.h> int main(){ char str[] = "juejin for juejin"; char *token; char *rest = str; while ((token = strtok_r(rest, " ", &rest))) printf("%s\n", token); return(0); } 复制代码
输出
juejin for juejin 复制代码
使用 std::sregex_token_iterator
在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。
下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:
#include <iostream> #include <regex> #include <string> #include <vector> std::vector<std::string> tokenize(const std::string str,const std::regex re){ std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 }; std::vector<std::string> tokenized{ it, {} }; tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) { return s.size() == 0; }), tokenized.end()); return tokenized; } int main(){ const std::string str = "将 字符串 分隔,为,空格,和逗号"; const std::regex re(R"([\s|,]+)"); const std::vector<std::string> tokenized = tokenize(str, re); for (std::string token : tokenized) std::cout << token << std::endl; return 0; } 复制代码
输出
将 字符串 分隔 为 空格 和逗号 复制代码
getline() 函数和字符数组
在C++中,流类支持面向行的函数,getline()和write()分别执行输入和输出功能。
getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:
//(缓冲区,流大小,分隔符) istream& getline(char*, int size, char='\n') // 分隔符被视为'\n' istream& getline(char*, int size) 复制代码
该函数执行以下操作:
- 提取字符直到分隔符。
- 将字符存储在缓冲区中。
- 提取的最大字符数为 size – 1。注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换。
// 用字符数组显示 getline() 的 C++ 程序 #include <iostream> using namespace std; int main() { char str[20]; cout << "Enter Your Name::"; // 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异 cin.getline(str, 20); cout << "\n你的名字是: " << str; return 0; } 复制代码
输入 :
鲸落 复制代码
输出 :
你的名字是: 鲸落 复制代码
在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。