在 C++ 中标记字符串与getline() 函数和字符数组

简介: 对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个

「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战

在 C++ 中标记字符串


对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:


使用字符串流


一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。


下面是 C++ 实现:


#include <bits/stdc++.h>
using namespace std;
int main()
{
  string line = "juejin is a must try";
  vector <string> tokens;
  stringstream check1(line);  
  string intermediate;
  while(getline(check1, intermediate, ' ')){
    tokens.push_back(intermediate);
  }
  for(int i = 0; i < tokens.size(); i++)
    cout << tokens[i] << '\n';
}
复制代码


输出

juejin
is
a
must
try
复制代码

使用strtok()


// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码


下面是 C++ 实现:

#include <stdio.h>
#include <string.h>
int main(){
  char str[] = "juejin-for-juejin";
  char *token = strtok(str, "-");
  while (token != NULL){
    printf("%s\n", token);
    token = strtok(NULL, "-");
  }
  return 0;
}
复制代码


输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:


#include <string.h>
#include <stdio.h>
int main(){
  char gfg[100] = " juejin - for - juejin - Contribute";
  const char s[4] = "-";
  char* tok;
  tok = strtok(gfg, s);
  while (tok != 0) {
    printf(" %s\n", tok);
    tok = strtok(0, s);
  }
  return (0);
}
复制代码


输出


juejin 
for 
juejin
Contribute
复制代码

使用strtok_r()


就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。


我们可以通过两种方式调用 strtok_r()


下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:


#include<stdio.h>
#include<string.h>
int main(){
  char str[] = "juejin for juejin";
  char *token;
  char *rest = str;
  while ((token = strtok_r(rest, " ", &rest)))
    printf("%s\n", token);
  return(0);
}
复制代码


输出


juejin
for
juejin
复制代码

使用 std::sregex_token_iterator


在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。


下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:


#include <iostream>
#include <regex>
#include <string>
#include <vector>
std::vector<std::string> tokenize(const std::string str,const std::regex re){
  std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 };
  std::vector<std::string> tokenized{ it, {} };
  tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) {
            return s.size() == 0;
            }),
  tokenized.end());
  return tokenized;
}
int main(){
  const std::string str = "将 字符串 分隔,为,空格,和逗号";
  const std::regex re(R"([\s|,]+)");
  const std::vector<std::string> tokenized = tokenize(str, re);
  for (std::string token : tokenized) std::cout << token << std::endl;
  return 0;
}
复制代码


输出


字符串
分隔
空格
和逗号
复制代码

getline() 函数和字符数组


在C++中,流类支持面向行的函数,getline()和write()分别执行输入和输出功能。


getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:


//(缓冲区,流大小,分隔符)
istream& getline(char*, int size, char='\n')
// 分隔符被视为'\n'
istream& getline(char*, int size)
复制代码


该函数执行以下操作:


  1. 提取字符直到分隔符。

  2. 将字符存储在缓冲区中。

  3. 提取的最大字符数为 size – 1。注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换


// 用字符数组显示 getline() 的 C++ 程序
#include <iostream>
using namespace std;
int main()
{
  char str[20];
  cout << "Enter Your Name::";
  // 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异
  cin.getline(str, 20);
  cout << "\n你的名字是: " << str;
  return 0;
}
复制代码


输入 :


鲸落
复制代码


输出 :


你的名字是: 鲸落
复制代码


在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。



目录
相关文章
|
1天前
|
存储 C++
【C++模板】模板实现通用的数组
【C++模板】模板实现通用的数组
|
1天前
|
编译器 C++
【C++进阶】引用 & 函数提高
【C++进阶】引用 & 函数提高
|
5天前
|
存储 编译器 C语言
C++字符串大小写之for语句
C++字符串大小写之for语句
10 0
|
6天前
|
C++
C++从入门到精通:2.1.2函数和类——深入学习面向对象的编程基础
C++从入门到精通:2.1.2函数和类——深入学习面向对象的编程基础
|
6天前
|
存储 C++
C++从入门到精通:2.1.1函数和类
C++从入门到精通:2.1.1函数和类
|
6天前
|
存储 人工智能 C++
【重学C++】【指针】详解让人迷茫的指针数组和数组指针
【重学C++】【指针】详解让人迷茫的指针数组和数组指针
26 1
|
6天前
|
C++
【代码片段】【C++】获取当前时间戳并生成固定格式字符串
【代码片段】【C++】获取当前时间戳并生成固定格式字符串
9 0
|
存储 编译器 Linux
标准库中的string类(中)+仅仅反转字母+字符串中的第一个唯一字符+字符串相加——“C++”“Leetcode每日一题”
标准库中的string类(中)+仅仅反转字母+字符串中的第一个唯一字符+字符串相加——“C++”“Leetcode每日一题”
|
13天前
|
机器学习/深度学习 定位技术 C++
c++中常用库函数
c++中常用库函数
38 0
|
22小时前
|
存储 Java C++
【C++类和对象】探索static成员、友元以及内部类
【C++类和对象】探索static成员、友元以及内部类