在 C++ 中标记字符串与getline() 函数和字符数组

简介: 对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个

「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战

在 C++ 中标记字符串


对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:


使用字符串流


一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。


下面是 C++ 实现:


#include <bits/stdc++.h>
using namespace std;
int main()
{
  string line = "juejin is a must try";
  vector <string> tokens;
  stringstream check1(line);  
  string intermediate;
  while(getline(check1, intermediate, ' ')){
    tokens.push_back(intermediate);
  }
  for(int i = 0; i < tokens.size(); i++)
    cout << tokens[i] << '\n';
}
复制代码


输出

juejin
is
a
must
try
复制代码

使用strtok()


// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码


下面是 C++ 实现:

#include <stdio.h>
#include <string.h>
int main(){
  char str[] = "juejin-for-juejin";
  char *token = strtok(str, "-");
  while (token != NULL){
    printf("%s\n", token);
    token = strtok(NULL, "-");
  }
  return 0;
}
复制代码


输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:


#include <string.h>
#include <stdio.h>
int main(){
  char gfg[100] = " juejin - for - juejin - Contribute";
  const char s[4] = "-";
  char* tok;
  tok = strtok(gfg, s);
  while (tok != 0) {
    printf(" %s\n", tok);
    tok = strtok(0, s);
  }
  return (0);
}
复制代码


输出


juejin 
for 
juejin
Contribute
复制代码

使用strtok_r()


就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。


我们可以通过两种方式调用 strtok_r()


下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:


#include<stdio.h>
#include<string.h>
int main(){
  char str[] = "juejin for juejin";
  char *token;
  char *rest = str;
  while ((token = strtok_r(rest, " ", &rest)))
    printf("%s\n", token);
  return(0);
}
复制代码


输出


juejin
for
juejin
复制代码

使用 std::sregex_token_iterator


在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。


下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:


#include <iostream>
#include <regex>
#include <string>
#include <vector>
std::vector<std::string> tokenize(const std::string str,const std::regex re){
  std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 };
  std::vector<std::string> tokenized{ it, {} };
  tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) {
            return s.size() == 0;
            }),
  tokenized.end());
  return tokenized;
}
int main(){
  const std::string str = "将 字符串 分隔,为,空格,和逗号";
  const std::regex re(R"([\s|,]+)");
  const std::vector<std::string> tokenized = tokenize(str, re);
  for (std::string token : tokenized) std::cout << token << std::endl;
  return 0;
}
复制代码


输出


字符串
分隔
空格
和逗号
复制代码

getline() 函数和字符数组


在C++中,流类支持面向行的函数,getline()和write()分别执行输入和输出功能。


getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:


//(缓冲区,流大小,分隔符)
istream& getline(char*, int size, char='\n')
// 分隔符被视为'\n'
istream& getline(char*, int size)
复制代码


该函数执行以下操作:


  1. 提取字符直到分隔符。

  2. 将字符存储在缓冲区中。

  3. 提取的最大字符数为 size – 1。注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换


// 用字符数组显示 getline() 的 C++ 程序
#include <iostream>
using namespace std;
int main()
{
  char str[20];
  cout << "Enter Your Name::";
  // 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异
  cin.getline(str, 20);
  cout << "\n你的名字是: " << str;
  return 0;
}
复制代码


输入 :


鲸落
复制代码


输出 :


你的名字是: 鲸落
复制代码


在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。



目录
相关文章
|
30天前
|
程序员 C++ 容器
在 C++中,realloc 函数返回 NULL 时,需要手动释放原来的内存吗?
在 C++ 中,当 realloc 函数返回 NULL 时,表示内存重新分配失败,但原内存块仍然有效,因此需要手动释放原来的内存,以避免内存泄漏。
|
1月前
|
存储 前端开发 C++
C++ 多线程之带返回值的线程处理函数
这篇文章介绍了在C++中使用`async`函数、`packaged_task`和`promise`三种方法来创建带返回值的线程处理函数。
46 6
|
1月前
|
C++
C++ 多线程之线程管理函数
这篇文章介绍了C++中多线程编程的几个关键函数,包括获取线程ID的`get_id()`,延时函数`sleep_for()`,线程让步函数`yield()`,以及阻塞线程直到指定时间的`sleep_until()`。
25 0
C++ 多线程之线程管理函数
|
1月前
|
编译器 C语言 C++
C++入门3——类与对象2-2(类的6个默认成员函数)
C++入门3——类与对象2-2(类的6个默认成员函数)
23 3
|
1月前
|
编译器 C语言 C++
详解C/C++动态内存函数(malloc、free、calloc、realloc)
详解C/C++动态内存函数(malloc、free、calloc、realloc)
171 1
|
1月前
|
编译器 C语言 C++
C++入门6——模板(泛型编程、函数模板、类模板)
C++入门6——模板(泛型编程、函数模板、类模板)
42 0
C++入门6——模板(泛型编程、函数模板、类模板)
|
1月前
|
缓存 网络协议 API
C/C++ StringToAddress(字符串转 boost::asio::ip::address)
通过上述步骤和示例代码,你可以轻松地在C++项目中实现从字符串到 `boost::asio::ip::address`的转换,从而充分利用Boost.Asio库进行网络编程。
52 0
|
10天前
|
存储 编译器 C++
【c++】类和对象(中)(构造函数、析构函数、拷贝构造、赋值重载)
本文深入探讨了C++类的默认成员函数,包括构造函数、析构函数、拷贝构造函数和赋值重载。构造函数用于对象的初始化,析构函数用于对象销毁时的资源清理,拷贝构造函数用于对象的拷贝,赋值重载用于已存在对象的赋值。文章详细介绍了每个函数的特点、使用方法及注意事项,并提供了代码示例。这些默认成员函数确保了资源的正确管理和对象状态的维护。
37 4
|
11天前
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
35 4
|
1月前
|
存储 编译器 对象存储
【C++打怪之路Lv5】-- 类和对象(下)
【C++打怪之路Lv5】-- 类和对象(下)
27 4