在 C++ 中标记字符串与getline() 函数和字符数组

简介: 对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个

「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战

在 C++ 中标记字符串


对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:


使用字符串流


一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。


下面是 C++ 实现:


#include <bits/stdc++.h>
using namespace std;
int main()
{
  string line = "juejin is a must try";
  vector <string> tokens;
  stringstream check1(line);  
  string intermediate;
  while(getline(check1, intermediate, ' ')){
    tokens.push_back(intermediate);
  }
  for(int i = 0; i < tokens.size(); i++)
    cout << tokens[i] << '\n';
}
复制代码


输出

juejin
is
a
must
try
复制代码

使用strtok()


// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码


下面是 C++ 实现:

#include <stdio.h>
#include <string.h>
int main(){
  char str[] = "juejin-for-juejin";
  char *token = strtok(str, "-");
  while (token != NULL){
    printf("%s\n", token);
    token = strtok(NULL, "-");
  }
  return 0;
}
复制代码


输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:


#include <string.h>
#include <stdio.h>
int main(){
  char gfg[100] = " juejin - for - juejin - Contribute";
  const char s[4] = "-";
  char* tok;
  tok = strtok(gfg, s);
  while (tok != 0) {
    printf(" %s\n", tok);
    tok = strtok(0, s);
  }
  return (0);
}
复制代码


输出


juejin 
for 
juejin
Contribute
复制代码

使用strtok_r()


就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。


我们可以通过两种方式调用 strtok_r()


下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:


#include<stdio.h>
#include<string.h>
int main(){
  char str[] = "juejin for juejin";
  char *token;
  char *rest = str;
  while ((token = strtok_r(rest, " ", &rest)))
    printf("%s\n", token);
  return(0);
}
复制代码


输出


juejin
for
juejin
复制代码

使用 std::sregex_token_iterator


在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。


下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:


#include <iostream>
#include <regex>
#include <string>
#include <vector>
std::vector<std::string> tokenize(const std::string str,const std::regex re){
  std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 };
  std::vector<std::string> tokenized{ it, {} };
  tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) {
            return s.size() == 0;
            }),
  tokenized.end());
  return tokenized;
}
int main(){
  const std::string str = "将 字符串 分隔,为,空格,和逗号";
  const std::regex re(R"([\s|,]+)");
  const std::vector<std::string> tokenized = tokenize(str, re);
  for (std::string token : tokenized) std::cout << token << std::endl;
  return 0;
}
复制代码


输出


字符串
分隔
空格
和逗号
复制代码

getline() 函数和字符数组


在C++中,流类支持面向行的函数,getline()和write()分别执行输入和输出功能。


getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:


//(缓冲区,流大小,分隔符)
istream& getline(char*, int size, char='\n')
// 分隔符被视为'\n'
istream& getline(char*, int size)
复制代码


该函数执行以下操作:


  1. 提取字符直到分隔符。

  2. 将字符存储在缓冲区中。

  3. 提取的最大字符数为 size – 1。注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换


// 用字符数组显示 getline() 的 C++ 程序
#include <iostream>
using namespace std;
int main()
{
  char str[20];
  cout << "Enter Your Name::";
  // 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异
  cin.getline(str, 20);
  cout << "\n你的名字是: " << str;
  return 0;
}
复制代码


输入 :


鲸落
复制代码


输出 :


你的名字是: 鲸落
复制代码


在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。



目录
相关文章
|
3月前
|
C语言 C++
【实战指南】 C/C++ 枚举转字符串实现
本文介绍了在C/C++中实现枚举转字符串的实用技巧,通过宏定义与统一管理枚举名,提升代码调试效率并减少维护错误。
248 54
|
4月前
|
人工智能 机器人 编译器
c++模板初阶----函数模板与类模板
class 类模板名private://类内成员声明class Apublic:A(T val):a(val){}private:T a;return 0;运行结果:注意:类模板中的成员函数若是放在类外定义时,需要加模板参数列表。return 0;
92 0
|
7月前
|
安全 C++
【c++】继承(继承的定义格式、赋值兼容转换、多继承、派生类默认成员函数规则、继承与友元、继承与静态成员)
本文深入探讨了C++中的继承机制,作为面向对象编程(OOP)的核心特性之一。继承通过允许派生类扩展基类的属性和方法,极大促进了代码复用,增强了代码的可维护性和可扩展性。文章详细介绍了继承的基本概念、定义格式、继承方式(public、protected、private)、赋值兼容转换、作用域问题、默认成员函数规则、继承与友元、静态成员、多继承及菱形继承问题,并对比了继承与组合的优缺点。最后总结指出,虽然继承提高了代码灵活性和复用率,但也带来了耦合度高的问题,建议在“has-a”和“is-a”关系同时存在时优先使用组合。
353 6
|
8月前
|
消息中间件 Linux C++
c++ linux通过实现独立进程之间的通信和传递字符串 demo
的进程间通信机制,适用于父子进程之间的数据传输。希望本文能帮助您更好地理解和应用Linux管道,提升开发效率。 在实际开发中,除了管道,还可以根据具体需求选择消息队列、共享内存、套接字等其他进程间通信方
163 16
|
12月前
|
程序员 C++ 容器
在 C++中,realloc 函数返回 NULL 时,需要手动释放原来的内存吗?
在 C++ 中,当 realloc 函数返回 NULL 时,表示内存重新分配失败,但原内存块仍然有效,因此需要手动释放原来的内存,以避免内存泄漏。
|
12月前
|
存储 前端开发 C++
C++ 多线程之带返回值的线程处理函数
这篇文章介绍了在C++中使用`async`函数、`packaged_task`和`promise`三种方法来创建带返回值的线程处理函数。
443 6
|
8月前
|
编译器 C++ 开发者
【C++篇】深度解析类与对象(下)
在上一篇博客中,我们学习了C++的基础类与对象概念,包括类的定义、对象的使用和构造函数的作用。在这一篇,我们将深入探讨C++类的一些重要特性,如构造函数的高级用法、类型转换、static成员、友元、内部类、匿名对象,以及对象拷贝优化等。这些内容可以帮助你更好地理解和应用面向对象编程的核心理念,提升代码的健壮性、灵活性和可维护性。
|
4月前
|
存储 编译器 程序员
c++的类(附含explicit关键字,友元,内部类)
本文介绍了C++中类的核心概念与用法,涵盖封装、继承、多态三大特性。重点讲解了类的定义(`class`与`struct`)、访问限定符(`private`、`public`、`protected`)、类的作用域及成员函数的声明与定义分离。同时深入探讨了类的大小计算、`this`指针、默认成员函数(构造函数、析构函数、拷贝构造、赋值重载)以及运算符重载等内容。 文章还详细分析了`explicit`关键字的作用、静态成员(变量与函数)、友元(友元函数与友元类)的概念及其使用场景,并简要介绍了内部类的特性。
169 0
|
6月前
|
编译器 C++ 容器
【c++11】c++11新特性(上)(列表初始化、右值引用和移动语义、类的新默认成员函数、lambda表达式)
C++11为C++带来了革命性变化,引入了列表初始化、右值引用、移动语义、类的新默认成员函数和lambda表达式等特性。列表初始化统一了对象初始化方式,initializer_list简化了容器多元素初始化;右值引用和移动语义优化了资源管理,减少拷贝开销;类新增移动构造和移动赋值函数提升性能;lambda表达式提供匿名函数对象,增强代码简洁性和灵活性。这些特性共同推动了现代C++编程的发展,提升了开发效率与程序性能。
180 12
|
7月前
|
设计模式 安全 C++
【C++进阶】特殊类设计 && 单例模式
通过对特殊类设计和单例模式的深入探讨,我们可以更好地设计和实现复杂的C++程序。特殊类设计提高了代码的安全性和可维护性,而单例模式则确保类的唯一实例性和全局访问性。理解并掌握这些高级设计技巧,对于提升C++编程水平至关重要。
130 16