ACM讲课之字符串

简介: 本次讲课讲全面介绍字符串以及如何使用字符串解决具体问题。 一、什么是字符串 1.如何存储字符串 平时我们使用的变量有很多,int代表整型变量,double代表浮点型变量,char代表字符型变量,那么对于一个字符串例如“Hello World!”应该如何存储并操作呢。

本次讲课讲全面介绍字符串以及如何使用字符串解决具体问题。

一、什么是字符串

1.如何存储字符串

平时我们使用的变量有很多,int代表整型变量,double代表浮点型变量,char代表字符型变量,那么对于一个字符串例如“Hello World!”应该如何存储并操作呢。

在C语言里,我们可以char数组进行存储,例如:

1 char str1[] = "Hello World!";
2 char* str2 = "Hello World!";
3 char str3[20] = "Hello World!";

对str1、2、3进行输出都为“Hello World!”,这三种方式构造一个字符串的区别有哪些?我们输出他们的空间长度(注意是占用的空间长度而不是字符串长度)。

1     int len1 = sizeof(str1)/sizeof(char);
2     int len2 = sizeof(str2)/sizeof(char);
3     int len3 = sizeof(str3)/sizeof(char);
4     printf("%d\n%d\n%d\n",len1,len2,len3);
结果为:13
    4
    20

(此处应对上诉结果进行解释说明 ==)

既然字符串可以存储在一个字符数组里面,那么如何对字符串进行操作想必也就非常清楚了。需要注意的是,对于计算机可以字符和一个整型变量没有任何区别,它们都是数据,所以对整型变量可以做的操作都可以对一个字符进行同样的操作。

2.ASCII编码

众所周知字符在C/C++里面是以ASCII码的形式存储在计算机中,既然字符串是存储在字符数组里面的,其实也就是多个字符的一个有序集合。它也遵守和字符同样的的规则,例如'A'的ASCII码为65,如果我们进行下列语句

1 char ch = 'A';
2 if(ch == 'A'){
3     ch = ch + 5;        
4 }
5 else {
6     ch = ch - 1;  
7 }

那么这里ch的值应该变成多少了呢?此时的ch又代表哪个字符呢?

3.std::string

是不是没见过这是什么东西,它其实就是character string(字符串),这是一个C++的语句,意思就是调用std(标准命名空间)里面的string类,可能你也已经猜到了string是用来干什么的,是的它可以直接定义一个字符串变量,并且能够直接对串进行操作。

什么意思呢?我们既然已经能够用字符数组存储字符串了,为什么还需要多个string呢,因为我们前面说了字符串数组相当于一个字符的有序集合,归根到底还都是单个字符,而字符串变量string才是真正的字符串,它可以直接对串操作,例如下列语句:

std::string str = "Hello";
str += " World";
str += "!";

如果仅仅只是这样,那么string并不显得强大,事实上string支持下面的功能

我是传送门:string的用法

但是值得注意的是,string是c++语言的东西,在c语言中并不能使用,而且string只能通过cin流进行读入操作,同样可以使用下标对string字符串进行每一位的访问以及操作。

C++也还有很多C语言没有的容器,通过这些容器对做题有很大帮助,而且这些容器对于一个ACMer来说是必须要掌握的,详情请戳:

STL容器(Stack, Queue, List, Vector, Deque, Priority_Queue, Map, Pair, Set, Multiset, Multimap)

 

二、字符串操作

1.空格、换行符

我们知道使用scanf("%s",s);读入一个字符串遇到空格和换行符自动跳出,但是对于一个字符串不可能都没有空格以及换行呀,如果是需要读入一个句子那该怎么办呢,对于C语言,我提供了下列几种方法供参考

 1 //方法一——判断是否为空格选择继续读入还是跳出
 2     char s[100],ch;
 3     scanf("%s",s);
 4     ch = getchar();
 5     while(ch == ' '){
 6         int len = strlen(s);
 7         s[len] = ' ';
 8         scanf("%s",s+len+1);
 9         ch = getchar();
10     }
11 
12 //方法二——利用格式符%[]设置结束符
13     char s[100];
14     scanf("%[^\n]",s);
15 
16 
17 //方法三——利用不安全的gets进行读入
18     char s[100];
19     gets(s);

三种方法都可以进行读入以换行符为结束符带有空格的字符串,但是我推荐最好使用第一种,为什么?

(此处应对上述进行解释说明)

在C++语言中,想要读入这样的串,我也同样提供几种方法供参考

1 //方法一——使用cin流对字符串进行读入
2     char s[100];
3     cin.getline(s,100);
4 
5 //方法二——使用getline进行string类读入
6     string s;
7     getline(cin,s);

 

下面以一个例题为例,对字符串的具体操作进行讲解

题目链接:http://120.78.128.11/Problem.jsp?pid=1716

下面我贴出C语言和C++语言的代码

 C语言:

 1 #include <stdio.h>
 2 #include <string.h>
 3 char s1[10005],s2[105];
 4 
 5 void read(char *s){
 6     int ch;
 7     scanf("%s",s);
 8     ch = getchar();
 9     while(ch == ' '){
10         int len = strlen(s);
11         s[len] = ' ';
12         scanf("%s",s+len+1);
13         ch = getchar();
14     }
15 }
16 
17 int main(){
18     int t;
19     scanf("%d",&t);
20     while(t--){
21         read(s1),read(s2);//读入字符串
22         int len1 = strlen(s1),len2 = strlen(s2);
23         int flag = -1,i,j;
24         for(i = 0; i < len1; i++){
25             if(s1[i] == s2[0]){
26                 for(j = 0; j < len2; j++){
27                     if(j == len2-1 && s1[i+j] == s2[j])
28                         flag = i+1;
29                     if(s1[i+j] != s2[j])
30                         break;
31                 }
32             }
33         }
34         printf("%d\n",flag);
35     }
36     return 0;
37 }

C++语言:

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 string s1,s2;
 5 
 6 int main(){
 7     int t;
 8     cin>>t;
 9     cin.get();
10     while(t--){
11         getline(cin,s1),getline(cin,s2);
12         int pos = s1.find(s2);
13         cout << (pos==-1?-1:pos+1) << endl;
14     }
15     return 0;
16 }

这也是为什么要用C++的原因,C++内置函数以及操作实在是太强大了,两个C中较为冗长的函数在C++中都只要用一句便实现了。

 

另一个例题:http://120.78.128.11/Problem.jsp?pid=1924

C语言代码:

 1 #include <stdio.h>
 2 #include <string.h>
 3 char s[1000005];
 4 
 5 void read(char *s){
 6     int ch;
 7     scanf("%s",s);
 8     ch = getchar();
 9     while(ch == ' '){
10         int len = strlen(s);
11         s[len] = ' ';
12         scanf("%s",s+len+1);
13         ch = getchar();
14     }
15 }
16 
17 int main(){
18     int t,i;
19     scanf("%d",&t);
20     while(t--){
21         read(s);
22         int len = strlen(s);
23         for(i = 0; i < len; i++){
24             if(i == 0){
25                 putchar(s[i]-32);
26             }
27             if(s[i] == ' '){
28                 putchar(s[i+1]-32);
29             }
30         }
31         puts("");
32     }
33     return 0;
34 }

C++代码:

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 string s;
 5 
 6 int main(){
 7     int t;
 8     cin>>t;
 9     cin.get();
10     while(t--){
11         getline(cin,s);
12         int len = s.size();
13         cout << char(s[0]-32);
14         for(int i = 1; i < len; i++){
15             if(s[i] == ' ')
16                 cout << char(s[i+1]-32);
17         }
18         cout << endl;
19     }
20     return 0;
21 }

 

2.字符串比较

我们知道可以通过一位一位的模拟进行字符串比较,但要是两个字符串都很长怎么办,我们容易得出暴力方法进行匹配的时间复杂度为O(n*m),n和m就是两个字符串的长度,通过一些算法我们可以进行匹配优化,例如我们可以利用KMP算法在O(n+m)的时间复杂度内进行匹配。

下面是KMP的算法讲解

我是传送门:KMP算法

传送门:KMP例题

目录
相关文章
ACM刷题之路(十六)Acm程序设计竞赛自制模板(一)
ACM刷题之路(十六)Acm程序设计竞赛自制模板
|
Java Android开发
ACM刷题之路(七)字符串处理 记元培ACM院赛
ACM刷题之路(七)字符串处理 记元培ACM院赛
|
算法
ACM刷题之路(十六)Acm程序设计竞赛自制模板(二)
ACM刷题之路(十六)Acm程序设计竞赛自制模板
|
机器学习/深度学习 达摩院 安全
刚刚,2021 ACM Fellow放榜!李飞飞、谢涛、刘铁岩等13名华人学者当选
刚刚,2021 ACM Fellow放榜!李飞飞、谢涛、刘铁岩等13名华人学者当选
235 0
|
Cloud Native 数据管理 关系型数据库
祝贺!我的同事李飞飞当选ACM Fellow、IEEE Fellow
因在数据库查询处理和优化以及云数据库系统方面所做出的卓越贡献而入选
945 0
祝贺!我的同事李飞飞当选ACM Fellow、IEEE Fellow
ACM 选手带你玩转 KMP 算法!
ACM 选手带你玩转 KMP 算法!
ACM 选手带你玩转 KMP 算法!
|
自然语言处理 算法 Shell
ACM算法竞赛及OJ题面常用英文单词整理
ACM算法竞赛及OJ题面常用英文单词整理
522 0
|
算法
ACM模板——KMP算法
ACM模板——KMP算法
138 0
|
自然语言处理 达摩院
阿里两位科学家当选ACM2019年度杰出科学家
近年来,蚂蚁金服在科研人才和前沿技术研究方面持续投入,在国际顶会发表数十篇论文,与国内外多个高校和学术界领军人物展开科研合作。目前已在可信执行环境、多方安全计算、共享智能等前沿技术上取得突破,并在生产环境成功落地,为金融级基础设施保驾护航。
3322 0
阿里两位科学家当选ACM2019年度杰出科学家