atoi()详解及其模拟实现
atoi()解析
所需头文件为<stdlib.h>
int atoi (const char * str);
整体功能:
分析字符串 str,将其内容解释为整数,该整数作为 int 类型的值返回。
细节:
该函数首先根据需要丢弃尽可能多的空格字符(如在 isspace 中),直到找到第一个非空格字符。
然后,从此字符开始,取一个可选的首字母加号或减号,后跟尽可能多的 10 进制数字,并将它们解释为数值。
字符串可以在构成整数的字符之后包含其他字符,这些字符将被忽略,并且对此函数的行为没有影响。
如果 str 中的第一个非空格字符序列不是有效的整数,或者由于 str 为空或仅包含空格字符而不存在此类序列,则不执行转换并返回零。
如果被解释成的数字大于
INT_MAX
或者小于MIN_MAX
,那么就返回0
例如:
#include<stdio.h> #include<stdlib.h> int main() { printf("%d\n", atoi(" ")); printf("%d\n", atoi("0")); printf("%d\n", atoi("1234")); printf("%d\n", atoi("1234aabcd")); printf("%d\n", atoi(" 1234 1234")); printf("%d\n", atoi("01234")); printf("%d\n", atoi("-01234")); printf("%d\n", atoi("a1234")); printf("%d\n", atoi("a12341111111111111111111111111111111111111111111111111111111")); return 0; }
output:
0 0 1234 1234 1234 1234 -1234 0 0
缺陷:
我们看到,当转换失败时,函数atoi()
的返回值是0,正确将字符0转换为数字0,函数atoi()
的返回值也是0,因此当函数返回0时,我们就不能区分到底是这个字符串是非法字符串,还是本身转换过来就是0,这点需要在模拟实现中进行改进。
模拟实现my_atoi()
- 为了避免上面提到的缺陷,我们可以定义一个全局变量
state
,用来对函数返回值合法性判断:
enum State { VALID, //0,合法 INVALID //1,非法 }; enum State state = INVALID; //首先默认非法,如果合法再进行修改
- 确保传入的指针不是空指针:
assert(str);
- 排除空格:
while (*str == ' ') str++;
- 如果排除完空格之后,指针str就走到尾了,就说明这是一个空白字符串,直接返回0
if (*str == '\0') return 0;
- 为了方便对正负数进行判断,我们设立一个标记
flag
int flag = 1; if (*str == '-') { flag = -1; str++; } if (*str == '+') { str++; }
- 因为转换数字的时候可能超出
int
型的范围,因此我们要将返回值定义为long long
类型,方便后续进行有效性判断(返回值必须在int型的范围内)
long long ret = 0; while (isdigit(*str)) //isdigit()用来判断一个字符是否是数字字符 { ret = ret * 10 + flag * (*str - '0'); if (ret > INT_MAX || ret < INT_MIN) //如果结果大于int最大值,小于int最小值,那么直接返回0 return 0; str++; }
- 最后,得到返回值ret,再对其后面的字符进行判断,如果是结束符‘\0’,说明返回值合法,否则还是一个非法值
if (*str == '\0') { state = VALID; //如果合法,就将state修改为VALID,说明返回值合法 return (int)ret; } else return (int)ret;
实现代码:
#include<assert.h> #include<stdlib.h> #include<stdio.h> #include<limits.h> enum State { VALID,//0 INVALID//1 }; enum State state = INVALID; int my_atoi(const char* str) { assert(str); while (*str == ' ') str++; if (*str == '\0') return 0; int flag = 1; if (*str == '-') { flag = -1; str++; } if (*str == '+') { str++; } long long ret = 0; while (isdigit(*str)) { ret = ret * 10 + flag * (*str - '0'); if (ret > INT_MAX || ret < INT_MIN) return 0; str++; } if (*str == '\0') { state = VALID; return (int)ret; } else return (int)ret; }