【每日算法Day 89】手动实现字符串转整数(atoi)函数,你会吗?

简介: 【每日算法Day 89】手动实现字符串转整数(atoi)函数,你会吗?

还有几个小时ACL2020就出结果了,祈祷!

题目链接

LeetCode 字符串转换整数(atoi)[1]

题目描述

请你来实现一个 atoi 函数,使其能将字符串转换成整数。

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

  • 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
  • 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
  • 该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。

注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0

说明:

  • 本题中的空白字符只包括空格字符 ' ' 。
  • 假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 。如果数值超过这个范围,请返回 INT_MAX () 或 INT_MIN () 。

示例1

输入:
"42"
输出:
42

示例2

输入:
"   -42"
输出:
-42
解释:
第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。

示例3

输入:
"4193 with words"
输出:
4193
解释:
转换截止于数字 '3' ,因为它的下一个字符不为数字。

示例4

输入:
"words and 987"
输出:
0
解释:
第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。

示例5

输入:
"-91283472332"
输出:
-2147483648
解释:
数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。

题解

官方题解用的有限状态自动机,理解起来也是比较轻松的,写起来也避免了一堆臃肿的 if-else 。但是我这里就不用自动机了,直接模拟就行了,写起来也很轻松好理解!

  • 首先用一个变量 idx 标记当前遍历到的位置,用 sign = 1, -1 表示整数的正负性。
  • 然后从 idx = 0 开始,将开头的空格全部去掉。
  • 然后判断当前的位置 idx 处的字符是不是 +, - 或者数字,并且 idx 要小于字符串长度。如果一个都没满足,那么说明是非法字符串,直接返回 0
  • 然后如果当前的位置 idx 处的字符是 - ,那么就令 sign = -1 。否则如果是 + ,就令 sign = 1 。然后遍历后一个字符。
  • 最后遍历一段连续的数字,把它转换成整数,注意转换的时候要乘上符号位 sign 。如果发现数字超过了 [INT_MIN, INT_MAX] 范围,就直接返回最大最小值就行了。
  • 否则的话最后就是合法整数,直接返回答案。

代码

c++

class Solution {
public:
    int myAtoi(string str) {
        int idx = 0, n = str.size();
        long res = 0, sign = 1;
        while (idx < n && str[idx] == ' ') idx++;
        if (idx >= n || (str[idx] != '+' && str[idx] != '-' && !isdigit(str[idx]))) return 0;
        if (str[idx] == '-') {
            sign = -1;
            idx++;
        } else if (str[idx] == '+') {
            idx++;
        }
        while (idx < n && isdigit(str[idx])) {
            res = res*10+sign*(str[idx++]-'0');
            if (res > INT_MAX) return INT_MAX;
            if (res < INT_MIN) return INT_MIN;
        }
        return res;
    }
};

python

class Solution:
    def myAtoi(self, str: str) -> int:
        str = str.lstrip()
        n, idx = len(str), 0
        res, sign = 0, 1
        if idx >= n or (str[idx] != '+' and str[idx] != '-' and not str[idx].isdigit()): return 0
        if str[idx] == '-':
            sign = -1
            idx += 1
        elif str[idx] == '+':
            idx += 1
        for c in str[idx:]:
            if not c.isdigit(): break
            res = res*10+sign*(int(c))
            if res > 2**31-1: return 2**31-1
            if res < -2**31: return -2**31
        return res

正则表达式(python)

class Solution:
    def myAtoi(self, str: str) -> int:
        return max(min(int(*re.findall('^[\+\-]?\d+', str.lstrip())), 2**31-1), -2**31)


相关文章
|
26天前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
126 67
|
4月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
2月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
102 1
两个字符串匹配出最长公共子序列算法
|
3月前
|
XML JavaScript 前端开发
学习react基础(1)_虚拟dom、diff算法、函数和class创建组件
本文介绍了React的核心概念,包括虚拟DOM、Diff算法以及如何通过函数和类创建React组件。
38 3
|
4月前
|
人工智能 算法
第一周算法设计与分析:C : 200和整数对之间的情缘
这篇文章介绍了解决算法问题"200和整数对之间的情缘"的方法,通过统计数组中每个数模200的余数,并计算每个同余类中数的组合数来找出所有满足条件的整数对(i, j),使得\( A_i - A_j \)是200的整数倍。
|
4月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
5月前
|
自然语言处理 算法 搜索推荐
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。
321 1
|
4月前
|
算法
【Azure Developer】完成算法第4版书中,第一节基础编码中的数组函数 histogrm()
【Azure Developer】完成算法第4版书中,第一节基础编码中的数组函数 histogrm()
|
5月前
|
算法
【算法】二分查找(整数二分和浮点数二分)
算法学习——二分查找(整数二分和浮点数二分)
49 0
【算法】二分查找(整数二分和浮点数二分)
|
4月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
92 0