【数据结构和算法】压缩字符串

简介: 给你一个字符数组chars,请使用下述算法压缩:从一个空字符串s开始。对于chars中的每组连续重复字符:如果这一组长度为1,则将字符追加到s中。否则,需要向s追加字符,后跟这一组的长度。压缩后得到的字符串s不应该直接返回,需要转储到字符数组chars中。需要注意的是,如果组长度为10或10以上,则在chars数组中会被拆分为多个字符。请在修改完输入数组后,返回该数组的新长度。

 其他系列文章导航

Java基础合集

数据结构与算法合集

设计模式合集

多线程合集

分布式合集

ES合集


文章目录

其他系列文章导航

文章目录

前言

一、题目描述

二、题解

2.1 方法一:双指针

三、代码

3.1 方法一:双指针

四、复杂度分析


前言

这是力扣的443题,难度为中等,解题方案有很多种,本文讲解我认为最奇妙的一种。


一、题目描述

题目有点小坑,在下面提到了。

给你一个字符数组 chars ,请使用下述算法压缩:

从一个空字符串 s 开始。对于 chars 中的每组 连续重复字符

    • 如果这一组长度为 1 ,则将字符追加到 s 中。
    • 否则,需要向 s 追加字符,后跟这一组的长度。

    压缩后得到的字符串 s不应该直接返回 ,需要转储到字符数组 chars 中。需要注意的是,如果组长度为 1010 以上,则在 chars 数组中会被拆分为多个字符。

    请在 修改完输入数组后 ,返回该数组的新长度。

    你必须设计并实现一个只使用常量额外空间的算法来解决此问题。(说白了就是要在原字符数组上改)

    示例 1:

    输入:chars = ["a","a","b","b","c","c","c"]

    输出:返回 6 ,输入数组的前 6 个字符应该是:["a","2","b","2","c","3"]

    解释:"aa" 被 "a2" 替代。"bb" 被 "b2" 替代。"ccc" 被 "c3" 替代。


    示例 2:

    输入:chars = ["a"]

    输出:返回 1 ,输入数组的前 1 个字符应该是:["a"]

    解释:唯一的组是“a”,它保持未压缩,因为它是一个字符。


    示例 3:

    输入:chars = ["a","b","b","b","b","b","b","b","b","b","b","b","b"]

    输出:返回 4 ,输入数组的前 4 个字符应该是:["a","b","1","2"]。

    解释:由于字符 "a" 不重复,所以不会被压缩。"bbbbbbbbbbbb" 被 “b12” 替代。


    提示:

      • 1 <= chars.length <= 2000
      • chars[i] 可以是小写英文字母、大写英文字母、数字或符号

      注:这个题是要求修改原数组,即在原空间,然后,返回新的长度,在测试机中的是根据我们计算出来的新长度来输出而不是使用chars.length或者char ch:chars之类的控制输出。


      二、题解

      2.1 方法一:双指针

      思路与算法:

      首先我们要令输入数组 chars 长度为 n。

      image.gif编辑

      使用两个指针 i 和 j 分别指向「当前处理到的位置」和「答案待插入的位置」:

        1. 当字符一样的时候,i 指针一直往后处理,每次找到字符相同的连续一段 [i,idx),令长度为 cnt;
        2. 将当前字符插入到答案,并让 j 指针后移:chars [j++] = chars [i];
        3. 检查 cnt 的长度是否大于 1,如果大于 1,需要将数字拆分存储。由于简单的实现中,我们只能从个位开始处理 cnt,因此需要使用 start 和 end 记录下存储数字的部分,再处理完 cnt 后,将 [start,end) 部分进行翻转,并更新 j 指针;image.gif编辑
        4. 最后我们更新 i 为 idx,代表循环处理下一字符。

        三、代码

        3.1 方法一:双指针

        Java版本(带注释):

        class Solution {
            public int compress(char[] chars) {
                int len = chars.length;
                int i = 0; //当前处理下标
                int j = 0; //当前被替换下标
                while(i < len) {
                    int idx = i;
                    //找连续相同字符
                    while(idx < len && chars[idx] == chars[i]) idx++; 
                    int cnt = idx - i; //连续相同字符长度
                    chars[j++] = chars[i];//要替换的下标对准 连续字符串 的第一个下标
                    if(cnt > 1) {
                        int start = j, end = start;
                        //替换cnt
                        while(cnt != 0) {
                            chars[end++] = (char)(cnt % 10 + '0');
                            cnt /= 10;
                        }
                        //由于从个位开始替换, 需要将数字翻转
                        reverse(chars, start, end-1);
                        //替换完成后, 更新j
                        j = end;
                    }
                    i = idx;//处理完一串, 移动下标
                }
                return j;
            }
            //翻转chars 下标start .. 下标end 之间的字符
            void reverse(char[] chars, int start, int end) {
                while(start < end) {
                    char tmp = chars[start];
                    chars[start] = chars[end];
                    chars[end] = tmp;
                    start++;
                    end--;
                }
            }
        }

        image.gif

        C++版本:

        #include <vector>
        #include <string>
        using namespace std;
        class Solution {
        public:
            int compress(vector<char>& cs) {
                int n = cs.size();
                int i = 0, j = 0;
                while (i < n) {
                    int idx = i;
                    while (idx < n && cs[idx] == cs[i]) idx++;
                    int cnt = idx - i;
                    cs[j++] = cs[i];
                    if (cnt > 1) {
                        int start = j, end = start;
                        string cnt_str = to_string(cnt);
                        for (char c : cnt_str) {
                            cs[end++] = c;
                        }
                        reverse(cs, start, end - 1);
                        j = end;
                    }
                    i = idx;
                }
                return j;
            }
            void reverse(vector<char>& cs, int start, int end) {
                while (start < end) {
                    char t = cs[start];
                    cs[start] = cs[end];
                    cs[end] = t;
                    start++; end--;
                }
            }
        };

        image.gif

        C++简洁版:

        class Solution {
        public:
            int compress(vector<char>& chars) {
                int i=0,j=0,n=chars.size();
                while(i<n){
                    int idx=i;
                    while(idx<n && chars[idx]==chars[i]) idx++;
                    int cnt=idx-i;
                    chars[j++]=chars[i];
                    if(cnt>1){
                        string s=to_string(cnt);
                        for(auto c:s) chars[j++]=c;
                    }
                    i=idx;
                }
                return j;
            }
        };

        image.gif

        Python版本:

        def compress(cs):
            n = len(cs)
            i, j = 0, 0
            while i < n:
                idx = i
                while idx < n and cs[idx] == cs[i]:
                    idx += 1
                cnt = idx - i
                cs[j] = cs[i]
                j += 1
                if cnt > 1:
                    start = j
                    end = start
                    cnt_str = str(cnt)
                    for c in cnt_str:
                        cs[end] = c
                        end += 1
                    cs[start:end] = cs[start:end][::-1]
                    j = end
                i = idx
            return j

        image.gif


        四、复杂度分析

        没有用到除常量以外额外的空间,满足题目的要求!

          • 时间复杂度:O(n)
          • 空间复杂度:O(1)
          目录
          相关文章
          |
          23天前
          |
          算法 数据处理 C语言
          C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
          本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
          34 1
          |
          26天前
          |
          机器学习/深度学习 算法 数据挖掘
          K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
          K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
          84 4
          |
          20天前
          |
          存储 人工智能 自然语言处理
          Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
          Delta-CoMe是由清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法。该算法通过结合低秩分解和低比特量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。Delta-CoMe特别适用于处理数学、代码和多模态等复杂任务,并在推理速度上有所提升。
          55 6
          Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
          |
          24天前
          |
          存储 算法 搜索推荐
          Python 中数据结构和算法的关系
          数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
          |
          24天前
          |
          数据采集 存储 算法
          Python 中的数据结构和算法优化策略
          Python中的数据结构和算法如何进行优化?
          |
          1月前
          |
          算法
          数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
          在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
          97 23
          |
          1月前
          |
          算法
          数据结构之蜜蜂算法
          蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
          60 20
          |
          23天前
          |
          并行计算 算法 测试技术
          C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
          C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
          54 1
          |
          1月前
          |
          机器学习/深度学习 算法 C++
          数据结构之鲸鱼算法
          鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
          50 0
          |
          1月前
          |
          缓存 算法 Java
          本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
          在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
          49 6