(多图详解)优化枚举的基本思路 & 将二维抽象成一维 & 最大化「二分」效益 & 空间优化|Java 刷题打卡

简介: (多图详解)优化枚举的基本思路 & 将二维抽象成一维 & 最大化「二分」效益 & 空间优化|Java 刷题打卡

题目描述



这是 LeetCode 上的 363. 矩形区域不超过 K 的最大数值和 ,难度为 困难


Tag : 「二分」、「前缀和」


给你一个 m x n 的矩阵 matrix 和一个整数 k ,找出并返回矩阵内部矩形区域的不超过 k 的最大数值和。


题目数据保证总会存在一个数值和不超过 k 的矩形区域。

 

示例 1:


输入:matrix = [[1,0,1],[0,-2,3]], k = 2
输出:2
解释:蓝色边框圈出来的矩形区域 [[0, 1], [-2, 3]] 的数值和是 2,且 2 是不超过 k 的最大数字(k = 2)。
复制代码


示例 2:


输入:matrix = [[2,2,-1]], k = 3
输出:3
复制代码


提示:


  • m == matrix.length
  • n == matrix[i].length
  • 1 <= m, n <= 100
  • -100 <= matrix[i][j] <= 100
  • -10510^5105 <= k <= 10510^5105


朴素二维前缀和



从题面来看显然是一道「二维前缀和」的题目,如果你还不了解「二维前缀和」,可以看看 (题解)304. 二维区域和检索 - 矩阵不可变。本题预处理前缀和的复杂度为 O(m∗n)O(m * n)O(mn)


搜索所有子矩阵需要枚举「矩形左上角」和「矩形右下角」,复杂度是 O(m2∗n2)O(m^2 * n^2)O(m2n2)


因此,如果把本题当做二维前缀和模板题来做的话,整体复杂度是 O(m2∗n2)O(m^2 * n^2)O(m2n2)


数据范围是 10210^2102,对应的计算量是 10810^8108,理论上会超时,但当我们枚举「矩形左上角」(i,j)(i,j)(i,j) 的时候,我们只需要搜索位于 (i,j)(i,j)(i,j) 的右下方的点 (p,q)(p,q)(p,q) 作为「矩形右下角」,所以其实我们是取不满 m2∗n2m^2 * n^2m2n2 的,但仍然具有超时风险(2021/04/20 Java 测试可通过,C++ 使用 vector 会 TLE)。


代码:


class Solution {
    public int maxSumSubmatrix(int[][] mat, int k) {
        int m = mat.length, n = mat[0].length;
        int[][] sum = new int[m + 1][n + 1];
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                sum[i][j] = sum[i - 1][j] + sum[i][j - 1] - sum[i - 1][j - 1] + mat[i - 1][j - 1];
            }
        }
        int ans = Integer.MIN_VALUE;
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                for (int p = i; p <= m; p++) {
                    for (int q = j; q <= n; q++) {
                        int cur = sum[p][q] - sum[i - 1][q] - sum[p][j - 1] + sum[i - 1][j - 1];
                        if (cur <= k) {
                            ans = Math.max(ans, cur);
                        } 
                    }
                }
            }
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:预处理前缀和数组复杂度为 O(m∗n)O(m * n)O(mn),查找答案的复杂度为 O(m2∗n2)O(m^2 * n^2)O(m2n2)。整体复杂度为 O(m2∗n2)O(m^2 * n^2)O(m2n2)
  • 空间复杂度:O(m∗n)O(m * n)O(mn)


前缀和 & 二分(抽象一维)



我们来细想一下「朴素二维前缀和」解法是如何搜索答案(子矩阵):通过枚举「左上角」&「右下角」来唯一确定某个矩阵


换句话说是通过枚举 (i,j)(i,j)(i,j)(p,q)(p,q)(p,q) 来唯一确定子矩阵的四条边,每个坐标点可以看作确定子矩阵的某条边。


既然要确定的边有四条,我们可以如何降低复杂度呢?


简单的,我们先思考一下同样是枚举的 1. 两数之和 问题。


1. 两数之和 中可以暴力枚举两个数,也可以只枚举其中一个数,然后使用数据结构(哈希表)来加速找另一个数(这是一个通用的「降低枚举复杂度」思考方向)。


对应到本题,我们可以枚举其中三条边,然后使用数据结构来加速找第四条边。


当我们确定了三条边(红色)之后,形成的子矩阵就单纯取决于第四条边的位置(黄色):


网络异常,图片无法展示
|


于是问题转化为「如何快速求得第四条边(黄色)的位置在哪」。


我们可以进一步将问题缩小,考虑矩阵只有一行(一维)的情况:


网络异常,图片无法展示
|


这时候问题进一步转化为「在一维数组中,求解和不超过 K 的最大连续子数组之和」。


对于这个一维问题,我们可以先预处理出「前缀和」,然后枚举子数组的左端点,然后通过「二分」来求解其右端点的位置。


假定我们已经求得一维数组的前缀和数组 sum,即可得下标范围 [i,j][i,j][i,j] 的和为:

areaSum(i,j)=sum[j]−sum[i−1]⩽kareaSum(i, j) = sum[j] - sum[i - 1] \leqslant kareaSum(i,j)=sum[j]sum[i1]k


经过变形后得:


sum[j]⩽k+sum[i−1]sum[j] \leqslant k + sum[i - 1]sum[j]k+sum[i1]

我们有两种思路来最大化 areaSum(i,j)areaSum(i, j)areaSum(i,j)


  • 确定(枚举)左端点位置 i,求得符合条件的最大右端点 sum[j]
  • 确定(枚举)右端点位置 j,求得符合条件的最小左端点 sum[i]


对于没有负权值的一维数组,我们可以枚举左端点 i,同时利用前缀和的「单调递增」特性,通过「二分」找到符合 sum[j]⩽k+sum[i−1]sum[j] \leqslant k + sum[i - 1]sum[j]k+sum[i1] 条件的最大值 sum[j],从而求解出答案。


但是如果是含有负权值的话,前缀和将会丢失「单调递增」的特性,我们也就无法使用枚举 i 并结合「二分」查找 j 的做法。


这时候需要将过程反过来处理:我们从左到右枚举 j,并使用「有序集合」结构维护遍历过的位置,找到符合 sum[j]−k⩽sum[i]sum[j] - k \leqslant sum[i]sum[j]ksum[i] 条件的最小值 sum[i],从而求解出答案。


基于上述分析,解决这样的一维数组问题复杂度是 O(nlog⁡n)O(n\log{n})O(nlogn) 的。

将这样的思路应用到二维需要一点点抽象能力。


同时,将一维思路应用到本题(二维),复杂度要么是 O(m2∗nlog⁡n)O(m^2 * n\log{n})O(m2nlogn) 要么是 O(n2∗mlog⁡m)O(n^2 * m\log{m})O(n2mlogm)


我们先不考虑「最大化二分收益」问题,先假设我们是固定枚举「上下行」和「右边列」,这时候唯一能够确定一个子矩阵则是取决于「左边列」:


网络异常,图片无法展示
|


重点是如何与「一维」问题进行关联:显然「目标子矩阵的和」等于「子矩阵的右边列 与 原矩阵的左边列 形成的子矩阵和」-「子矩阵左边列 与 原矩阵左边列 形成的子矩阵和」


我们可以使用 area[r] 代表「子矩阵的右边列 与 原矩阵的左边列 形成的子矩阵和」,使用 area[l - 1] 代表「子矩阵的左边列 与 原矩阵的左边列 形成的子矩阵和」的话,则有:


target=area[r]−area[l−1]⩽ktarget = area[r] - area[l - 1] \leqslant ktarget=area[r]area[l1]k


这与我们「一维问题」完全一致,同时由「上下行」&「右边列」可以直接确定 area[r] 的大小,通过「有序集合」存储我们遍历 r 过程中的所有的 area[r] 从而实现「二分」查找符合 area[r]−k⩽area[l−1]area[r] - k \leqslant area[l - 1]area[r]karea[l1] 条件的 最小area[l - 1]


至此,我们通过预处理前缀和 + 容斥原理彻底将题目转化为「一维问题」进行来求解。

代码:


class Solution {
    public int maxSumSubmatrix(int[][] mat, int k) {
        int m = mat.length, n = mat[0].length;
        // 预处理前缀和
        int[][] sum = new int[m + 1][n + 1];
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                sum[i][j] = sum[i - 1][j] + sum[i][j - 1] - sum[i - 1][j - 1] + mat[i - 1][j - 1];
            }
        }
        int ans = Integer.MIN_VALUE;
        // 遍历子矩阵的上边界
        for (int top = 1; top <= m; top++) {
            // 遍历子矩阵的下边界
            for (int bot = top; bot <= m; bot++) {
                // 使用「有序集合」维护所有遍历到的右边界
                TreeSet<Integer> ts = new TreeSet<>();
                ts.add(0);
                // 遍历子矩阵的右边界
                for (int r = 1; r <= n; r++) {
                    // 通过前缀和计算 right
                    int right = sum[bot][r] - sum[top - 1][r];
                    // 通过二分找 left
                    Integer left = ts.ceiling(right - k);
                    if (left != null) {
                        int cur = right - left;
                        ans = Math.max(ans, cur);
                    }
                    // 将遍历过的 right 加到有序集合
                    ts.add(right);
                }
            }
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:枚举上下边界复杂度为 O(m2)O(m^2)O(m2);枚举右边界为 O(n)O(n)O(n),使用 TreeSet(基于红黑树)存储和查找左边界复杂度为 O(log⁡n)O(\log{n})O(logn)。整体复杂度为 O(m2∗nlog⁡n)O(m^2 * n\log{n})O(m2nlogn)
  • 空间复杂度:O(m∗n)O(m * n)O(mn)


最大化「二分」效益



上述解法中,我们先枚举的是「上下行」和「右边列」,然后通过 TreeSet 来「二分」出符合条件的「左边列」。


事实上,我们需要将「二分过程」应用到数值较大的行或者列之中,这样才能最大化我们查找的效率(同时也回答了本题的进阶部分)。


代码:


class Solution {
    public int maxSumSubmatrix(int[][] mat, int k) {
        int m = mat.length, n = mat[0].length;
        int[][] sum = new int[m + 1][n + 1];
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                sum[i][j] = sum[i - 1][j] + sum[i][j - 1] - sum[i - 1][j - 1] + mat[i - 1][j - 1];
            }
        }
        // 固定的是否为右边界
        boolean isRight = n > m;
        int ans = Integer.MIN_VALUE;
        for (int i = 1; i <= (isRight ? m : n); i++) {
            for (int j = i; j <= (isRight ? m : n); j++) {
                TreeSet<Integer> ts = new TreeSet<>();
                ts.add(0);
                for (int fixed = 1; fixed <= (isRight ? n : m); fixed++) {
                    int a = isRight ? sum[j][fixed] - sum[i - 1][fixed] : sum[fixed][j] - sum[fixed][i - 1];
                    Integer b = ts.ceiling(a - k);
                    if (b != null) {
                        int cur = a - b;
                        ans = Math.max(ans, cur);
                    }
                    ts.add(a);
                }
            }
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:预处理「每行」或「每列」的前缀和,复杂度为 O(m∗n)O(m * n)O(mn);枚举子矩阵的「上下行」或「左右行」,复杂度为 O(min⁡(m,n)2)O(\min(m, n)^2)O(min(m,n)2);结合二维前缀和套用一维最大连续子数组解决方案,复杂度为max⁡(m,n)log⁡max⁡(m,n)\max(m, n)\log{\max(m, n)}max(m,n)logmax(m,n)。整体复杂度为 O(min⁡(m,n)2∗max⁡(m,n)log⁡max⁡(m,n))O(\min(m, n)^2 * \max(m, n)\log{\max(m, n)})O(min(m,n)2max(m,n)logmax(m,n))
  • 空间复杂度:O(m∗n)O(m * n)O(mn)


空间优化



不难发现,我们在原矩阵搜索目标子矩阵的过程是严格的「从上到下」&「从左到右」的。


因此我们可以将计算前缀和的逻辑下放到搜索子矩阵的循环里去做,从而将 O(m∗n)O(m * n)O(mn) 的空间复杂度下降到 O(max⁡(m,n))O(\max(m,n))O(max(m,n))


代码:


class Solution {
    public int maxSumSubmatrix(int[][] mat, int k) {
        int m = mat.length, n = mat[0].length;
        boolean isRight = n > m;
        int[] sum = isRight ? new int[n + 1] : new int[m + 1];
        int ans = Integer.MIN_VALUE;
        for (int i = 1; i <= (isRight ? m : n); i++) {
            Arrays.fill(sum, 0);
            for (int j = i; j <= (isRight ? m : n); j++) {
                TreeSet<Integer> ts = new TreeSet<>();
                ts.add(0);
                int a = 0;
                for (int fixed = 1; fixed <= (isRight ? n : m); fixed++) {
                    sum[fixed] += isRight ? mat[j - 1][fixed - 1] : mat[fixed - 1][j - 1] ;
                    a += sum[fixed];
                    Integer b = ts.ceiling(a - k);
                    if (b != null) {
                        int cur = a - b;
                        ans = Math.max(ans, cur);
                    }
                    ts.add(a);
                }
            }
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:预处理「每行」或「每列」的前缀和,复杂度为 O(m∗n)O(m * n)O(mn);枚举子矩阵的「上下行」或「左右行」,复杂度为 O(min⁡(m,n)2)O(\min(m, n)^2)O(min(m,n)2);结合二维前缀和套用一维最大连续子数组解决方案,复杂度为max⁡(m,n)log⁡max(m,n)\max(m, n)\log{max(m, n)}max(m,n)logmax(m,n)。整体复杂度为 O(min⁡(m,n)2∗max⁡(m,n)log⁡max⁡(m,n))O(\min(m, n)^2 * \max(m, n)\log{\max(m, n)})O(min(m,n)2max(m,n)logmax(m,n))
  • 空间复杂度:O(max⁡(m,n))O(\max(m, n))O(max(m,n))


最后



这道困难题还是有点难度的,掘友们学会了吗 🤣


建议着重体会「抽象一维」的如何被推导出来了的 ~

相关文章
|
2月前
|
安全 Java 编译器
new出来的对象,不一定在堆上?聊聊Java虚拟机的优化技术:逃逸分析
逃逸分析是一种静态程序分析技术,用于判断对象的可见性与生命周期。它帮助即时编译器优化内存使用、降低同步开销。根据对象是否逃逸出方法或线程,分析结果分为未逃逸、方法逃逸和线程逃逸三种。基于分析结果,编译器可进行同步锁消除、标量替换和栈上分配等优化,从而提升程序性能。尽管逃逸分析计算复杂度较高,但其在热点代码中的应用为Java虚拟机带来了显著的优化效果。
63 4
|
2月前
|
数据采集 搜索推荐 Java
Java 大视界 -- Java 大数据在智能教育虚拟学习环境构建与用户体验优化中的应用(221)
本文探讨 Java 大数据在智能教育虚拟学习环境中的应用,涵盖多源数据采集、个性化推荐、实时互动优化等核心技术,结合实际案例分析其在提升学习体验与教学质量中的成效,并展望未来发展方向与技术挑战。
|
15天前
|
Java Spring
如何优化Java异步任务的性能?
本文介绍了Java中四种异步任务实现方式:基础Thread、线程池、CompletableFuture及虚拟线程。涵盖多场景代码示例,展示从简单异步到复杂流程编排的演进,适用于不同版本与业务需求,助你掌握高效并发编程实践。(239字)
125 6
|
21天前
|
数据采集 存储 弹性计算
高并发Java爬虫的瓶颈分析与动态线程优化方案
高并发Java爬虫的瓶颈分析与动态线程优化方案
|
2月前
|
存储 人工智能 算法
Java 大视界 -- Java 大数据在智能医疗影像数据压缩与传输优化中的技术应用(227)
本文探讨 Java 大数据在智能医疗影像压缩与传输中的关键技术应用,分析其如何解决医疗影像数据存储、传输与压缩三大难题,并结合实际案例展示技术落地效果。
|
2月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。
|
2月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现(218)
本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度,结合实时路况数据和强化学习算法进行动态路径优化,有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑,展示了Java大数据在解决行业痛点问题中的强大能力,为物流行业的智能化转型提供了切实可行的技术方案。
|
安全 Java 程序员
Java语言枚举(Enum)的深入探索
Java语言枚举(Enum)的深入探索
167 0
|
安全 Java 开发者
Java 枚举(enum)详解
Java 中的枚举(`enum`)是一种特殊的数据类型,用于定义一组固定的常量,提升代码的类型安全性和可读性。枚举使用 `enum` 关键字定义,支持方法和构造函数,具有类型安全、单例、自动序列化等特点,并且可以遍历和用于 `switch` 语句中。实际应用包括状态机、指令集、类型标识等场景。枚举使代码更加清晰易维护。
935 1
|
Java 索引
Java 枚举(enum)
5月更文挑战第7天

热门文章

最新文章