【有营养的算法笔记】基础算法 —— 整数二分与浮点二分

简介: 【有营养的算法笔记】基础算法 —— 整数二分与浮点二分

二分算法有时是一个很玄乎的算法,有时稀里糊涂就对了,有时不是死循环就是查找错误。其实就是边界问题处理不当,所以对于二分来说,很有必要有一定的模板,帮助我们快速解决问题。

今天,我们将围绕整数二分和浮点二分进行讲解。




一、铺垫


概念:二分算法,就是在一段 单调且有序 的区间中通过某些条件,不断对二分的起始边界和结束边界进行调整。从而让区间不断压缩,直至找出二分答案,在每次二分后,区间或多或少都会改变。


二分对于我们来说应该是不陌生的。二分查找 大家应该都听说过,这其实就是二分的一层演变拓展,变为更加精确的查找某些值。


概念部分对 单调性 略有提及。其实对于二分算法,区间具有单调性一定可以二分,但是二分的题目不一定有单调性。


对于二分算法来说,二分是一定会找到答案的。因为二分不断压缩区间,最后必定会分出一个值。


但是这个答案仅仅是对于二分这个算法求出的答案。答案是否正确,还是要结合题目判断。简约的说就是二分的答案不一定是题目的答案,但是二分一定会有答案,无解是对于问题的。


有了这些 铺垫 ,我们再看板子。




二、整数二分模板分析


整数二分有两个板子,这也是我觉得最好的板子,简洁,清晰明了。


我们的两个板子二分的最终结果为 边界值


模板1:区间 [l, r] 被划分成 [l, mid][mid + 1, r] 时使用

bool check(double x) {/* ... */} // 检查x是否满足某种性质
int binarySearch_1(int l, int r)
{
    while (l < r)
    {
        int mid = l + r >> 1;
        if (check(mid)) r = mid;    // check()判断mid是否满足性质
        else l = mid + 1;
    }
    return l;
}


模板2:区间 [l, r] 被划分成 [l, mid - 1] 和 [mid, r] 时使用

int binarySearch_2(int l, int r)
{
    while (l < r)
    {
        int mid = l + r + 1 >> 1;
        if (check(mid)) l = mid;
        else r = mid - 1;
    }
    return l;
}



这里的 check(mid) 函数是为了判断每次二分取的 中间点 mid 是否满足特定性质,从而对区间进行 正确压缩

接下来,我们对两个板子进行分析

模板1

假定一段区间单调递增,区间最左端为 l,区间最右端为 r,区间中点:mid = (l + r) / 2096b38cd2f8afbcb1e6956d9893d6c46.png


对于 模板 1 ,二分找的是 蓝色区间的左边界点 。


mid 可能出现在两个区间中。 check(mid) 检查 mid 是否在 蓝色区间 中。


   mid 所在区间为 蓝色区间 :


此时 check(mid) 为 真 ,答案在 [l, mid] 区间内。这里取 mid 的原因是查找的是蓝色左端点,mid 在蓝色区间,mid 可能就 是答案 。由于查找的是 左端点 ,所以其他 大于 mid 的情况就 不可能 了。调整 r = mid,缩短右边,在左边找答案。


   mid 所在区间为 红色区间 :


此时 check(mid) 为 假 ,答案在 [mid + 1, r] 区间内。这里不取 mid 的原因是查找的是蓝色左端点,mid 在红色区间,所以答案肯定不会落在 mid 上,只有 mid + 1 才 有可能 。调整 l = mid + 1,缩短左边,在右边找答案。


区间划分情况为 [l, mid] 和 [mid + 1, r]。


模板 2:


假定一段区间单调递增,区间最左端为 l,区间最右端为 r,区间中点:mid = (l + r + 1) / 2(这里为什么这么取中点我们先不关心,马上会讲解)



73cd00733d5d8e26a3353d4b55e166c2.png


对于 模板 2,二分找的是 红色区间的右边界点。


mid 可能出现在两个区间中。check(mid) 检查 mid 是否在 红色区间 中。


   mid 所在区间为 红色区间 :


此时 check(mid) 为 真 ,答案在 [mid, r] 区间内。mid 在红色区间中,答案 可能取到 mid ,所以区间包含 mid。由于查找的是 右端点,所以小于 mid 的无需考虑。调整 l = mid,缩短左边,在右边查找答案 。


   mid 所在区间 蓝色区间 :


此时 check(mid) 为 假 ,答案在 [l, mid - 1] 区间内。mid 在蓝色区间中,答案不可能取到 mid,所以区间不包含 mid ,只有 mid - 1 才 有可能 。右边的区间都不需要考虑了。调整 r = mid - 1,缩短右边,在左边查找答案 。


区间划分情况为 [l, mid - 1] 和 [mid, r] 。


讲到这,我们对二分的情况有一些了解后,我们解答一下,为什么 模板 2 的 mid = (l + r + 1) / 2 :

/ 是下取整的,如果 l = r - 1 ,二分取中点 mid 时,mid = (l + r) / 2 = (l + l + 1) / 2 = l

一旦 check(mid) 满足,那么 l = mid,由于 mid = l,那么 l 就被调整为了 l ,相当于没变,这就 死循环 了。+1 就可以避免掉这种情况。


总结一下 :模板 1 找 区间左边界点,模板 2 找 区间右边界点。


215f23a8ae2336aba69cf361a656f9c7.png



例如模板1在上图中找的就是 第一个 3,左端点 ;模板2找的是 最后一个3,右端点




三、模板应用 —— 数的范围


描述


给定一个按照升序排列的长度为 n 的整数数组,以及 q 个查询。


对于每个查询,返回一个元素 k 的起始位置和终止位置(位置从 0 开始计数)。


如果数组中不存在该元素,则返回 -1 -1。


输入格式:


第一行包含整数 n 和 q,表示数组长度和询问个数。

第二行包含 n 个整数(均在 1 ∼ 10000 范围内),表示完整数组。


接下来 q 行,每行包含一个整数 k,表示一个询问元素。


输出格式:

共 q 行,每行包含两个整数,表示所求元素的起始位置和终止位置。

如果数组中不存在该元素,则返回 -1 -1。


数据范围:

1 ≤ n ≤ 100000

1 ≤ q ≤ 10000

1 ≤ k ≤ 10000



输入样例

6 3
1 2 2 3 3 4
3
4
5


输出样例

3 4
5 5
-1 -1


思路

这道题就是模板的经典应用,例如查找的是这样一段区间:


215f23a8ae2336aba69cf361a656f9c7.png


我们查找的是 3 出现的范围,那么返回的就是 3 出现位置的 左端点 和 右端点 。


这就很简单了,左端点就套用模板1,右端点套用模板2。


需要注意的就是 二分结果是否正确 的判断,以及 check(mid) 的写法。


并且二分结束时,l 是必定等于 r的,所以到时候输出 l 和 r 任意一个即可。


   小技巧:如果拿捏不准该使用哪个模板,那么就现根据题意写出 check 后的区间调整状况,根据这个选择模板。


让我们看看代码怎么写:

90e144a445c123478eacce7965301c8a.png



AC,没问题


四、浮点二分模板分析


相较于整数二分,浮点二分更加简单:


bool check(double x) {/* ... */} // 检查x是否满足某种性质
double binarySearch_3(double l, double r)
{
    const double eps = 1e-6;   // eps 表示精度,取决于题目对精度的要求
    while (r - l > eps)
    {
        double mid = (l + r) / 2;
        if (check(mid)) r = mid;
        else l = mid;
    }
    return l;
}



浮点二分 不需要 考虑 向上取整向下取整


对于浮点二分来说,调整区间的时候甚至不需要 +1 或 -1。因为是浮点数,+1, -1就可能会错过答案,所以让其等于 mid 自行调整即可。


接下来写道浮点二分题目来练练手。




五、模板应用 —— 数的三次方根


描述

给定一个浮点数 n ,求它的三次方根。


输入格式

共一行,包含一个浮点数 n


输出格式

共一行,包含一个浮点数,表示问题的解。

注意,结果保留 6 位小数。


数据范围:

−10000 ≤ n ≤ 10000



输入样例

1000.00


输出样例

10.000000



思路:

数据范围为 [-10000, 10000],所以左右边界 l 和 r 就给定这个范围。


另外需要考虑一下精度问题,题目要求保留 6 位小数,一般我们总结的规律是这样的:精度总是比输出位数多2位,输出6位小数,那么精度就给8位小数。


这里取中的话 (l + r) / 2必须写成 / 的形式,因为是浮点数,无法使用 >> 操作符,不要用错了。


然后再考虑一下 check 函数写法:


   如果 mid^3 >= x,说明答案肯定不在右半区间,到左半区间 [l, mid] 找,r = mid

   如果 mid^3 < x,说明答案肯定不在左半区间,到右半区间 [mid, r] 找,l = mid

同理,check 函数也可以写成 mid^3 <= x ,处理情况相似,自己推一下就明白了。

让我们看看代码怎么写:


3b51af12975b92415629f210b16eb619.png


AC,没问题


到这里,本篇博客就到此结束了。一般情况下,二分的题型是都可以使用今天模板解答的。
所以看懂看明白就很重要,一定要多画图推导和多写。
如果觉得anduin写的还不错的话,还请一键三连!如有错误,还请指正!
我是anduin,一名C语言初学者,我们下期见!









相关文章
|
22天前
|
算法
计算机算法设计与分析(1-6章 复习笔记)
计算机算法设计与分析(1-6章 复习笔记)
|
8天前
|
存储 算法 Java
技术笔记:JVM的垃圾回收机制总结(垃圾收集、回收算法、垃圾回收器)
技术笔记:JVM的垃圾回收机制总结(垃圾收集、回收算法、垃圾回收器)
|
16天前
|
机器学习/深度学习 算法 BI
机器学习笔记(一) 感知机算法 之 原理篇
机器学习笔记(一) 感知机算法 之 原理篇
|
1天前
|
存储 算法 C语言
软考中级之数据库系统工程师笔记总结(二)数据结构与算法
软考中级之数据库系统工程师笔记总结(二)数据结构与算法
4 0
|
4天前
|
存储 算法 程序员
|
9天前
|
机器学习/深度学习 算法 数据可视化
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
16 0
|
9天前
|
Java BI C#
技术笔记:SM4加密算法实现Java和C#相互加密解密
技术笔记:SM4加密算法实现Java和C#相互加密解密
10 0
|
9天前
|
存储 人工智能 算法
程序与技术分享:Acwing算法笔记
程序与技术分享:Acwing算法笔记
|
9天前
|
算法 安全 Java
技术笔记:MD5加密算法详解
技术笔记:MD5加密算法详解
|
9天前
|
移动开发 算法 计算机视觉
技术笔记:openCV特征点识别与findHomography算法过滤
技术笔记:openCV特征点识别与findHomography算法过滤
10 0