【有营养的算法笔记】基础算法 —— 整数二分与浮点二分

简介: 【有营养的算法笔记】基础算法 —— 整数二分与浮点二分

二分算法有时是一个很玄乎的算法,有时稀里糊涂就对了,有时不是死循环就是查找错误。其实就是边界问题处理不当,所以对于二分来说,很有必要有一定的模板,帮助我们快速解决问题。

今天,我们将围绕整数二分和浮点二分进行讲解。




一、铺垫


概念:二分算法,就是在一段 单调且有序 的区间中通过某些条件,不断对二分的起始边界和结束边界进行调整。从而让区间不断压缩,直至找出二分答案,在每次二分后,区间或多或少都会改变。


二分对于我们来说应该是不陌生的。二分查找 大家应该都听说过,这其实就是二分的一层演变拓展,变为更加精确的查找某些值。


概念部分对 单调性 略有提及。其实对于二分算法,区间具有单调性一定可以二分,但是二分的题目不一定有单调性。


对于二分算法来说,二分是一定会找到答案的。因为二分不断压缩区间,最后必定会分出一个值。


但是这个答案仅仅是对于二分这个算法求出的答案。答案是否正确,还是要结合题目判断。简约的说就是二分的答案不一定是题目的答案,但是二分一定会有答案,无解是对于问题的。


有了这些 铺垫 ,我们再看板子。




二、整数二分模板分析


整数二分有两个板子,这也是我觉得最好的板子,简洁,清晰明了。


我们的两个板子二分的最终结果为 边界值


模板1:区间 [l, r] 被划分成 [l, mid][mid + 1, r] 时使用

bool check(double x) {/* ... */} // 检查x是否满足某种性质
int binarySearch_1(int l, int r)
{
    while (l < r)
    {
        int mid = l + r >> 1;
        if (check(mid)) r = mid;    // check()判断mid是否满足性质
        else l = mid + 1;
    }
    return l;
}


模板2:区间 [l, r] 被划分成 [l, mid - 1] 和 [mid, r] 时使用

int binarySearch_2(int l, int r)
{
    while (l < r)
    {
        int mid = l + r + 1 >> 1;
        if (check(mid)) l = mid;
        else r = mid - 1;
    }
    return l;
}



这里的 check(mid) 函数是为了判断每次二分取的 中间点 mid 是否满足特定性质,从而对区间进行 正确压缩

接下来,我们对两个板子进行分析

模板1

假定一段区间单调递增,区间最左端为 l,区间最右端为 r,区间中点:mid = (l + r) / 2096b38cd2f8afbcb1e6956d9893d6c46.png


对于 模板 1 ,二分找的是 蓝色区间的左边界点 。


mid 可能出现在两个区间中。 check(mid) 检查 mid 是否在 蓝色区间 中。


   mid 所在区间为 蓝色区间 :


此时 check(mid) 为 真 ,答案在 [l, mid] 区间内。这里取 mid 的原因是查找的是蓝色左端点,mid 在蓝色区间,mid 可能就 是答案 。由于查找的是 左端点 ,所以其他 大于 mid 的情况就 不可能 了。调整 r = mid,缩短右边,在左边找答案。


   mid 所在区间为 红色区间 :


此时 check(mid) 为 假 ,答案在 [mid + 1, r] 区间内。这里不取 mid 的原因是查找的是蓝色左端点,mid 在红色区间,所以答案肯定不会落在 mid 上,只有 mid + 1 才 有可能 。调整 l = mid + 1,缩短左边,在右边找答案。


区间划分情况为 [l, mid] 和 [mid + 1, r]。


模板 2:


假定一段区间单调递增,区间最左端为 l,区间最右端为 r,区间中点:mid = (l + r + 1) / 2(这里为什么这么取中点我们先不关心,马上会讲解)



73cd00733d5d8e26a3353d4b55e166c2.png


对于 模板 2,二分找的是 红色区间的右边界点。


mid 可能出现在两个区间中。check(mid) 检查 mid 是否在 红色区间 中。


   mid 所在区间为 红色区间 :


此时 check(mid) 为 真 ,答案在 [mid, r] 区间内。mid 在红色区间中,答案 可能取到 mid ,所以区间包含 mid。由于查找的是 右端点,所以小于 mid 的无需考虑。调整 l = mid,缩短左边,在右边查找答案 。


   mid 所在区间 蓝色区间 :


此时 check(mid) 为 假 ,答案在 [l, mid - 1] 区间内。mid 在蓝色区间中,答案不可能取到 mid,所以区间不包含 mid ,只有 mid - 1 才 有可能 。右边的区间都不需要考虑了。调整 r = mid - 1,缩短右边,在左边查找答案 。


区间划分情况为 [l, mid - 1] 和 [mid, r] 。


讲到这,我们对二分的情况有一些了解后,我们解答一下,为什么 模板 2 的 mid = (l + r + 1) / 2 :

/ 是下取整的,如果 l = r - 1 ,二分取中点 mid 时,mid = (l + r) / 2 = (l + l + 1) / 2 = l

一旦 check(mid) 满足,那么 l = mid,由于 mid = l,那么 l 就被调整为了 l ,相当于没变,这就 死循环 了。+1 就可以避免掉这种情况。


总结一下 :模板 1 找 区间左边界点,模板 2 找 区间右边界点。


215f23a8ae2336aba69cf361a656f9c7.png



例如模板1在上图中找的就是 第一个 3,左端点 ;模板2找的是 最后一个3,右端点




三、模板应用 —— 数的范围


描述


给定一个按照升序排列的长度为 n 的整数数组,以及 q 个查询。


对于每个查询,返回一个元素 k 的起始位置和终止位置(位置从 0 开始计数)。


如果数组中不存在该元素,则返回 -1 -1。


输入格式:


第一行包含整数 n 和 q,表示数组长度和询问个数。

第二行包含 n 个整数(均在 1 ∼ 10000 范围内),表示完整数组。


接下来 q 行,每行包含一个整数 k,表示一个询问元素。


输出格式:

共 q 行,每行包含两个整数,表示所求元素的起始位置和终止位置。

如果数组中不存在该元素,则返回 -1 -1。


数据范围:

1 ≤ n ≤ 100000

1 ≤ q ≤ 10000

1 ≤ k ≤ 10000



输入样例

6 3
1 2 2 3 3 4
3
4
5


输出样例

3 4
5 5
-1 -1


思路

这道题就是模板的经典应用,例如查找的是这样一段区间:


215f23a8ae2336aba69cf361a656f9c7.png


我们查找的是 3 出现的范围,那么返回的就是 3 出现位置的 左端点 和 右端点 。


这就很简单了,左端点就套用模板1,右端点套用模板2。


需要注意的就是 二分结果是否正确 的判断,以及 check(mid) 的写法。


并且二分结束时,l 是必定等于 r的,所以到时候输出 l 和 r 任意一个即可。


   小技巧:如果拿捏不准该使用哪个模板,那么就现根据题意写出 check 后的区间调整状况,根据这个选择模板。


让我们看看代码怎么写:

90e144a445c123478eacce7965301c8a.png



AC,没问题


四、浮点二分模板分析


相较于整数二分,浮点二分更加简单:


bool check(double x) {/* ... */} // 检查x是否满足某种性质
double binarySearch_3(double l, double r)
{
    const double eps = 1e-6;   // eps 表示精度,取决于题目对精度的要求
    while (r - l > eps)
    {
        double mid = (l + r) / 2;
        if (check(mid)) r = mid;
        else l = mid;
    }
    return l;
}



浮点二分 不需要 考虑 向上取整向下取整


对于浮点二分来说,调整区间的时候甚至不需要 +1 或 -1。因为是浮点数,+1, -1就可能会错过答案,所以让其等于 mid 自行调整即可。


接下来写道浮点二分题目来练练手。




五、模板应用 —— 数的三次方根


描述

给定一个浮点数 n ,求它的三次方根。


输入格式

共一行,包含一个浮点数 n


输出格式

共一行,包含一个浮点数,表示问题的解。

注意,结果保留 6 位小数。


数据范围:

−10000 ≤ n ≤ 10000



输入样例

1000.00


输出样例

10.000000



思路:

数据范围为 [-10000, 10000],所以左右边界 l 和 r 就给定这个范围。


另外需要考虑一下精度问题,题目要求保留 6 位小数,一般我们总结的规律是这样的:精度总是比输出位数多2位,输出6位小数,那么精度就给8位小数。


这里取中的话 (l + r) / 2必须写成 / 的形式,因为是浮点数,无法使用 >> 操作符,不要用错了。


然后再考虑一下 check 函数写法:


   如果 mid^3 >= x,说明答案肯定不在右半区间,到左半区间 [l, mid] 找,r = mid

   如果 mid^3 < x,说明答案肯定不在左半区间,到右半区间 [mid, r] 找,l = mid

同理,check 函数也可以写成 mid^3 <= x ,处理情况相似,自己推一下就明白了。

让我们看看代码怎么写:


3b51af12975b92415629f210b16eb619.png


AC,没问题


到这里,本篇博客就到此结束了。一般情况下,二分的题型是都可以使用今天模板解答的。
所以看懂看明白就很重要,一定要多画图推导和多写。
如果觉得anduin写的还不错的话,还请一键三连!如有错误,还请指正!
我是anduin,一名C语言初学者,我们下期见!









相关文章
|
2月前
|
算法 索引
❤️算法笔记❤️-(每日一刷-141、环形链表)
❤️算法笔记❤️-(每日一刷-141、环形链表)
51 0
|
2月前
|
算法 API 计算机视觉
人脸识别笔记(一):通过yuface调包(参数量54K更快更小更准的算法) 来实现人脸识别
本文介绍了YuNet系列人脸检测算法的优化和使用,包括YuNet-s和YuNet-n,以及通过yuface库和onnx在不同场景下实现人脸检测的方法。
73 1
|
2月前
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
74 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
|
2月前
|
算法
❤️算法笔记❤️-(每日一刷-160、相交链表)
❤️算法笔记❤️-(每日一刷-160、相交链表)
18 1
|
2月前
|
数据可视化 搜索推荐 Python
Leecode 刷题笔记之可视化六大排序算法:冒泡、快速、归并、插入、选择、桶排序
这篇文章是关于LeetCode刷题笔记,主要介绍了六大排序算法(冒泡、快速、归并、插入、选择、桶排序)的Python实现及其可视化过程。
21 0
|
2月前
|
算法
❤️算法笔记❤️-(每日一刷-83、删除排序链表中的重复项)
❤️算法笔记❤️-(每日一刷-83、删除排序链表中的重复项)
34 0
|
2月前
|
算法
❤️算法笔记❤️-(每日一刷-26、删除有序数组的重复项)
❤️算法笔记❤️-(每日一刷-26、删除有序数组的重复项)
27 0
|
16天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。
|
22天前
|
机器学习/深度学习 算法 Serverless
基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。
|
2天前
|
供应链 算法 调度
排队算法的matlab仿真,带GUI界面
该程序使用MATLAB 2022A版本实现排队算法的仿真,并带有GUI界面。程序支持单队列单服务台、单队列多服务台和多队列多服务台三种排队方式。核心函数`func_mms2`通过模拟到达时间和服务时间,计算阻塞率和利用率。排队论研究系统中顾客和服务台的交互行为,广泛应用于通信网络、生产调度和服务行业等领域,旨在优化系统性能,减少等待时间,提高资源利用率。
下一篇
DataWorks