【C++算法图解专栏】一篇文章带你入门二分算法

简介: 【C++算法图解专栏】一篇文章带你入门二分算法

二分法

这一讲我们来介绍一个经常出现在我们视野中的算法 —— 二分法,想必大家都不陌生,利用它可以优化很多过程,使时间复杂度骤降,正如其名二分一样,不用从头往后一个个的遍历。


虽然作为基础算法之一,但是想要完全掌握它并不容易,最让人折磨的是它那“迷人”的边界问题。作为初学者,没必要研究的过于细致,会对自信心有很大的打击,可以先记下模板,后面题目做多了就会慢慢体会出来,接下来我将给大家讲解二分法的一些常用算法和模板。


在此之前需强调一下,二分法只适用于有序序列中,在无序序列中使用二分法没有任何意义。


整数二分

还是继承我们的传统,边讲题目边介绍算法,首先来看第一道开胃菜。


猜数问题

给定 100 以内的一个数,让我们猜出是哪个数。


如果从 1 遍历到 100 那显得比较麻烦,特别是当数字范围扩大时,比如扩大到 10 万,那时间复杂度将非常的高。


所以就要用到二分法来做,每次取中值进行判断,然后再不断地缩小范围,直到超出边界为止,它可以将时间复杂度从 O(1) 降到 O(log2n),还是很可观的。



我们直接上代码:

#include<bits/stdc++.h>
using namespace std;
int a[1000];
int bin_search(int* a, int n, int x) {   //在数组a中找数字x,返回位置
    int left = 0, right = n;
    while (left < right) {
        int mid = left + (right - left) / 2;
        if (a[mid] >= x) right = mid;
        else             left = mid + 1;
        cout << a[mid] << " ";              //打印猜数的过程
    }
    return left;
}
int main() {
    int n = 100;
    for (int i = 0; i < n; i++) a[i] = i + 1;      //赋值,数字1~100
    int test = 54;                      //猜54这个数
    int pos = bin_search(a, n, test);
    cout << "\n" << "test=" << a[pos];
}


其中 mid=left+(right-left)/2 需要大家牢记,它等价于 mid=(left+right)/2,但因为防止整数过大导致溢出,所以我们常用前面那种写法。


另外,我相信这代码中最让人难以理解的是 left 和 right 两指针的边界问题,我这里采用的这种做法的 while 条件为 left<right 而不是 left<=right。这就考虑到循环内部的代码了,先来看看循环内部重点代码的含义分别是什么:


int mid=left+(right-left)/2 表示取左边界 left 和右边界 right 的中值,但需要注意的是由于特性,编译器在计算时遇到小数会自动向下取整,比如 5/2=2,这是一个很关键的点。

if(a[mid]>=x) right=mid 表示当中值大于等于目标值时,将右边界 right 缩小到 mid。因为目标值可能就是 mid,所以不能使 right=mid-1。

else left=mid+1 表示当中值小于目标值时,将左边界 left 缩小到 mid+1。因为目标值现在只可能出现中值的右边,故如果使 left=mid 将毫无意义,已经确定 a[mid] 不是目标值了,并且还可能导致死循环。例如,left=0,right=1,则 mid=1/2=0,且 a[mid]<x,如果还让 left=mid 则循环将永远进行下去。

现在我们考虑,为什么不能让中值大于目标值时 right=mid-1 且中值小于等于目标值时 left=mid,即让上面判断条件反过来。还是上面那个例子,left=0,right=1,则 mid=1/2=0,且 a[mid]<=x,如果让 left=mid 则会死循环。当然也有解决方法,但为了避免混淆,只记住一种方法即可,在后续的使用中只用自己背过的那种处理方法。


但是这道题只是其中一种题型,我们需要背的不只这一个模板,因为这里解决的是一个确定的数,如果该数不存在怎么办,还需要进一步讨论,这就需要继续看我们下面的模板题了。


在单调递增序列中找 x 或者 x 的后继

在单调递增数列 a 中查找某个数 x,如果数列中没有 x,找比它大的第一个数。


这道题和上道题唯一不同的地方就是该题查找的数可能不存在,如果不存在则要找到大于它的第一个数,还是先来看代码:

#include<bits/stdc++.h>
using namespace std;
int a[1000];
int bin_search(int* a, int n, int x) {     //a[0]~a[n-1]是单调递增的
    int left = 0, right = n;              //注意:不是 n-1,此时是左闭右开的[0,n)
    while (left < right) {
        int mid = left + (right - left) / 2;  //int mid = (left + right) >> 1;
        if (a[mid] >= x)  right = mid;
        else    left = mid + 1;
    }                                     //终止于left = right
    return left;
}
int main() {
    int n = 100;
    for (int i = 0; i < n; i++) a[i] = 2 * i + 2;      //赋值,数字2~200,偶数
    int test = 55;                        //找55或55的后继
    int pos = bin_search(a, n, test);
    cout << "test=" << a[pos];
}


可以发现,这个代码和上面一题的核心代码部分一模一样,说明这一类的题都可以用到这个模板。可能会有小伙伴有疑问,如果将 if else 中的条件互换会怎样,答案在下一道题中。


在单调递增序列中找 x 或者 x 的前驱

在单调递增数列 a 中查找某个数 x,如果数列中没有 x,找比它小的第一个数。


这道题咋一看好像和上题差不多,但代码却有区别,上面提到如果将 if else 中条件互换会怎样,来看代码:

#include<bits/stdc++.h>
using namespace std;
int a[1000];
int bin_search2(int* a, int n, int x) {    //a[0]~a[n-1]是单调递增的
    int left = 0, right = n;
    while (left < right) {
        int mid = left + (right - left + 1) / 2;
        if (a[mid] <= x)  left = mid;
        else  right = mid - 1;
    }                                     //终止于left = right
    return left;
}
int main() {
    int n = 100;
    for (int i = 0; i < n; i++) a[i] = 2 * i + 2;     //赋值,数字2~200,偶数
    int test = 55;                       //找55或55的前驱
    int pos = bin_search2(a, n, test);
    cout << "test=" << a[pos];
}


可以发现把条件互换后,还变了一个地方就是 mid,不再是 mid=(left+right)/2,而是 mid=(left+right+1)/2,防止溢出改为 mid=left+(right-left+1)/2。这还是因为向下取整的特性,为了满足本题要求需要对此进行改动。


同样,如果将上面的 right=mid-1 改为 right=mid 也会出现死循环。


我们再来看一道稍微综合一点的模板题,帮助大家进一步理解。


数的范围

给定一个按照升序排列的长度为 n 的整数数组,以及 q 个查询。

对于每个查询,返回一个元素 k 的起始位置和终止位置(位置从 0 开始计数)。

如果数组中不存在该元素,则返回 -1 -1。


输入格式

第一行包含整数 n 和 q,表示数组长度和询问个数。

第二行包含 n 个整数(均在 1∼10000 范围内),表示完整数组。

接下来 q 行,每行包含一个整数 k,表示一个询问元素。


输出格式

共 q 行,每行包含两个整数,表示所求元素的起始位置和终止位置。

如果数组中不存在该元素,则返回 -1 -1。


数据范围

1≤n≤100000

1≤q≤10000

1≤k≤10000


输入样例:

6 3
1 2 2 3 3 4
3
4
5

输出样例:

3 4
5 5
-1 -1


这道题是不是看起来有点眼熟,好像和前面两题求前驱和后继的题目有点类似,还是先来看代码:

#include<bits/stdc++.h>
using namespace std;
int k, n, q;
int arr[100010];
//后继的代码模板 —— 找左端点
int bsearch_1(int l, int r)
{
    while (l < r)
    {
        int mid = l + r >> 1;
        if (arr[mid] < k)   l = mid + 1;
        else r = mid;
    }
    return l;
}
//前驱的代码模板 —— 找右端点
int bsearch_2(int l, int r)
{
    while (l < r)
    {
        int mid = l + r + 1 >> 1;
        if (arr[mid] <= k) l = mid;
        else   r = mid - 1;
    }
    return l;
}
int main()
{
    scanf("%d%d", &n, &q);
    for (int i = 0; i < n; i++)
    {
        scanf("%d", &arr[i]);
    }
    while (q--)
    {
        scanf("%d", &k);
        int x = bsearch_1(0, n - 1);  //寻找左端点
        if (arr[x] != k)    printf("-1 ");
        else printf("%d ", x);
        x = bsearch_2(0, n - 1);  //寻找右端点
        if (arr[x] != k)    printf("-1\n");
        else printf("%d\n", x);
    }
    return 0;
}


本题需要我们找到目标值的相同区间,其中用到的代码模板就是前面两题的模板,归类一下:


寻找左端点:套用后继代码模板

寻找右端点:套用前驱代码模板

这样一看是不是要明朗一些,很多题目其实就是基于这些模板扩展来的。


浮点数二分

浮点数二分就没有整数二分那种烦人的边界问题,因为没有了向下取整,我们只需要考虑其中的精度问题,还是先来看一道模板题。


数的三次方根

给定一个浮点数 n,求它的三次方根。


输入格式

共一行,包含一个浮点数 n。


输出格式

共一行,包含一个浮点数,表示问题的解。

注意,结果保留 6 位小数。


数据范围

−10000≤n≤10000


输入样例:

1000.00

输出样例:

10.000000


这道题一开始看可能会有点懵,不知道这和二分有啥关系。在上面的模板当中,if 语句中的判断其实是可以变的,根据题目的要求进行变化。这道题我们可以对数的三次方根进行二分,先来看代码:

#include<bits/stdc++.h>
using namespace std;
double n;
int main()
{
    cin >> n;
    const double eps = 1e-8;
    double l = -100, r = 100;
    while (r - l > eps)
    {
        double mid = (r + l) / 2;
        if (mid * mid * mid >= n)   r = mid;
        else l = mid;
    }
    printf("%.6lf\n", l);
    return 0;
}


可以发现我们将左边界和右边界分别设置为了 l=-100 和 r=100,这样能够包含数据的范围,计算时区间回往中间收缩直至找到答案。另外,不用再因为边界问题而苦恼,l 和 r 在收缩时不用加一减一,直接等于 mid 即可。


但是要注意的是,浮点数会存在精度问题,可能 r 和 l 永远不相等,所以我们需要模拟相等的情形即只要 r 和 l 的差值足够小,我们就认为它相等。题目要求保留 6 位小数,所以我们可以将精度设置为 1e-8,即当 r-l 只要小于等于 1e-8,我们就认为此时已经收敛到某个值,直接退出循环即可。


总结

恭喜您成功点亮二分算法技能点!


通过上面这么多道模板题,可以发现其中的一些规律,这些题目的二分模板其实都差不多,但是从浮点数二分的模板题来看好像模板中 if 条件可能不同。很多题目不会明摆的告诉你这道题可以用二分来做,需要我们自己去找到其中的划分依据作为 if 中的判断条件,不过大体上模板都是一样的,因此二分的应用场景为:


存在一个有序的序列

可以将题目建模在一个有序序列上查找一个合适的数值

另外,我们仍然可以得出大部分题目通用的模板,如下:


整数二分通用模板

bool check(int x) {/* ... */} //检查x是否满足某种性质
//区间[l, r]被划分成[l, mid]和[mid + 1, r]时使用,例如求一串相同数字的左边界或者某个数字及其后驱
//也就是说我们要找的这个点要尽可能的小,不断缩小右边界,但是每次的结果可能是目标值,故r=mid
int bsearch_1(int l, int r) {
  while (l < r) {
    int mid = l + (r - l) / 2;  //这样可以防止爆int
    if (check(mid)) //mid满足条件,需要保留
      r = mid;    //check()判断mid是否满足性质
    else
      l = mid + 1;
  }
  return l;
}
//区间[l, r]被划分成[l, mid - 1]和[mid, r]时使用,例如求一串相同数字的右边界或者某个数字及其前驱
//也就是说我们要找的这个点要尽可能的大,不断缩小左边界,但是每次的结果可能是目标值,故l=mid
int bsearch_2(int l, int r) {
  while (l < r) {
    //这里要加1是因为除法是向下取整,如果不加1那么当只有两个数时,l=mid会进入死循环
    int mid = l + r + 1 >> 1;
    if (check(mid)) //mid满足条件,需要保留
      l = mid;
    else
      r = mid - 1;
  }
  return l;
}


浮点数二分通用模板

bool check(double x) {/* ... */} // 检查x是否满足某种性质
double bsearch_3(double l, double r)
{
    const double eps = 1e-6;   // eps 表示精度,取决于题目对精度的要求
    while (r - l > eps)
    {
        double mid = (l + r) / 2;
        if (check(mid)) r = mid;
        else l = mid;
    }
    return l;
}
目录
相关文章
|
2天前
|
C++ 存储 编译器
|
2天前
|
存储 算法 C语言
【C++入门到精通】C++的IO流(输入输出流) [ C++入门 ]
【C++入门到精通】C++的IO流(输入输出流) [ C++入门 ]
21 0
|
2天前
|
设计模式 安全 算法
【C++入门到精通】特殊类的设计 | 单例模式 [ C++入门 ]
【C++入门到精通】特殊类的设计 | 单例模式 [ C++入门 ]
18 0
|
19小时前
|
编译器 C++
C++入门(命名空间)
C++入门(命名空间)
|
2天前
|
C++ 编译器 程序员
C++ 从零基础到入门(3)—— 函数基础知识
C++ 从零基础到入门(3)—— 函数基础知识
|
2天前
|
C++ 存储
C++从零基础到入门(2)—— (if、switch、for、while语句)
C++从零基础到入门(2)—— (if、switch、for、while语句)
C++从零基础到入门(2)—— (if、switch、for、while语句)
|
2天前
|
编译器 C语言 C++
C++入门基础-2
C++入门基础
12 3
|
2天前
|
C语言 C++
C++入门基础-1
C++入门基础
18 1
|
2天前
|
自然语言处理 编译器 C语言
【C++】C++ 入门 — 命名空间,输入输出,函数新特性
本文章是我对C++学习的开始,很荣幸与大家一同进步。 首先我先介绍一下C++,C++是上个世纪为了解决软件危机所创立 的一项面向对象的编程语言(OOP思想)。
35 1
【C++】C++ 入门 — 命名空间,输入输出,函数新特性