数据结构与算法之美 | 二分查找:剑指offer53 在排序数组中查找数字

简介: 我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。

如何利用“数组是排序的”这一特点设计更快的算法是这一题最好的解决办法?本节我们讨论的本题都是基于这一特点展开的。


通常,我们需要在一个长度为n的数组中查找一个数,需要O(n)O(n)次,所以顺序扫描/查找的时间复杂度为O(n)O(n)。显然这不是最好的方法。


接下来,我们思考如何更好地利用二分查找算法O(logn)O(logn)。二分查找无非就是从数组的中间位置开始,然后讨论三种情况(针对升序数组)。


  • 如果中间位置的数满足/等于设定条件,找到结束;
  • 如果中间位置的数小于设定条件,满足条件的数在后半段;
  • 如果中间位置的数大与设定条件,满足条件的数在前半段;


程序实现的伪代码框架可以有以下参考:


int Binary_Search(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  //设定条件
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


分析至此,我们清楚地知道,二分查找的思想就是在于找到这个设定条件。那么,我们就来以剑指offer中面试题53的三种情况做分别介绍。


题目一:数字在排序数组中出现的次数。


统计一个数字在排序数组中出现的次数。例如,输入排序数组{1,2,3,3,3,3,4,5}和数字3,由于3在数组中出现了4次,因此输出为4。


假设我们要统计数字k在排序数组中出现的次数。如何采用二分查找的方法找到第一个k和最后一个k是本题的核心问题。


我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。


如果中间的数字和k相等呢?我们先判断这个数字是不是第一个k。如果中间数字的前面一个数字不是k,那么此时中间的数字刚好就是第一个k;如果中间数字的前面一个数字也是k,那么第一个k肯定实在数组的前半段,下一轮我们仍然需要在数组的前半段查找。


基于这种思路,我们可以很容易地写出递归的代码找到排序数组中的第一个k。下面是一段参考代码:


int GetFirstK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex > 0 && data[middleIndex - 1] != k)
      || middleIndex == 0)
      return middleIndex;
    else 
      end = middleIndex - 1;
  }
  else if(middleData > k)
    end = middleIndex - 1;
  else
    start = middleIndex + 1;
  return GetFirstK(data,length,k,start, end);
}


我们可以用同样的思路在排序数组中找到最后一个k。基于递归写出如下代码:


int GetLastK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex < length -1 && data[middleIndex - 1] != k)
      || middleIndex == length -1 )
      return middleIndex;
    else 
      start = middleIndex + 1;
  }
  else if(middleData < k)
    start = middleIndex + 1;
  else
    end = middleIndex - 1;
  return GetFirstK(data,length,k,start, end);
}


在分别找到第一个k和最后一个k的下标之后,我们就能计算出k在数组中出现的次数。相应的代码如下:


int GetNumberOfK(int* data, int length, int k)
{
  int number = 0;
  if(data != nullptr && length > 0)
  {
    int first = GetFirstK(data,length,k,0,length-1);
    int last = GetLastK(data,length,k,0,length-1);
    if(first > -1 && last > -1)
      number = last - first + 1;
  }
  return number;
}

题目二:0~n中缺失的数字


一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0~n-10 n−1之内。在范围0~n-10 n−1内的n个数字中有且只有一个数字不在该数组中,请找出这个数。


因为0~n-10 n−1这些数字在数组中是排序的,因此数组中开始的一些数字与它们下标相同。也就是说,0在下标为0的位置,1在下标为1的位置,以此类推。如果不在数组中的那个数字记为m,那么所有比m小的数字的下标都与它们的值相同。

由于m不在数组中,那么m+1处在下表为m的位置,m+2处在下标为m+1的位置,以此类推。我们发现m正好是数组中第一个数值和下标不相等的下标,因此这个问题转换成在排序数组中找出第一个值和下标不相等的元素。


int GetMissingNumber(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length -1;
  while(left < right)
  {
    int middle = (right + left)>>1;
    if(numbers[middle] != middle)
    {
      if(middle == 0 || numbers[middle-1] == middle -1)
        return middle;
      right = middle -1;
    }
    else
      left = middle + 1;
  }
  if(left == length)
    return length;
}


题目三:数组中数值和下标相等的元素


假设一个单调递增的数组里的每个元素都输证书并且是唯一的。请编写程序实现一个函数,找出数组中任意一个数值等于其下标的元素。例如,在数组{-3,-1,1,3,5}中,数字3和它的下标相等。


采用二分查找方法,假设我们某一步抵达数组中的第i个数字。如果我们很幸运,该数字的值刚好也是i,那么我们就找到了一个数字和其下标相等。


那么当数字的值和下标不相等的时候该怎么办呢?


假设数字的值为m,我们先考虑m大与i的情形,即数字的值大与它的下标。由于数组中的所有数字都唯一并且单调递增,那么对于任意大于0的k,位于下标i+k的数字的值大与或等于m+k。另外,因为m>i,所以m+k>i+k。因此,位于下标i+k的数字的值一定大与它的下标。这意味着如果第i个数字的值大与i,那么他右边的数字都大于对应的下标,我们都可以忽略。下一轮查找我们只需要从他左边的数字中查找即可。


数字的值m小于它的下标i的情形和上面类似。下面是基于二分查找的参考代码:


int GetNumberSameAsIndex(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


二分查找算法属于分治的思想,它的应用非常广,之后我再给大家总结其他类型的题目。例如,二进制解析、药品有效性查找、进阶可采用三分法等。

相关文章
|
5天前
|
算法 Java 机器人
Java数据结构与算法:查找算法之二分查找
Java数据结构与算法:查找算法之二分查找
|
5天前
|
算法 Java 调度
Java数据结构与算法:拓扑排序
Java数据结构与算法:拓扑排序
|
6天前
|
存储 算法 调度
【数据结构与算法】详解循环队列:基于数组实现高效存储与访问
【数据结构与算法】详解循环队列:基于数组实现高效存储与访问
|
6天前
|
存储 算法 编译器
【数据结构与算法】使用数组实现栈:原理、步骤与应用
【数据结构与算法】使用数组实现栈:原理、步骤与应用
|
6天前
|
存储 算法 C语言
二分查找算法的概念、原理、效率以及使用C语言循环和数组的简单实现
二分查找算法的概念、原理、效率以及使用C语言循环和数组的简单实现
|
7天前
|
存储 算法 Java
Java数据结构与算法:线性数据结构之数组
Java数据结构与算法:线性数据结构之数组
|
1天前
|
算法 索引
基于Prony算法的系统参数辨识matlab仿真
Prony算法在MATLAB2022a中用于信号分析,识别复指数信号成分。核心程序通过模拟信号X1,添加不同SNR的噪声,应用Prony方法处理并计算误差。算法基于离散序列的复指数叠加模型,通过构建矩阵并解线性方程组估计参数,实现LTI系统动态特性的辨识。
|
2天前
|
算法 安全 数据库
基于结点电压法的配电网状态估计算法matlab仿真
**摘要** 该程序实现了基于结点电压法的配电网状态估计算法,旨在提升数据的准确性和可靠性。在MATLAB2022a中运行,显示了状态估计过程中的电压和相位估计值,以及误差随迭代变化的图表。算法通过迭代计算雅可比矩阵,结合基尔霍夫定律解决线性方程组,估算网络节点电压。状态估计过程中应用了高斯-牛顿或莱文贝格-马夸尔特法,处理量测数据并考虑约束条件,以提高估计精度。程序结果以图形形式展示电压幅值和角度估计的比较,以及估计误差的演变,体现了算法在处理配电网状态估计问题的有效性。
|
2天前
|
算法
基于PSO粒子群优化的PID控制器参数整定算法matlab仿真
该文探讨了使用PSO(粒子群优化)算法优化PID控制器参数的方法。通过PSO迭代,不断调整PID控制器的Kp、Ki、Kd增益,以减小控制误差。文中提供了MATLAB2022a版本的核心代码,展示了参数优化过程及结果。系统仿真图像显示了参数随迭代优化的变化。PID控制器结合PSO算法能有效提升控制性能,适用于复杂系统的参数整定,未来研究可关注算法效率提升和应对不确定性。
|
2天前
|
算法
m基于GA遗传优化的高斯白噪声信道SNR估计算法matlab仿真
**MATLAB2022a模拟展示了遗传算法在AWGN信道中估计SNR的效能。该算法利用生物进化原理全局寻优,解决通信系统中复杂环境下的SNR估计问题。核心代码执行多代选择、重组和突变操作,逐步优化SNR估计。结果以图形形式对比了真实SNR与估计值,并显示了均方根误差(RMSE),体现了算法的准确性。**
10 0