数据结构与算法之美 | 二分查找:剑指offer53 在排序数组中查找数字

简介: 我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。

如何利用“数组是排序的”这一特点设计更快的算法是这一题最好的解决办法?本节我们讨论的本题都是基于这一特点展开的。


通常,我们需要在一个长度为n的数组中查找一个数,需要O(n)O(n)次,所以顺序扫描/查找的时间复杂度为O(n)O(n)。显然这不是最好的方法。


接下来,我们思考如何更好地利用二分查找算法O(logn)O(logn)。二分查找无非就是从数组的中间位置开始,然后讨论三种情况(针对升序数组)。


  • 如果中间位置的数满足/等于设定条件,找到结束;
  • 如果中间位置的数小于设定条件,满足条件的数在后半段;
  • 如果中间位置的数大与设定条件,满足条件的数在前半段;


程序实现的伪代码框架可以有以下参考:


int Binary_Search(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  //设定条件
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


分析至此,我们清楚地知道,二分查找的思想就是在于找到这个设定条件。那么,我们就来以剑指offer中面试题53的三种情况做分别介绍。


题目一:数字在排序数组中出现的次数。


统计一个数字在排序数组中出现的次数。例如,输入排序数组{1,2,3,3,3,3,4,5}和数字3,由于3在数组中出现了4次,因此输出为4。


假设我们要统计数字k在排序数组中出现的次数。如何采用二分查找的方法找到第一个k和最后一个k是本题的核心问题。


我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。


如果中间的数字和k相等呢?我们先判断这个数字是不是第一个k。如果中间数字的前面一个数字不是k,那么此时中间的数字刚好就是第一个k;如果中间数字的前面一个数字也是k,那么第一个k肯定实在数组的前半段,下一轮我们仍然需要在数组的前半段查找。


基于这种思路,我们可以很容易地写出递归的代码找到排序数组中的第一个k。下面是一段参考代码:


int GetFirstK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex > 0 && data[middleIndex - 1] != k)
      || middleIndex == 0)
      return middleIndex;
    else 
      end = middleIndex - 1;
  }
  else if(middleData > k)
    end = middleIndex - 1;
  else
    start = middleIndex + 1;
  return GetFirstK(data,length,k,start, end);
}


我们可以用同样的思路在排序数组中找到最后一个k。基于递归写出如下代码:


int GetLastK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex < length -1 && data[middleIndex - 1] != k)
      || middleIndex == length -1 )
      return middleIndex;
    else 
      start = middleIndex + 1;
  }
  else if(middleData < k)
    start = middleIndex + 1;
  else
    end = middleIndex - 1;
  return GetFirstK(data,length,k,start, end);
}


在分别找到第一个k和最后一个k的下标之后,我们就能计算出k在数组中出现的次数。相应的代码如下:


int GetNumberOfK(int* data, int length, int k)
{
  int number = 0;
  if(data != nullptr && length > 0)
  {
    int first = GetFirstK(data,length,k,0,length-1);
    int last = GetLastK(data,length,k,0,length-1);
    if(first > -1 && last > -1)
      number = last - first + 1;
  }
  return number;
}

题目二:0~n中缺失的数字


一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0~n-10 n−1之内。在范围0~n-10 n−1内的n个数字中有且只有一个数字不在该数组中,请找出这个数。


因为0~n-10 n−1这些数字在数组中是排序的,因此数组中开始的一些数字与它们下标相同。也就是说,0在下标为0的位置,1在下标为1的位置,以此类推。如果不在数组中的那个数字记为m,那么所有比m小的数字的下标都与它们的值相同。

由于m不在数组中,那么m+1处在下表为m的位置,m+2处在下标为m+1的位置,以此类推。我们发现m正好是数组中第一个数值和下标不相等的下标,因此这个问题转换成在排序数组中找出第一个值和下标不相等的元素。


int GetMissingNumber(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length -1;
  while(left < right)
  {
    int middle = (right + left)>>1;
    if(numbers[middle] != middle)
    {
      if(middle == 0 || numbers[middle-1] == middle -1)
        return middle;
      right = middle -1;
    }
    else
      left = middle + 1;
  }
  if(left == length)
    return length;
}


题目三:数组中数值和下标相等的元素


假设一个单调递增的数组里的每个元素都输证书并且是唯一的。请编写程序实现一个函数,找出数组中任意一个数值等于其下标的元素。例如,在数组{-3,-1,1,3,5}中,数字3和它的下标相等。


采用二分查找方法,假设我们某一步抵达数组中的第i个数字。如果我们很幸运,该数字的值刚好也是i,那么我们就找到了一个数字和其下标相等。


那么当数字的值和下标不相等的时候该怎么办呢?


假设数字的值为m,我们先考虑m大与i的情形,即数字的值大与它的下标。由于数组中的所有数字都唯一并且单调递增,那么对于任意大于0的k,位于下标i+k的数字的值大与或等于m+k。另外,因为m>i,所以m+k>i+k。因此,位于下标i+k的数字的值一定大与它的下标。这意味着如果第i个数字的值大与i,那么他右边的数字都大于对应的下标,我们都可以忽略。下一轮查找我们只需要从他左边的数字中查找即可。


数字的值m小于它的下标i的情形和上面类似。下面是基于二分查找的参考代码:


int GetNumberSameAsIndex(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


二分查找算法属于分治的思想,它的应用非常广,之后我再给大家总结其他类型的题目。例如,二进制解析、药品有效性查找、进阶可采用三分法等。

相关文章
|
9月前
|
机器学习/深度学习 算法 安全
【无人机三维路径规划】基于非支配排序的鲸鱼优化算法NSWOA与多目标螳螂搜索算法MOMSA求解无人机三维路径规划研究(Matlab代码实现)
【无人机三维路径规划】基于非支配排序的鲸鱼优化算法NSWOA与多目标螳螂搜索算法MOMSA求解无人机三维路径规划研究(Matlab代码实现)
403 5
|
9月前
|
机器学习/深度学习 运维 算法
基于非支配排序遗传算法NSGAII的综合能源优化调度(Matlab代码实现)
基于非支配排序遗传算法NSGAII的综合能源优化调度(Matlab代码实现)
452 0
基于非支配排序遗传算法NSGAII的综合能源优化调度(Matlab代码实现)
|
9月前
|
机器学习/深度学习 算法 安全
【无人机三维路径规划】多目标螳螂搜索算法MOMSA与非支配排序的鲸鱼优化算法NSWOA求解无人机三维路径规划研究(Matlab代码实现)
【无人机三维路径规划】多目标螳螂搜索算法MOMSA与非支配排序的鲸鱼优化算法NSWOA求解无人机三维路径规划研究(Matlab代码实现)
312 0
|
9月前
|
机器学习/深度学习 算法 安全
【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)
【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)
261 0
|
9月前
|
存储 算法 搜索推荐
软考算法破壁战:从二分查找到堆排序,九大排序核心速通指南
专攻软考高频算法,深度解析二分查找、堆排序、快速排序核心技巧,对比九大排序算法,配套动画与真题,7天掌握45%分值模块。
378 1
软考算法破壁战:从二分查找到堆排序,九大排序核心速通指南
|
8月前
|
存储 算法 编译器
算法入门:剑指offer改编题目:查找总价格为目标值的两个商品
给定递增数组和目标值target,找出两数之和等于target的两个数字。利用双指针法,left从头、right从尾向中间逼近,根据和与target的大小关系调整指针,时间复杂度O(n),空间复杂度O(1)。找不到时返回{-1,-1}。
|
9月前
|
供应链 算法 Java
【柔性作业车间调度问题FJSP】基于非支配排序的多目标小龙虾优化算法求解柔性作业车间调度问题FJSP研究(Matlab代码实现)
【柔性作业车间调度问题FJSP】基于非支配排序的多目标小龙虾优化算法求解柔性作业车间调度问题FJSP研究(Matlab代码实现)
369 1
|
9月前
|
机器学习/深度学习 算法 安全
【无人机三维路径规划】基于非支配排序的鱼鹰优化算法NSOOA求解无人机三维路径规划研究(Matlab代码实现)
【无人机三维路径规划】基于非支配排序的鱼鹰优化算法NSOOA求解无人机三维路径规划研究(Matlab代码实现)
194 0
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
1341 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
机器学习/深度学习 存储 缓存
数据结构与算法学习十:排序算法介绍、时间频度、时间复杂度、常用时间复杂度介绍
文章主要介绍了排序算法的分类、时间复杂度的概念和计算方法,以及常见的时间复杂度级别,并简单提及了空间复杂度。
958 1
数据结构与算法学习十:排序算法介绍、时间频度、时间复杂度、常用时间复杂度介绍

热门文章

最新文章