数据结构与算法之美 | 二分查找:剑指offer53 在排序数组中查找数字

简介: 我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。

如何利用“数组是排序的”这一特点设计更快的算法是这一题最好的解决办法?本节我们讨论的本题都是基于这一特点展开的。


通常,我们需要在一个长度为n的数组中查找一个数,需要O(n)O(n)次,所以顺序扫描/查找的时间复杂度为O(n)O(n)。显然这不是最好的方法。


接下来,我们思考如何更好地利用二分查找算法O(logn)O(logn)。二分查找无非就是从数组的中间位置开始,然后讨论三种情况(针对升序数组)。


  • 如果中间位置的数满足/等于设定条件,找到结束;
  • 如果中间位置的数小于设定条件,满足条件的数在后半段;
  • 如果中间位置的数大与设定条件,满足条件的数在前半段;


程序实现的伪代码框架可以有以下参考:


int Binary_Search(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  //设定条件
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


分析至此,我们清楚地知道,二分查找的思想就是在于找到这个设定条件。那么,我们就来以剑指offer中面试题53的三种情况做分别介绍。


题目一:数字在排序数组中出现的次数。


统计一个数字在排序数组中出现的次数。例如,输入排序数组{1,2,3,3,3,3,4,5}和数字3,由于3在数组中出现了4次,因此输出为4。


假设我们要统计数字k在排序数组中出现的次数。如何采用二分查找的方法找到第一个k和最后一个k是本题的核心问题。


我们先分析如何找到第一个k。二分查找算法总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。


如果中间的数字和k相等呢?我们先判断这个数字是不是第一个k。如果中间数字的前面一个数字不是k,那么此时中间的数字刚好就是第一个k;如果中间数字的前面一个数字也是k,那么第一个k肯定实在数组的前半段,下一轮我们仍然需要在数组的前半段查找。


基于这种思路,我们可以很容易地写出递归的代码找到排序数组中的第一个k。下面是一段参考代码:


int GetFirstK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex > 0 && data[middleIndex - 1] != k)
      || middleIndex == 0)
      return middleIndex;
    else 
      end = middleIndex - 1;
  }
  else if(middleData > k)
    end = middleIndex - 1;
  else
    start = middleIndex + 1;
  return GetFirstK(data,length,k,start, end);
}


我们可以用同样的思路在排序数组中找到最后一个k。基于递归写出如下代码:


int GetLastK(int* data, int length, int k, int start, int end)
{
  if(start > end)
    return -1;
  int middleIndex = (start + end)/2;
  int middleData = data[middleIndex];
  if(middle == k)
  {
    if((middleIndex < length -1 && data[middleIndex - 1] != k)
      || middleIndex == length -1 )
      return middleIndex;
    else 
      start = middleIndex + 1;
  }
  else if(middleData < k)
    start = middleIndex + 1;
  else
    end = middleIndex - 1;
  return GetFirstK(data,length,k,start, end);
}


在分别找到第一个k和最后一个k的下标之后,我们就能计算出k在数组中出现的次数。相应的代码如下:


int GetNumberOfK(int* data, int length, int k)
{
  int number = 0;
  if(data != nullptr && length > 0)
  {
    int first = GetFirstK(data,length,k,0,length-1);
    int last = GetLastK(data,length,k,0,length-1);
    if(first > -1 && last > -1)
      number = last - first + 1;
  }
  return number;
}

题目二:0~n中缺失的数字


一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0~n-10 n−1之内。在范围0~n-10 n−1内的n个数字中有且只有一个数字不在该数组中,请找出这个数。


因为0~n-10 n−1这些数字在数组中是排序的,因此数组中开始的一些数字与它们下标相同。也就是说,0在下标为0的位置,1在下标为1的位置,以此类推。如果不在数组中的那个数字记为m,那么所有比m小的数字的下标都与它们的值相同。

由于m不在数组中,那么m+1处在下表为m的位置,m+2处在下标为m+1的位置,以此类推。我们发现m正好是数组中第一个数值和下标不相等的下标,因此这个问题转换成在排序数组中找出第一个值和下标不相等的元素。


int GetMissingNumber(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length -1;
  while(left < right)
  {
    int middle = (right + left)>>1;
    if(numbers[middle] != middle)
    {
      if(middle == 0 || numbers[middle-1] == middle -1)
        return middle;
      right = middle -1;
    }
    else
      left = middle + 1;
  }
  if(left == length)
    return length;
}


题目三:数组中数值和下标相等的元素


假设一个单调递增的数组里的每个元素都输证书并且是唯一的。请编写程序实现一个函数,找出数组中任意一个数值等于其下标的元素。例如,在数组{-3,-1,1,3,5}中,数字3和它的下标相等。


采用二分查找方法,假设我们某一步抵达数组中的第i个数字。如果我们很幸运,该数字的值刚好也是i,那么我们就找到了一个数字和其下标相等。


那么当数字的值和下标不相等的时候该怎么办呢?


假设数字的值为m,我们先考虑m大与i的情形,即数字的值大与它的下标。由于数组中的所有数字都唯一并且单调递增,那么对于任意大于0的k,位于下标i+k的数字的值大与或等于m+k。另外,因为m>i,所以m+k>i+k。因此,位于下标i+k的数字的值一定大与它的下标。这意味着如果第i个数字的值大与i,那么他右边的数字都大于对应的下标,我们都可以忽略。下一轮查找我们只需要从他左边的数字中查找即可。


数字的值m小于它的下标i的情形和上面类似。下面是基于二分查找的参考代码:


int GetNumberSameAsIndex(int* numbers, int length)
{
  if(numbers == nullptr || length <= 0)
    return -1;
  int left = 0;
  int right = length - 1;
  while(legt <= right)
  {
    int middle = left + (right-left)>>1;
    if(numbers[middle] == middle)  
      return middle;
    if(numbers[middle] > middle)
      right = middle - 1;
    else
      left = middle + 1;
  }
  return -1;
}


二分查找算法属于分治的思想,它的应用非常广,之后我再给大家总结其他类型的题目。例如,二进制解析、药品有效性查找、进阶可采用三分法等。

相关文章
|
1月前
|
算法
Leetcode 初级算法 --- 数组篇
Leetcode 初级算法 --- 数组篇
38 0
|
1月前
|
算法 程序员 索引
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器
栈的基本概念、应用场景以及如何使用数组和单链表模拟栈,并展示了如何利用栈和中缀表达式实现一个综合计算器。
30 1
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器
|
1月前
|
算法 搜索推荐 Java
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
基数排序是一种稳定的排序算法,通过将数字按位数切割并分配到不同的桶中,以空间换时间的方式实现快速排序,但占用内存较大,不适合含有负数的数组。
23 0
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
|
1月前
|
存储 算法 定位技术
数据结构与算法学习二、稀疏数组与队列,数组模拟队列,模拟环形队列
这篇文章主要介绍了稀疏数组和队列的概念、应用实例以及如何使用数组模拟队列和环形队列的实现方法。
21 0
数据结构与算法学习二、稀疏数组与队列,数组模拟队列,模拟环形队列
|
16天前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
90 9
|
7天前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
15 1
|
10天前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。
|
12天前
|
存储 JavaScript 前端开发
执行上下文和执行栈
执行上下文是JavaScript运行代码时的环境,每个执行上下文都有自己的变量对象、作用域链和this值。执行栈用于管理函数调用,每当调用一个函数,就会在栈中添加一个新的执行上下文。
|
14天前
|
存储
系统调用处理程序在内核栈中保存了哪些上下文信息?
【10月更文挑战第29天】系统调用处理程序在内核栈中保存的这些上下文信息对于保证系统调用的正确执行和用户程序的正常恢复至关重要。通过准确地保存和恢复这些信息,操作系统能够实现用户模式和内核模式之间的无缝切换,为用户程序提供稳定、可靠的系统服务。
42 4
|
19天前
|
算法 安全 NoSQL
2024重生之回溯数据结构与算法系列学习之栈和队列精题汇总(10)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第3章之IKUN和I原达人之数据结构与算法系列学习栈与队列精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!