【数据结构与算法分析】0基础带你学数据结构与算法分析07--二叉树

简介: 在学习上一章后,我们对树加以限制,如果树的度为 2,那么就称这颗树为 二叉树 (binary tree)。

在学习上一章后,我们对树加以限制,如果树的度为 2,那么就称这颗树为 二叉树 (binary tree)。


二叉树的性质


在一棵二叉树上,有一些重要的性质:


第 i 层 (i∈N) 上最多有 2^(i−1) 个结点

层次为 k(k∈N) 的树最多有 2^k−1 个结点

如果叶结点的数量为 n0 , degree=2 的结点的数量为 n2 ,则 n0=n2+1

如果将二叉树的每一层填满,那么这颗二叉树被称之为 满二叉树 (full binary tree);如果这颗二叉树除最后一层外都是满的,且最后一层要么是满的,要么是右边缺少连续的若干结点,那么称这颗二叉树为 完全二叉树 (complete binary tree)。

7.png

由于 full binary tree 与 complete binary tree 是特殊的二叉树,因此它们也有一些确定性的性质。我们假设总结点数为 k ,树的高度 (即树的层数) 为 h ,其中某一层为第 i 层,则有以下性质:


8.png

二叉树的实现


为实现二叉树,我们可以为其采用双向链表的结构,但不再是指向结点的 prev 和 next,而是指向该结点的 left child 和 right child。


struct BinaryTreeBaseNode {
  BinaryTreeBaseNode* left,* right;
};
template <class Element>
struct BinaryTreeNode : BinaryTreeBaseNode {
  Element data;
};

在这里给出求解二叉树 root 中,node 的高度和深度

// 求解结点 node 的高度
int node_height(BinaryTreeBaseNode* node) {
  if (node == nullptr) {
    return -1;
  }
  return max(binary_tree_height(node->left),
             binary_tree_height(node->right)) + 1;
}
// 求解结点 node 在树 root 中的深度
int node_depth(BinaryTreeBaseNode* root, const BinaryTreeBaseNode* node) {
  if (root == nullptr) {
    return -1;
  }
  if (root == node) {
    return 0;
  }
  int left_depth = node_depth(root->left, node);
  int right_depth = node_depth(root->right, node);
  return left_depth == -1 ? (right_depth += right_depth != -1) : (left_depth + 1);
}


如果想要从结点向上求解某些数据时,并不容易做到,因为 child 没有指向 parent 的指针,需要遍历树找到 node 的 parent 才能操作。


// 求解结点 node 的 parent,如果不存在返回 nullptr
BinaryTreeBaseNode* get_parent(BinaryTreeBaseNode* root, const BinaryTreeBaseNode* node) {
  if (root == nullptr || root == node) {
    return nullptr;
  }
  if (root->left == node || root->right == node) {
    return root;
  }
  auto left = get_parent(root->left, node);
  return left == nullptr ? get_parent(root->right, node) : left;
}

为了方便实现我们自然而然的会在链域中添加指向 parent 的指针。这样在求解 sibling、 uncle 时十分方便,并且求解结点的深度时不再需要将其等价为 root 到 node 的路径长。需要注意的是,root 是没有 parent 的。

9.png

二叉树的遍历


还记得之前提到的 postorder traversal 与 preorder traversal 吗,它们对二叉树同样适用。不过先别急,既然现在 child 的数量确定了,能不能将对结点的处理放在两个结点的处理之间完成呢?当然没问题!这种处理方式就是 中序遍历 (inorder traversal),当然这也是 DFS 的一种。


如果将当前结点标记为 N,左子结点标记为 L,右子结点标记为 R,那么前序遍历就可以表示为 NLR,中序遍历可以表示为 LNR,后序遍历可以表示为 LRN。


二叉树的前序遍历

recursion
void preorder(BinaryTreeBaseNode* root) {
  if (root == nullptr) {
    return;
  }
  process(root);
  preorder(root->left);
  preorder(root->right);
}
loop
void preorder(BinaryTreeBaseNode* root) {
  stack s;
  while (!s.empty() || root != nullptr) {
    while (root != nullptr) {
      process(root);
      s.push(root);
      root = root->left;
    }
    root = s.top();
    s.pop();
    root = root->rightl;
  }
}

二叉树的中序遍历

recursion
void inorder(BinaryTreeBaseNode* root) {
  if (root == nullptr) {
    return;
  }
  preorder(root->left);
  process(root);
  preorder(root->right);
}
loop
void preorder(BinaryTreeBaseNode* root) {
  stack s;
  while (!s.empty() || root != nullptr) {
    while (root != nullptr) {
      s.push(root);
      root = root->left;
    }
    root = s.top();
    s.pop();
    process(root);
    root = root->rightl;
  }
}

二叉树的后序遍历

recursion
void postorder(BinaryTreeBaseNode* root) {
  if (root == nullptr) {
    return;
  }
  preorder(root->left);
  preorder(root->right);
  process(root);
}
loop

在后序遍历中,在左子结点处理完成后,只有结点没有右子结点或右子结点处理完之后,才能对结点进行处理。因此需要判别当前结点的 右子结点为空 或 刚刚处理过的结点 是该结点的右子结点。判断右子结点为空十分简单,但是问题是如何记录刚刚访问过的结点?


利用一个变量指向正在处理的结点,当指向下一个待处理的结点时,其值就是该结点的上一个处理的结点,即处理前驱。


void postorder(BinaryTreeBaseNode* root) {
  stack s;
  BinaryTreeBaseNode* prev = nullptr;
  while (!s.empty() || root != nullptr) {
    while (root != nullptr) {
      s.push(root);
      root = root->left;
    }
    root = s.top();
    s.pop();
    if (root->right == nullptr || root->right == prev) {
      prev = root;
      process(root);
      root = nullptr;
    } else {
      s.push(root);
      root = root->right;
    }
  }
}


一个异构的前序遍历

如果你在对一个单词串进行翻转时,有一个简单可行的方法:先将单词串整体翻转,之后再逐词翻转。这样你就得到了一个对单词串的翻转!

10.png

这种异构的翻转也可以用在二叉树的 DFS 遍历上,前序遍历时遍历的结点顺序为 NLR (Node->Left->Right),而后续遍历的结点顺序为 LRN ,对后续遍历的顺序进行翻转就变为了 NRL 。如果以 NRL 的顺序进行遍历,最后将结果翻转也可以得到一个后序遍历的序列,这本质上是一种前序遍历的异构。


二叉树的层序遍历

DFS 天生与 stack 结合在一起,而 BFS 与 queue 结合在一起。因此对于以上三种 DFS 遍历,使用 recursion 是一种简单、高效的理解与编码,而层序遍历则更适合于 loop。


void levelorder(BinaryTreeBaseNode* root) {
  queue q;
  q.push(root);
  while (!q.empty()) {
    for (int i = 0, cur_level_size = q.size(); i < cur_level_size; ++i) {
      root = q.front();
      q.pop();
      process(root);
      if (root->left != nullptr) {
        q.push(root->left);
      }
      if (root->right != nullptr) {
        q.push(root->right);
      }
    }
  }
}

Morris 遍历

在以上介绍的三种 DFS 遍历中,无论是 recursion 还是 loop 实现,都需要 O(N) 的时间复杂度与 O(N) 的空间复杂度。而 1979 年由 J.H.Morris 在他的 论文 中提出了一种遍历方式,可以利用 O(N) 的时间复杂度与 O(1) 的空间复杂度完成遍历。其核心思想是利用二叉树中的空闲指针,以实现空间复杂度的降低。


以 postorder 为例说明其算法的具体思路:


如果当前结点的左子树为空,则遍历右子树

如果当前结点的左子树不为空,在当前结点的左子树中找到当前结点在中序遍历中的前驱结点

如果前驱的右子结点为空,则将前驱结点的右子结点设置为当前结点,当前结点更新为其左子结点

如果前驱的右子结点为当前结点,则将其重新置空。倒序处理从当前结点的左子结点到该前驱结点路径上的所有结点。完成后将当前结点更新为当前结点的右子结点

重复步骤 1、2 直到遍历结束11.png

void __reverse_process(BinaryTreeBaseNode* node) {
  if (node == nullptr) {
    return;
  }
  __reverse_process(node->right);
  process(node);
}
void postorderTraversal(BinaryTreeBaseNode* root) {
  BinaryTreeBaseNode* cur = root,* prev = nullptr;
  while (cur != nullptr) {
    prev = cur->left;
    if (prev != nullptr) {
      while (prev->right != nullptr && prev->right != cur) {
        prev = prev->right;
      }
      if (prev->right == nullptr) {
        prev->right = cur;
        cur = cur->left;
        continue;
      }
      prev->right = nullptr;
      __reverse_process(cur->left);
    }
    cur = cur->right;
  }
  __reverse_precess(root);
}

迭代器

既然可以遍历一棵树,那么依然希望可以在这棵树上暂停下来,对结点进行一些操作,再继续进行迭代。当我们选择的遍历方法不一样时,其迭代时的前驱与后继就不相同。


如果现在给定一个迭代器,应该如何找到迭代器的前驱与后继迭代器。这里给出求解中序遍历前驱的算法步骤与代码,求解中序遍历后继的算法与前驱的算法类似,因此只给出代码。


求解前驱

如果结点的左子树存在,则前驱是结点左子树上最大的结点

如果结点的左子树不存在,则需要寻找结点的 parent

若结点是 parent 的右子树上的结点,则 parent 是其前驱

若结点是 parent 的左子树上的结点,继续向上寻找,直到 parent 为 nullptr 或是其 parent 的右子树上的结点

// 寻找结点 node 的前驱
BinaryTreeBaseNode* get_previous(BinaryTreeBaseNode* node) {
  if (node->left != nullptr) {
    node = node->left;
    while (node->right != nullptr) {
      node = node->right;
    }
  } else {
    auto parent = get_parent(node);
    while (parent != nullptr && parent->left == node) {
      node = parent;
      parent = get_parent(parent);
    }
    node = parent;
  }
  return node;
}
// 寻找结点 node 的后继
BinaryTreeBaseNode* get_next(BinaryTreeBaseNode* node) {
  if (node->right != nullptr) {
    node = node->right;
    while (node->left != nullptr) {
      node = node->left;
    }
  } else {
    auto parent = get_parent(node);
    while (parent != nullptr && parent->right == node) {
      node = parent;
      parent = get_parent(parent);
    }
    node = parent;
  }
  return node;
}


示例:表达式树

下图展示了一棵 表达式树 (expression tree),leaf node 是操作数 (operand),而 internal node 为运算符 (operator)。由于所有操作都是二元的,因此这颗树为二叉树。每个 operator 的 operand 分别是其两个子树的运算结果。

12.png

这个树对应的表达式为 a+b∗c+(d∗e+f)∗g ,如果我们对这颗树进行 postorder traversal 将得到序列 abc∗+de∗f+g∗+ ,这是一个后缀表达式;如果对其进行 preorder traversal,则会得到前缀表达式 ++a∗bc∗+∗defg ;最后试一下 inorder traversal,其结果应该是中缀表达式,不过其序列并没有带括号。


从 postorder traversal 的结果,可以很轻松的构建其这棵树。留给读者进行实现,这里将不再说明。


相关文章
|
4天前
【数据结构】二叉树(遍历,递归)
【数据结构】二叉树(遍历,递归
14 2
|
1天前
|
机器学习/深度学习 存储 算法
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
7 1
|
1天前
【数据结构】二叉树的三种遍历(非递归讲解)
【数据结构】二叉树的三种遍历(非递归讲解)
5 1
|
1天前
|
存储
【数据结构】二叉树相关oj题(一)
【数据结构】二叉树相关oj题(一)
7 1
|
4天前
|
存储 分布式数据库
[数据结构]~二叉树
[数据结构]~二叉树
|
4天前
|
搜索推荐 C语言
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
8 0
|
4天前
|
C语言
【C语言/数据结构】二叉树(层序遍历|判断完全二叉树|性质)
【C语言/数据结构】二叉树(层序遍历|判断完全二叉树|性质)
277 52
|
4天前
【数据结构】二叉树-堆(top-k问题,堆排序,时间复杂度)
【数据结构】二叉树-堆(top-k问题,堆排序,时间复杂度)
15 4
|
4天前
【数据结构】二叉树-堆(函数实现)
【数据结构】二叉树-堆(函数实现)
11 2
|
2月前
|
存储 算法 Java
Java数据结构与算法-java数据结构与算法(二)
Java数据结构与算法-java数据结构与算法
120 1