二叉搜索树
1. 二叉搜索树
1.1 二叉搜索树概念
二叉搜索树又称为二叉排序树,它还有可能是一棵空树,或者是具有以下性质的二叉树:
- 若它的左子树不为空,则左子树的所有节点的值都小于根节点的值
- 若它的右子树不为空,则右子树的所有节点的值都大于根节点的值
- 它的左右子树也分别为二叉搜索树
1.2 二叉搜索树操作
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
- 二叉搜索树的查找
- 从根开始比较,查找,比根大则往右边查找,比根小则往左边查找
- 最多查找高度次,如果走到空还没有找到,则证明没有这个值
- 二叉搜索树的插入
- 树为空,则直接新增节点,赋值给
root
指针 - 树不空,按二叉搜索树性质查找插入位置,插入新节点
- 二叉搜索树的删除首先要查找要删除的元素是否在二叉搜索树当中,如果不存在则返回。否则要删除的节点可能分为以下四种情况:
1.要删除的节点无孩子节点
2.要删除的节点只有左孩子
3.要删除的节点只有右孩子
4.要删除的节点有左、右孩子
看起来有四种情况,实际上1种情况可以和2和3种情况合并起来,因此真正的删除过程是下面这种:
·情况b:删除该节点且使被删除节点的双亲节点指向被删除节点的左孩子节点–直接删除
·情况c:删除该节点且使被删除节点的双亲节点指向被删除节点的右孩子节点–直接删除
·情况d:在它右子树当中寻找中序下的第一个节点(关键码最小),用它的值填补到被删除的节点当中,再来处理这个节点的删除问题–替换法删除(这里代替的节点可以是左子树的最大节点或者右子树的最小节点)
这里删除7,14比较简单,我们来模拟实现一下删除3和8
下图是删除3的情况,8也一样
1.3 二叉搜索树的实现
- 构造二叉搜索树的每个节点
template<class T> struct BSTNode { public: BSTNode(const T& key = T()) : _left(nullptr), _right(nullptr), _key(key) {} BSTNode<T>* _left; BSTNode<T>* _right; T _key; };
- 二叉搜索树的插入
bool insert(cosnt T& key) { if (_root == nullptr) { _root = new Node(key); return true; } else { Node* parent = nullptr; Node* cur = _root; while (cur) { if (key > cur->_key) { parent = cur; cur = cur->_right; } else if (key < cur->_key) { parent = cur; cur = cur->_left; } else { return false; } } cur = new Node(key); if (parent->_key > key) { parent->_left = cur; } else { parent->_right = cur; } return true; } return true; }
- 二叉搜索树的删除
bool erase(coant T& key) { Node* parent = nullptr; Node* cur = _root; while (cur) { if (key > cur->_key) { parent = cur; cur = cur->_right; } else if (key < cur->_key) { parent = cur; cur = cur->_left; } else { if (cur->_left == nullptr) { if (cur == _root) { _root = cur->_right; } else { if (parent->_left == cur) { parent->_left = cur->_right; } else { parent->_right = cur->_right; } } delete cur; } else if (cur->_right == nullptr) { if (cur == _root) { _root = cur->_left; } else { if (parent->_left == cur) { parent->_left = cur->_left; } else { parent->_right = cur->_left; } } delete cur; } else { Node* pMinRight = cur;// 右树最小节点的父亲 Node* minRight = cur->_right;// 右树最小节点 while (minRight->_left) { pMinRight = minRight; minRight = minRight->_left; } cur->_key = minRight->_key; if (pMinRight->_left == minRight) { pMinRight->_left = minRight->_right; } else { pMinRight->_right = minRight->_right; } delete cur; } } } return true; }
1.4 二叉搜索树的应用
- K模型:K模型即只有K作为关键字,结构中只需要存储K即可,关键码即为需要搜索到的值
比如:给一个单词string
,判断这个单词是否拼写正确,具体方法如下:
- 以词库当中所有单词集合中的每个单词作为key, 构建一个搜索二叉树
- 在二叉搜索树当中检索这个单词是否存在,如果不存在则拼写错误
- KV模型:每一个关键字Key都有一个对应的值Value,即
<Key, Value>
的键值对,这种方法在日常生活当中常见:
- 比如英语单词,就是英文与中文的对应关系,通过英文可以快速找到对应的中文
- 还有统计单词出现的次数,统计成功后,给定单词就可快速找到其出现的次数,单词与出现的次数就是一个键值对
一下是将二叉搜索树改为KV的简单代码:
// 改造二叉搜索树为KV结构 template<class K, class V> struct BSTNode { BSTNode(const K& key = K(), const V& value = V()) : _pLeft(nullptr), _pRight(nullptr), _key(key), _Value(value) {} BSTNode<T>* _pLeft; BSTNode<T>* _pRight; K _key; V _value }; template<class K, class V> class BSTree { typedef BSTNode<K, V> Node; typedef Node* PNode; public: BSTree() : _pRoot(nullptr) {} PNode Find(const K& key); bool Insert(const K& key, const V& value) bool Erase(const K& key) private: PNode _pRoot; }; void TestBSTree3() { // 输入单词,查找单词对应的中文翻译 BSTree<string, string> dict; dict.Insert("string", "字符串"); dict.Insert("tree", "树"); dict.Insert("left", "左边、剩余"); dict.Insert("right", "右边"); dict.Insert("sort", "排序"); // 插入词库中所有单词 string str; while (cin >> str) { BSTreeNode<string, string>* ret = dict.Find(str); if (ret == nullptr) { cout << "单词拼写错误,词库中没有这个单词:" << str << endl; } else { cout << str << "中文翻译:" << ret->_value << endl; } } } void TestBSTree4() { // 统计水果出现的次数 string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" }; BSTree<string, int> countTree; for (const auto& str : arr) { // 先查找水果在不在搜索树中 // 1、不在,说明水果第一次出现,则插入<水果, 1> // 2、在,则查找到的节点中水果对应的次数++ //BSTreeNode<string, int>* ret = countTree.Find(str); auto ret = countTree.Find(str); if (ret == NULL) { countTree.Insert(str, 1); } else { ret->_value++; } } countTree.InOrder(); }
1.5 二叉搜索树的性能分析
插入和删除操作都必须先查找,所以查找的效率代表了二叉搜索树中各个操作的效率
对有n个节点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是节点在二叉搜索树的深度的函数,即节点越深,查找的次数越多
但是对于同一个关键码集合,如果关键码插入的顺序不同,可能得到不同结构的二叉搜索树
最优情况下:二叉搜索树为完全二叉树(或者接近完全二叉树)
最坏情况下:二叉搜索树退化为单支
如果成为单支的二叉搜索树,二叉搜索树的性能是不是就失去了。我们需要进行改进。后面的AVL和红黑树就是为了解决无论我们按照什么插入顺序都可以达到最优的性能。