C++: set与map容器的介绍与使用
酷酷学!!! 2024-09-11 11:05:01 阅读 94
本文索引
前言1. 二叉搜索树1.1 概念1.2 二叉搜索树操作1.2.1 查找与插入1.2.2 删除1.2.3 二叉搜索树实现代码
2. 树形结构的关联式容器2.1 set的介绍与使用2.1.1 set的构造函数2.1.2 set的迭代器2.1.3 set的容量2.1.4 set的修改操作
2.2 map的介绍与使用2.2.1 map的构造函数2.2.2 map的迭代器2.2.3 map的容量与元素访问2.2.4 map中元素的修改
2.3 multiset的介绍2.4 multimap的介绍
前言
二叉树我们在c语言数据结构阶段已经学习过, 这里map和set的特性需要先铺垫二叉搜索树, 而二叉搜索树也是一种树形解构, 二叉搜索树的特性了解, 有助于更好的理解map和set的特性, 本文将借助二叉搜索树, 对二叉树部分进行收尾与总结.
博客主页: 酷酷学!!!
点关注不迷路!
正文开始
1. 二叉搜索树
1.1 概念
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
若它的左子树不为空,则左子树上所有节点的值都小于根节点的值若它的右子树不为空,则右子树上所有节点的值都大于根节点的值它的左右子树也分别为二叉搜索树
1.2 二叉搜索树操作
首先我们需要先定义节点的结构, 并实现它的构造函数.
<code>template<class K>
struct BSTNode
{ -- -->
K _key;
BSTNode<K>* _left;
BSTNode<K>* _right;
BSTNode(const K& key)
:_key(key)
, _left(nullptr)
, _right(nullptr)
{ }
};
1.2.1 查找与插入
查找
对于这样一棵二叉搜索树, 我们要对其节点的值进行查找.
从根开始比较, 如果比跟大则往右边找, 如果比根小则往左边查找.最多查找高度次, 走到空时, 还没找到则这个值不存在
编写代码:
<code>bool Find(const K& key)
{ -- -->
Node* cur = _root;
while (cur)
{
if (key < cur->_key)
{
cur = cur->_left;
}
else if (key > cur->_key)
{
cur = cur->_right;
}
else
{
return true;
}
}
return false;
}
插入
如果树为空, 则直接新增节点, 赋值给root指针.如果树不为空, 则按照二叉搜索树的性质进行查找插入位置, 如果找到为空节点则插入新节点.
一般情况, 如果有相同的值, 我们是不进行插入的, 也就是二叉搜索树具有去重的性质.
编写代码:
<code>bool Insert(const K& key)
{ -- -->
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(key);
if (parent->_key < key)
parent->_right = cur;
else
parent->_left = cur;
return true;
}
1.2.2 删除
对于删除操作, 那么我们首先就需要查找此元素在不在二叉搜索树中, 如果不存在则返回, 否则的话我们就进行该节点的删除, 要删除的节点可以分为以下三种情况
要删除的节点没有孩子, 比如这里的1和7, 我们直接删除即可.
要删除的节点有一个孩子, 一个左孩子或者一个右孩子.删除6时只有一个右孩子, 我们可以让父节点直接指向6的右孩子就可以了; 删除14, 我们也可以直接让父节点直接指向14的左孩子就可以了. 但是我们需要记录到父节点, 再判断删除的是父节点的左孩子还是右孩子.
这里其实第一种情况和第二种情况可以归为一种情况, 对于第一种情况, 父节点指向了空.
删除的节点有两个孩子. 比如要删除的节点为3和8,这个时候我们需要找一个节点来替代, 那么满足替代的节点要么为左子树最大或者右子树最小, 我们这里选择右子树最小的节点进行替代删除, 先交换值, 然后删除替代删除的节点. 删除8,替代节点为13, 删除3替代节点为4
如果没有找到替代节点, 也就是左子树的根节点为右子树最小节点, 这种情况我们需要另外分析
<code>bool Erase(const K& key)
{ -- -->
Node* parent = nullptr;
Node* cur = _root;
//寻找值为key的节点
while (cur)
{
if (key > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else if (key < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else
{
//如果cur没有孩子或者只有一个孩子
//假设只有一个右孩子,无孩子同样适用
if (cur->_left == nullptr)
{
if (parent == nullptr)
{
_root = cur->_right;
}
else
{
if (parent->_left == cur)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
return true;
}
//反之假设只有一个左孩子,无孩子同样适用
else if (cur->_right == nullptr)
{
if (parent == nullptr)
{
_root = cur->_left;
}
else
{
if (parent->_left == cur)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
return true;
}
//2个孩子的情况
//这里使用cur的右子树的最小节点作为替代节点
else
{
//这里父节点不能设为nullptr,可能右子树无左孩子
Node* RMinParent = cur;
Node* RMin = cur->_right;
while (RMin->_left)
{
RMinParent = RMin;
RMin = RMin->_left;
}
//换值替代
cur->_key = RMin->_key;
//重复一个节点或者无节点的方法
//此时RMin无左孩子
if (RMinParent->_left == RMin)
RMinParent->_left = RMin->_right;
else
//cur此时为右子树最小节点为cur->right
RMinParent->_right = RMin->_right;
delete RMin;
return true;
}
}
}
return false;
}
1.2.3 二叉搜索树实现代码
对于只有key的实现
#pragma once
#include<iostream>
using namespace std;
template<class K>
struct BSTNode
{
K _key;
BSTNode<K>* _left;
BSTNode<K>* _right;
BSTNode(const K& key)
:_key(key)
, _left(nullptr)
, _right(nullptr)
{ }
};
template<class K>
class BSTree
{
typedef BSTNode<K> Node;
public:
bool insert(const K& key)
{
//情况一:树为空
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
//情况二:只能插入到叶子节点
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (key > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else if (key < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(key);
if (key > parent->_key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
bool Find(const K* key)
{
Node* cur = _root;
while (cur)
{
if (key > cur->_key)
{
cur = cur->_right;
}
else if (key < cur->_key)
{
cur = cur->_left;
}
else
{
return true;
}
}
return false;
}
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
//寻找值为key的节点
while (cur)
{
if (key > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else if (key < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else
{
//如果cur没有孩子或者只有一个孩子
//假设只有一个右孩子,无孩子同样适用
if (cur->_left == nullptr)
{
if (parent == nullptr)
{
_root = cur->_right;
}
else
{
if (parent->_left == cur)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
return true;
}
//反之假设只有一个左孩子,无孩子同样适用
else if (cur->_right == nullptr)
{
if (parent == nullptr)
{
_root = cur->_left;
}
else
{
if (parent->_left == cur)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
return true;
}
//2个孩子的情况
//这里使用cur的右子树的最小节点作为替代节点
else
{
//这里父节点不能设为nullptr,可能右子树无左孩子
Node* RMinParent = cur;
Node* RMin = cur->_right;
while (RMin->_left)
{
RMinParent = RMin;
RMin = RMin->_left;
}
//换值替代
cur->_key = RMin->_key;
//重复一个节点或者无节点的方法
//此时RMin无左孩子
if (RMinParent->_left == RMin)
RMinParent->_left = RMin->_right;
else
//cur此时为右子树最小节点为cur->right
RMinParent->_right = RMin->_right;
delete RMin;
return true;
}
}
}
return false;
}
//进行一层的封装,_root为私有成员
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_key << " ";
_InOrder(root->_right);
}
Node* _root = nullptr;
};
具有key, value的二叉搜索树实现
namespace KeyValue
{
template<class K,class V>
struct BSTNode
{
K _key;
V _value;
BSTNode<K,V>* _left;
BSTNode<K,V>* _right;
BSTNode(const K& key,const V& value)
:_key(key)
,_value(value)
, _left(nullptr)
, _right(nullptr)
{ }
};
template<class K,class V>
class BSTree
{
typedef BSTNode<K,V> Node;
public:
BSTree() = default;
BSTree(const BSTree<K, V>& t)
{
_root = Copy(t._root);
}
~BSTree()
{
Destory(_root);
_root = nullptr;
}
bool Insert(const K& key,const V& value)
{
if (_root == nullptr)
{
_root = new Node(key,value);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(key,value);
if (parent->_key < key)
parent->_right = cur;
else
parent->_left = cur;
return true;
}
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
if (cur->_left == nullptr)
{
if (parent == nullptr)
{
_root = cur->_right;
}
if (parent->_left == cur)
parent->_left = cur->_right;
else parent->_right = cur->_right;
delete cur;
return true;
}
else if (cur->_right == nullptr)
{
if (parent == nullptr)
{
_root = cur->_left;
}
if (parent->left == cur)
parent->_left = cur->_left;
else parent->_right = cur->_left;
delete cur;
return true;
}
else
{
//找右子树最左节点替代
Node* MinLParent = cur;
Node* Min = cur->_right;
while (Min->_left)
{
MinLParent = Min;
Min = Min->_left;
}
cur->_key = Min->_key;
if (MinLParent->_left == Min)
MinLParent->_left = Min->_right;
else
MinLParent->_right = Min->_right;
delete Min;
return true;
}
}
}
return false;
}
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (key < cur->_key)
{
cur = cur->_left;
}
else if (key > cur->_key)
{
cur = cur->_right;
}
else
{
return cur;
}
}
return cur;
}
void InOrder()
{
_InOrder(_root);
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << ":"<<root->_value<<endl;
_InOrder(root->_right);
}
Node* Copy(Node* root)
{
if (root == nullptr)
return nullptr;
Node* newRoot = new Node(root->_key, root->_value);
newRoot->_left = Copy(root->_left);
newRoot->_right = Copy(root->_right);
return newRoot;
}
void Destory(Node* root)
{
if (root == nullptr)
return;
Destory(root->_left);
Destory(root->_right);
delete root;
}
Node* _root = nullptr;
};
}
2. 树形结构的关联式容器
关联式容器
在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。
键值对
**用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。**比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
SGI-STL中关于键值对的定义:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair(): first(T1()), second(T2())
{ }
pair(const T1& a, const T2& b): first(a), second(b)
{ }
};
根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。
2.1 set的介绍与使用
T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
Compare:set中元素默认按照小于来比较
Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理
set是按照一定次序存储元素的容器在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。set在底层是用二叉搜索树(红黑树)实现的。
注意:
与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
set中插入元素时,只需要插入value即可,不需要构造键值对。
set中的元素不可以重复(因此可以使用set进行去重)。
使用set的迭代器遍历set中的元素,可以得到有序序列
set中的元素默认按照小于来比较
set中查找某个元素,时间复杂度为:
l
o
g
2
n
log_2 n
log2n
set中的元素不允许修改(为什么?)
set中的底层使用二叉搜索树(红黑树)来实现。
2.1.1 set的构造函数
2.1.2 set的迭代器
2.1.3 set的容量
2.1.4 set的修改操作
使用举例:
<code>#include<set>
int main()
{ -- -->
//set<int> st;
//pair<set<int>::iterator, int> p = st.insert(1);
//cout << p.second << endl;
set<int> s;
s.insert(5);
s.insert(2);
s.insert(7);
s.insert(4);
s.insert(9);
s.insert(9);
s.insert(9);
s.insert(1);
s.insert(5);
s.insert(9);
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
++it;
}
cout << endl;
s.erase(s.begin());//删除最小值
int x;
cin >> x;
int num = s.erase(x);//返回删除元素个数
if (num == 0)
{
cout << x << "不存在" << endl;
}
auto pos = s.find(x);
if (pos != s.end())
{
s.erase(pos);
}
else
{
cout << x << "不存在" << endl;
}
for (auto e : s)
{
cout << e << " ";
}
cout << endl;
auto pos1 = find(s.begin(), s.end(), x); // O(N)
auto pos2 = s.find(x); // O(logN)
cin >> x;
if (s.count(x)) // O(log(N))
{
cout << x << "在!" << endl;
}
else
{
cout << x << "不存在!" << endl;
}
return 0;
}
int main()
{
std::set<int> myset;
std::set<int>::iterator itlow, itup;
for (int i = 1; i < 10; i++) myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90
itlow = myset.lower_bound(30);//返回一个小于或者等于30的值位置
itup = myset.upper_bound(60);//指向一个大于60的值位置
//[30,60)
myset.erase(itlow, itup);
for (std::set<int>::iterator it = myset.begin(); it != myset.end(); ++it)
std::cout << ' ' << *it;
std::cout << '\n';
return 0;
}
2.2 map的介绍与使用
key: 键值对中key的类型
T: 键值对中value的类型
Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器
注意:在使用map时,需要包含头文件。
2.2.1 map的构造函数
2.2.2 map的迭代器
2.2.3 map的容量与元素访问
问题:当key不在map中时,通过operator获取对应value时会发生什么问题?
注意:在元素访问时,有一个与operator[]类似的操作at()(该函数不常用)函数,都是通过key找到与key对应的value然后返回其引用,不同的是:当key不存在时,operator[]用默认value与key构造键值对然后插入,返回该默认value,at()函数直接抛异常。
2.2.4 map中元素的修改
使用举例
<code>#include<map>
int main()
{ -- -->
map<string, string> dict;
pair<string, string> kv1("left", "左边");
dict.insert(kv1);//方式1
dict.insert(pair<string, string>("left", "左边"));//方式2匿名函数
dict.insert(make_pair("insert", "插入"));//方式3
pair<string, string> kv2 = { "string","字符串" };
//多参数的隐式类型转换使用{}
dict.insert({ "string","字符串" });//方式4
//map<string, string> dict = { {"left","左边"},{"right","右边"},{"insert","插入"} };
//列表构造
map<string, string>::iterator it = dict.begin();
while (it != dict.end())
{
cout << (*it).first << (*it).second << endl;
cout << it->first << it->second << endl;
++it;
}
for (const auto& e : dict)
{
cout << e.first << ":" << e.second << endl;
}
cout << endl;
return 0;
}
2.3 multiset的介绍
multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value,value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。multiset底层结构为二叉搜索树(红黑树)。
注意:
6. multiset中在底层中存储的是<value, value>的键值对
7. multiset的插入接口中只需要插入即可
8. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
9. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
10. multiset中的元素不能修改
11. 在multiset中找某个元素,时间复杂度为
O
(
l
o
g
2
N
)
O(log_2 N)
O(log2N)
12. multiset的作用:可以对元素进行排序
#include <set>
void TestSet()
{
int array[] = { 2, 1, 3, 9, 6, 0, 5, 8, 4, 7 };
// 注意:multiset在底层实际存储的是<int, int>的键值对
multiset<int> s(array, array + sizeof(array)/sizeof(array[0]));
for (auto& e : s)
cout << e << " ";
cout << endl;
return 0;
}
2.4 multimap的介绍
Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key, value>,其中多个键值对之间的key是可以重复的。在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。multimap在底层用二叉搜索树(红黑树)来实现。
注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。
multimap中的接口可以参考map,功能都是类似的。
注意:
multimap中的key是可以重复的。multimap中的元素默认将key按照小于来比较multimap中没有重载operator[]操作(同学们可思考下为什么?)。使用时与map包含的头文件相同:
完
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。