STL Containers⚓︎

约 2571 个字 101 行代码预计阅读时间 14 分钟

Introduction⚓︎

C++ 的一大重要概念是容器对象(conllection objects)，它是能够存储其他任意数量对象的对象。

容器对象来自 STL（Standard Template Library，标准模板库），它是 ISO 标准下的 C++ 库的一部分，包含了各种数据结构和算法。而 STL 是 std 的一部分。

使用 STL 的原因有：

节省开发时间：有现成的数据结构
代码可读性更强，STL 好比大家都知道的 C++ “黑话”
鲁棒性
可移植的代码
可维护的代码
容易使用

STL 包括以下组成部分：

容器(containers)：存储成组的东西，本质上是模板
迭代器(iterators)：遍历容器的方式
函子(functors)：将函数作为对象表示的方式
算法(algorithms)：转换和修改容器的通用方式。下面是一些常用的算法：
- find(c.begin(), c.end(), val)：查找
- count(c.begin(), c.end(), val)：计数
- sort(c.begin(), c.end())：排序
- reverse(c.begin(), c.end())：翻转
- shuffle(c.begin(), c.end(), seed)：打乱
  - 原来的 random_shuffle() 在 C++17 中被彻底移除

STL 中的顺序容器(sequential containers)：

vector<T>：变长（动态）数组
queue<T>：队列
deque<T>(dual-end queue, /dek/)：双端队列
list<T>：双向链表
forward_list<T>：单向列表（不介绍）
array<T>：定长数组
string：字符串

STL 中的关联容器(associative containers)：根据唯一键组织元素

map<K, V>：映射
set<T>：集合
unordered_map<K, V>：无序映射
unordered_set<T>：无序集合

Vectors⚓︎

vector<type>：变长数组，每个元素的类型为 type。

例子

#include <iostream>
#include <vector>

using namespace std;

int main() {
    // Declare a vector of ints (no need to worry about size)
    vector<int> x;

    // Add elements
    for (int a = 0; a < 1000; a++)
        x.push_back(a);

    // Have a pre-defined iterator for vector class, can use it to print out the items in vector
    vector<int>::iterator p;
    for (p = x.begin(); p < x.end(); p++)
        cout << *p << " ";

    return 0;
}

vector 是一种泛型类(generic class)。这种类需要指定两种类型，其中一个是容器自身的类型（这里是 vector），另一个是容器内元素的类型（上例中就是 int）
vector 的内部空间可按需扩大：当有更多项被放入时，它就会为这些项提供足够的空间
vector 内部项的顺序即为项的插入顺序，因此可按相同的顺序检索
基本的运算：
- 构造函数 (constructors)：
  - vector<Elem> v;：创建空向量
  - vector<Elem> v(n);：向量内包含 n 个 0
  - vector<Elem> v(n, k);：向量内包含 n 个 k
- 获取大小：
  - V.size()：当前容器内项数
  - V.empty()：是否为空，相比 .size() 速度更快
  - V.capacity()：在当前分配的存储空间内最多可以存放的项数
- 元素访问：
  - V.at(index)：该方法会进行边界检查，如果越界，编译器会抛出异常，更加安全
  - V[index]
    - 注意：强烈不推荐用这种方法修改元素！
    - 该方法不会做边界检查，如果越界的话，则行为不可预测，是未定义的行为 (undefined behaviour)，因此速度快，但不安全
    - “零开销原则”(zero-overhead principle)
  - V.front()：第一项
  - V.back()：最后一项
- 添加 / 删除 / 查找：
  - V.push_back(e)：在向量末尾添加元素
  - V.pop_back()：移除末尾元素，但不返回该元素
  - V.insert(pos, e)，其中 pos 是迭代器变量
  - V.clear()：清空向量内所有元素
  - find(first, last, item)，其中 first、last 是迭代器变量，返回的是位于 first 和 last 之间的迭代器，如果没有找到的话则返回 last
- 其他：
  - 支持比较运算符 == != < > <= >=
  - V.swap(v2)：交换

两种使用方法

预分配

vector<int> v(100);   // capacity(not size) = 100
v[80] = 1;            // okay
v[200] = 1;           // bad(can't be out of the boundry)

尾增长

vector<int> v2;
int i;
while (cin >> i)
    v.push_back(i);   // this vector can grow automatically

底层实现

动画演示

向量是一种动态数组。首次插入元素时，vector 会分配一块初始内存（比如容量为 1、2、4 等）。当元素数量超过当前容量时，会分配一块更大的内存空间（一般是原容量的 1.5 到 2 倍）。所有旧数据会被拷贝到新内存中，旧内存被释放。

Lists⚓︎

list<type>：本质上是一个双向链表，每个元素的类型为 type。

forward_list<type> 表示的是一个单向链表。

与向量类似：

构造函数
能使用比较运算符比较列表
能够访问列表的首尾元素：x.front()、x.back()

列表相关的方法：

x.push_back(item)
x.push_front(item)
x.pop_back()
x.pop_front()
x.erase(pos1, pos2)
x.count()
x.reverse(size)
x.resize()

列表元素大小不确定，因此：

使用迭代器对列表遍历时，只能使用 == 或 != 比较运算符
C++ 无法为列表预留空间，所以列表没有 capacity() 方法

选择合适的顺序容器

除非有别的理由，通常使用 vector
- vector 的排序速度很快
如果程序里有很多小的元素，且对空间要求较高的话，不要使用 list 或 forward_list
如果程序要求对元素的随机访问，那么就用 vector 或 deque
- vector 是动态分配的数组，而 deque 是一块块连接起来的 (linked-blocks) 数组，因此后者的访问时间更长
如果程序需要在容器中间插入元素，那么使用 list 或 forward_list
如果程序仅需要再首尾两端插入元素，无需在中间插入元素，那么就用 deque

Maps⚓︎

映射(maps) 是一种关联容器，用于存储由键(keys) 及其映射值构成的元素，以特定顺序排列
键常用于排序或识别唯一的元素，映射值存储对应键的内容

map 的初始化（统一初始化）：

std::map<std::string, int> map {
    { "Chris", 2 },
    { "Keith", 14 },
    { "Nick", 51 },
    { "Sean", 35 },
};

map 的方法：
- 创建空的映射：std::map<K, V> m;
- 将值为 v 的键 k 插入到映射中：m.insert({k, v}) 或 m.insert(p)（p 是 std::pair<const K, V> 类型）
- 更新或设置（如果不存在的话）键为 k 的值为 v：m[k] = v;
- 获取键为 k 的值：
  - auto v = m[k];：如果访问不存在的键就会创建这个键，其值为默认初始化值
  - auto v = m.at(k);：如果访问不存在的键会报错
- 将键 k 从映射中移除：m.erase(k);
- 检查 k 是否存在于映射中：
  - m.count(k)：返回出现次数
  - m.contain(k)：C++20 引入，仅告知是否出现，返回值为 bool 类型
- 检查映射是否为空：m.empty();
- 清空映射内容：m.clear();
std::map<K, V> 的存储的元素为 std::pair<const K, V>

for 循环遍历映射元素：

std::map<std::string, int> map;
for (auto kv : map) {
    // kv is a std::pair<const std::string, int>
    std::string key = kv.first;
    int value = kv.second;
}

// Or use structured binding
for (const auto& [key, value] : map) {
    // key has type const std::string&
    // value has type const int&
}

map 的底层实现为红黑树（一种平衡二叉搜索树），所以 map 内的元素是有序的，上面的遍历会按顺序获取元素
- map 要求键必须支持运算符 <，否则没法进行比较；如果不支持的话，可以通过重载 < 运算符，创建函子或 lambda 函数让该类型支持 <（具体做法可见这里）

Iterators⚓︎

迭代器(iterator) 为遍历 STL 容器提供了一个统一的接口。

最基本的接口（无论何种迭代器都有的）：
- container.begin()：获取指向容器内第一个元素的迭代器（假设容器不是空的）
- container.end()：获取指向容器内最后一个元素之后的迭代器
  - 如果容器是空的，那么 c.begin() == c.end()
- 拷贝构造函数：auto it = c.begin();
- 前移迭代器：++it;
- 解引用迭代器：auto elem = *it;（注意当 it == end() 时，解引用操作是未定义的）
- 相等比较：if (it == c.end())

常用于 for 循环语句：

for (const auto& elem : c) {
    // loop statements
}

// 等价语句为：
for (auto it = c.begin(); it != c.end(); ++it) {
    const auto& elem = *it;
    // loop statements
}

类型名：迭代器的类型名通常很长（容器类型 + ::iterator），所以一般我们用 auto 来表示其类型

例子

// Inside <map> header
template <typename K, typename V>
class std::map {
    using iterator = /* some iterator type */;
};
// Outside <map> header (e.g. main.cpp)
std::map<int, int>::iterator it = m.begin();

++it 和 it++（it 为迭代器）：前者效率更高，因为前者返回的是（递增后）相同对象的引用（就地更新˚），而后者返回的是旧值的拷贝

// Prefix ++it
// Increments it and returns a reference to same object
Iterator& operator++(T);

// Postfix it++
// Increments it and returns a copy of the old value
Iterator operator++();

迭代器类型
- 输入迭代器：读取元素，即 auto elem = *it;
- 输出迭代器：写入元素，即 *it = elem;
- 前向 (forward) 迭代器：可以让迭代器“向前走”（++it;），且支持多次遍历
  - 到此为止，所有的迭代器都属于这一类
- 双向 (bidirectional) 迭代器：可以让迭代器向前或向后走（--it;）
  - std::map、std::set 属于这一类
- 随机访问迭代器：同字面意思
  - std::vector、std::deque 属于这一类
  例子
```
auto it2 = it + 5; // 5 ahead
auto it3 = it2 - 2; // 2 back

// Get 3rd element
auto& second = *(it + 2); 
auto& second = it[2];
```
- 为何要设计这么多的迭代器类型？
  - 目标：为所有容器提供一个统一的抽象
  - 注意：容器的实现方式会影响到迭代容器的方式
    - 比如让顺序容器（vector、deque）的迭代器向前移 5 步（随机访问）比关联容器的（map、set）会容易很多
  - C++ 在设计时会避免为我们提供较慢的方法，这也解释了为什么 map::iterator 不支持随机访问
- 总结：

不难发现，迭代器的接口在指针中也有——我们可以把迭代器看作一类特殊的，仅作用在容器上的指针

template <typename T>
class vector {
    using iterator = T*;
    // In the real STL implementation, the actual type is not T*.
    // But for all intents and purposes, you can think of it this way
    // Implementation details...
};