还有哪些结构插入和查询复杂度是 O (logn) 的？

约 1036 字大约 3 分钟

2025-03-20

⭐ 题目日期：

字节 - 2024/12/25

📝 题解：

在计算机科学中，多个数据结构在插入和查询操作的时间复杂度上均为 O(log n)，这些结构通常基于树形结构或分层索引的设计，适用于需要高效动态维护有序数据的场景。以下是常见的一些示例及其特点：

1. 平衡二叉搜索树（Balanced BST）

代表结构：
- AVL 树：通过旋转操作严格保持平衡（左右子树高度差 ≤ 1）。
- 红黑树：通过颜色标记和旋转实现近似平衡（黑节点高度平衡）。
时间复杂度：
- 插入、删除、查询：O(log n)（最坏情况）。
应用场景：
- Java 的 TreeMap、C++ 的 std::map（红黑树实现）。
- 数据库索引（部分内存型数据库）。
特点：
- 支持有序遍历（中序遍历）。
- 红黑树相比 AVL 树插入/删除更快（旋转次数更少），但查询稍慢。

2. 跳跃表（Skip List）

原理：通过多层链表构建概率性平衡的索引，模拟树形结构的分层查找。
时间复杂度：
- 插入、删除、查询：O(log n)（平均情况）。
应用场景：
- Redis 的 zset（有序集合）底层实现。
- 内存数据库中的有序数据结构。
特点：
- 实现简单，无复杂旋转操作。
- 支持范围查询（如 ZRANGE）。

3. B 树（B-Tree）及其变种

代表结构：
- B 树：多路平衡搜索树，节点包含多个键和子节点指针。
- B+ 树：叶子节点形成有序链表，非叶子节点仅存索引。
时间复杂度：
- 插入、删除、查询：O(log n)（实际复杂度为 O(log_k n)，k 为节点分支因子）。
应用场景：
- 数据库索引（如 MySQL 的 InnoDB 引擎使用 B+ 树）。
- 文件系统（如 NTFS、ReiserFS）。
特点：
- 适合磁盘存储（减少 I/O 次数，节点大小与磁盘页对齐）。
- B+ 树范围查询效率更高（叶子节点链表直接遍历）。

4. Treap（树堆）

原理：结合二叉搜索树（BST）和堆（Heap）的特性，每个节点包含一个优先级（随机生成），通过优先级维护平衡。
时间复杂度：
- 插入、删除、查询：O(log n)（期望复杂度）。
特点：
- 实现简单，无需复杂平衡操作。
- 依赖随机化优先级保证平衡性。

5. 伸展树（Splay Tree）

原理：通过“伸展”操作（将最近访问的节点移动到根），利用局部性原理加速后续操作。
时间复杂度：
- 插入、删除、查询：O(log n)（摊还时间复杂度）。
特点：
- 无需显式平衡操作。
- 适合频繁访问局部热点数据的场景。

6. 分块有序结构（如块状链表）

原理：将数据分为多个块，块内有序，块间通过索引维护。
时间复杂度：
- 插入、查询：O(√n) 或 O(log n)（取决于分块策略）。
应用场景：
- 文本编辑器中的行缓存（如 VS Code）。
- 部分内存受限场景的折中方案。

对比与选型建议

结构	核心优势	适用场景
平衡 BST	严格有序，支持范围遍历	内存中的有序数据维护（如 `TreeMap`）
跳跃表	实现简单，无锁友好	高并发场景（如 Redis）
B/B+ 树	适合磁盘存储，减少 I/O	数据库索引、文件系统
Treap	随机化平衡，实现简单	需要简单动态有序结构的场景
伸展树	利用访问局部性优化性能	缓存热点数据

总结

O(log n) 的插入/查询结构 通常用于需要动态维护有序数据且对性能要求较高的场景。
选择依据：
- 内存 vs 磁盘：内存优先选跳跃表、平衡 BST；磁盘选 B+ 树。
- 并发需求：无锁结构（如跳跃表）适合高并发。
- 实现复杂度：跳跃表、Treap 实现简单；红黑树、B 树较复杂。
- 访问模式：热点数据用伸展树，范围查询用 B+ 树或跳跃表。