介绍一下脏读、幻读、不可重复读？

约 2833 字大约 9 分钟

MySQL 美团

2025-04-22

⭐ 题目日期：

美团 - 2025/04/12

📝 题解：

1. 概念解释

首先，我们需要清晰地理解这三个概念分别是什么意思。它们都描述了在并发环境下，多个事务交错执行时可能出现的数据不一致问题。

脏读 (Dirty Read):
- 定义: 一个事务（比如事务 A）读取到了另一个事务（事务 B）修改但尚未提交的数据。如果事务 B 随后进行了回滚（Rollback），那么事务 A 读取到的数据就是“脏”的、无效的。
- 类比: 想象一下你在编辑一篇共享文档，还没点保存（提交），你的同事就看到了你正在编辑的内容，并基于这个内容做了决策。结果你发现写错了，撤销了所有修改（回滚），那么你同事之前看到的和基于它做的决策就都作废了，这就是脏读。
不可重复读 (Non-Repeatable Read):
- 定义: 一个事务（事务 A）内，多次读取同一行数据，但结果却不一样。这是因为在事务 A 读取期间，有另一个事务（事务 C）修改或删除了这行数据，并且已提交。重点在于针对同一行数据的操作。
- 类比: 你去银行 ATM 机查你的账户余额，第一次看是 1000 元。在你还没完成其他操作时，你的家人通过网银给你转账 500 元并成功了（事务提交）。你再次查询余额，发现变成了 1500 元。在你的这次查询会话（事务）中，前后两次读取同一账户余额，结果不同，这就是不可重复读。
幻读 (Phantom Read):
- 定义: 一个事务（事务 A）内，按照某个范围条件多次查询，结果发现返回的记录数量不一致。这是因为在事务 A 查询期间，有另一个事务（事务 D）插入或删除了符合该范围条件的数据，并且已提交。重点在于针对一批符合查询条件的数据行（新增或减少）。
- 类比: 你在图书馆系统里查询所有“计算机科学”类别的书籍，第一次查询有 100 本。在你整理这份列表时，图书管理员新增了几本计算机科学的书籍并上架（事务提交）。你为了确认，再次用同样的条件查询，发现变成了 103 本。这些“多出来的”或“消失的”记录就像幻影一样，这就是幻读。

2. 解题思路 (问题分析与图解)

面试官问这个问题，是想考察你对数据库并发控制和事务隔离性的理解。你需要清晰地阐述每个概念的定义、发生条件以及它们之间的区别。使用时序图能非常直观地展示问题发生的过程。

a. 脏读 (Dirty Read) 的发生过程:

b. 不可重复读 (Non-Repeatable Read) 的发生过程:

c. 幻读 (Phantom Read) 的发生过程:

3. 知识扩展 (关联知识点)

理解这三个现象后，自然会引出解决这些问题的机制——事务隔离级别 (Transaction Isolation Levels)。这是面试官通常会追问的。

四个标准隔离级别:
1. 读未提交 (Read Uncommitted): 最低级别，允许脏读、不可重复读、幻读。基本不用。
2. 读已提交 (Read Committed): 解决了脏读。但仍可能发生不可重复读、幻读。这是大多数数据库（如 Oracle, PostgreSQL, SQL Server）的默认级别。
3. 可重复读 (Repeatable Read): 解决了脏读、不可重复读。但仍可能发生幻读。这是 MySQL InnoDB 引擎的默认级别。
  - 特别注意: MySQL InnoDB 在可重复读级别下，通过 MVCC (Multi-Version Concurrency Control) 和 Next-Key Locking (Gap Locks + Record Locks) 机制，在很大程度上避免了幻读。这是 MySQL 的一个特点，面试时提及会加分。
4. 串行化 (Serializable): 最高级别，完全避免脏读、不可重复读、幻读。通过强制事务串行执行（通常使用锁）来实现，并发性能最差。
MVCC (Multi-Version Concurrency Control):
- 是实现“读已提交”和“可重复读”隔离级别的常用技术。它通过为数据行维护多个版本来实现并发控制，读操作通常读取数据行的某个快照版本，而写操作则创建新版本，从而减少读写冲突，提高并发性能。“读-写”不阻塞，“写-读”不阻塞（但可能读到旧版本）。
锁机制:
- 共享锁 (Shared Lock / S Lock): 读锁，多个事务可以同时持有共享锁读取同一资源，但不能修改。
- 排他锁 (Exclusive Lock / X Lock): 写锁，只有一个事务能持有排他锁，持有期间其他事务不能读也不能写。
- 意向锁 (Intention Lock): 表级锁，用于指示后续将在表内行上加锁（IS, IX），提高加表锁时的判断效率。
- 记录锁 (Record Lock): 锁住索引记录。
- 间隙锁 (Gap Lock): 锁住索引记录之间的间隙，防止其他事务在此间隙插入数据，用于防止幻读。
- 临键锁 (Next-Key Lock): 记录锁 + 间隙锁的组合，锁住记录本身及其前面的间隙。MySQL InnoDB 在 Repeatable Read 级别下常用。

下表总结了隔离级别与并发问题的关系：

隔离级别	脏读 (Dirty Read)	不可重复读 (Non-Repeatable Read)	幻读 (Phantom Read)
读未提交	可能	可能	可能
读已提交	不可能	可能	可能
可重复读	不可能	不可能	可能 (理论上) / MySQL InnoDB 基本避免
串行化	不可能	不可能	不可能

4. 实际应用 (案例分析)

场景1: 电商库存扣减
- 问题: 如果隔离级别过低（如 Read Committed），在高并发下可能出现：事务 A 查询库存 > 0，事务 B 也查询库存 > 0，然后 A 扣减库存提交，B 也扣减库存提交，导致超卖（数据最终不一致）。虽然这不是典型的不可重复读或幻读，但体现了并发控制的重要性。
- 解决方案:
  - 使用更高的隔离级别（如 Repeatable Read 或 Serializable），但可能影响性能。
  - 使用乐观锁（带版本号更新 UPDATE ... SET stock = stock - 1, version = version + 1 WHERE id = ? AND version = ?）。
  - 使用悲观锁（SELECT ... FOR UPDATE），在查询时就锁定库存记录。
  - 利用数据库的原子操作（如 UPDATE products SET stock = stock - 1 WHERE id = ? AND stock > 0），依赖数据库保证单条语句的原子性。
场景2: 财务报表生成
- 问题: 生成报表需要汇总大量数据，如果报表生成事务（Tx A）运行时，其他业务事务（Tx B）仍在不断修改数据并提交，那么报表可能包含部分旧数据和部分新数据，出现不一致的状态。如果 Tx A 多次查询同一范围的数据（如本月销售额），每次结果都可能因为 Tx B 的提交而变化（幻读）。
- 解决方案:
  - 在生成报表时，将事务隔离级别设置为 Repeatable Read 或 Serializable，确保读取的数据快照是一致的。
  - 如果性能要求高，可以考虑从只读副本（Read Replica）或数据仓库（Data Warehouse）生成报表，减少对主库的压力和锁竞争。
场景3: 用户积分更新与查询
- 问题: 用户完成任务增加积分（Tx B），同时用户查询自己的积分（Tx A）。如果 Tx B 尚未提交，Tx A 在 Read Uncommitted 下会看到临时增加的积分（脏读）。如果 Tx B 在 Tx A 两次查询之间提交，Tx A 在 Read Committed 下会看到积分变化（不可重复读）。
- 解决方案: 大多数应用选择 Read Committed 级别。虽然可能发生不可重复读，但通常业务上可以接受（用户看到最新提交的数据）。脏读是绝对要避免的。Repeatable Read 可以提供更强的一致性，但要注意 MySQL 下 Gap Lock 可能带来的额外锁开销。

5. 常见陷阱 (面试误区与考察点)

混淆不可重复读与幻读: 这是最常见的错误。
- 关键区别: 不可重复读侧重于同一行数据被修改或删除；幻读侧重于符合某个范围条件的记录行数发生变化（通常是插入导致）。你可以记：不可重复读是“值”变了或“行”没了，幻读是“行”多了或少了。
不了解数据库默认隔离级别: 面试官可能会问你常用的数据库（如 MySQL, Oracle）默认是什么隔离级别，以及为什么这样设置。这考察你的实践经验。
只知理论，不知实践: 能背诵概念，但无法结合场景分析问题，或者不知道如何在项目中选择合适的隔离级别。
对 MVCC 理解不清: 不知道它是如何帮助实现 Read Committed 和 Repeatable Read，以及它如何减少锁竞争。
忽视性能影响: 一味追求最高隔离级别（Serializable），而没有考虑到它对并发性能的巨大影响。要懂得权衡（Trade-off）。
对 MySQL InnoDB 的特殊性不了解: 不知道 InnoDB 在 Repeatable Read 级别下通过 Next-Key Lock 基本解决了幻读问题。这是 MySQL 面试中的一个加分项。

HTTP和HTTPS 协议

TCP 机制与优化

网络安全与加密

计算机网络基础

Java 数据类型与集合框架

反射机制

Lambda 与 Stream API

HashMap 及其变种

基础原理

Redis 分布式与集群

MySQL锁的分类与实现

MySQL数据存储

事务与隔离级别基础

事务并发问题

索引原理

索引场景题

索引基础

索引优化

MVCC相关

设计原则