MySQL

发布日期: 2024-07-26

作者: 小乐

文章字数: 2.1k

阅读时长: 8 分

阅读次数:

MySQL存储引擎InnoDB详解

MySQL 是业务系统中最常见的数据库，但用好它并不容易。索引设计、SQL 优化、事务处理都是日常开发中需要关注的点。本文从实际场景出发，讲常见问题和解决思路。

一、InnoDB架构概览

1.1 内存结构

┌─────────────────────────────────────────────────┐
│                  Buffer Pool                     │
│  ┌─────────────┐  ┌─────────────┐              │
│  │ Data Pages  │  │ Index Pages │              │
│  └─────────────┘  └─────────────┘              │
│  ┌─────────────┐  ┌─────────────┐              │
│  │ Insert Buf  │  │ Adaptive Hash│              │
│  │ (Change Buf)│  │   Index      │              │
│  └─────────────┘  └─────────────┘              │
│  ┌─────────────┐  ┌─────────────┐              │
│  │  Lock Info  │  │ Data Dict    │              │
│  └─────────────┘  └─────────────┘              │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│               Redo Log Buffer                    │
└─────────────────────────────────────────────────┘

1.2 磁盘结构

┌─────────────────────────────────────────────────┐
│               System Tablespace                  │
│  (ibdata1: 数据字典、Undo Log、双写缓冲)          │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│             File-Per-Table Tablespace            │
│  (user.ibd: 表数据、索引)                         │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│               Redo Log Files                     │
│  (ib_logfile0, ib_logfile1)                      │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│               Undo Tablespace                    │
│  (undo_001, undo_002, MySQL 8.0+)               │
└─────────────────────────────────────────────────┘

二、Buffer Pool

2.1 什么是Buffer Pool

InnoDB在内存中缓存数据页和索引页的区域。所有数据操作先修改Buffer Pool中的页，再异步刷盘。

[mysqld]
# Buffer Pool大小（建议物理内存的50%-75%）
innodb_buffer_pool_size = 4G

# Buffer Pool实例数（每个实例至少1GB）
innodb_buffer_pool_instances = 4

2.2 页管理

页类型：

数据页（Data Page）
索引页（Index Page）
Undo页
Insert Buffer页
系统页

页状态：

Free List → LRU List → Flush List
  空闲页    使用中的页    待刷盘页

2.3 LRU算法

InnoDB使用改进的LRU（Least Recently Used）算法：

LRU List（默认划分为5/8和3/8）：

新生代（young sublist，5/8）     老生代（old sublist，3/8）
┌─────────────────────┐  ┌─────────────────────┐
│ 热数据              │  │ 冷数据              │
│ 经常访问            │  │ 首次访问            │
│ mid point           │  │                     │
└─────────────────────┘  └─────────────────────┘

midpoint insertion strategy：

新页不放到LRU头部，而是放到midpoint（默认距尾部37%处）
避免大扫描（如全表扫描）冲掉热数据
页在old区停留超过innodb_old_blocks_time（默认1秒）后被访问，才移到young区

2.4 预读机制

线性预读：顺序访问 extent 的56个页，预读下一个extent

随机预读：同一个extent的13个页被访问，预读整个extent

innodb_read_ahead_threshold = 56  # 线性预读阈值
innodb_random_read_ahead = OFF    # 随机预读开关

2.5 Buffer Pool状态查看

-- 查看Buffer Pool状态
SHOW ENGINE INNODB STATUS;

-- 查看Buffer Pool配置和命中情况
SHOW STATUS LIKE 'Innodb_buffer_pool%';

-- 关键指标：
-- Innodb_buffer_pool_reads: 从磁盘读取的页数
-- Innodb_buffer_pool_read_requests: 逻辑读取请求数
-- 命中率 = 1 - reads / read_requests

-- MySQL 8.0 查看每个Buffer Pool实例状态
SELECT * FROM performance_schema.innodb_buffer_pool_stats;

三、Change Buffer

3.1 什么是Change Buffer

当更新二级索引页时，如果该页不在Buffer Pool中，不立即读入磁盘页，而是将修改缓存到Change Buffer中。后续读该页时合并（Merge）。

适用：

二级索引的INSERT、UPDATE、DELETE
非唯一索引（唯一索引需要校验唯一性，必须读页）

不适用：

唯一索引
主键索引（聚簇索引）
数据页

3.2 Change Buffer的优势

减少随机IO：避免频繁读入不常用的索引页
批量合并：将多个修改合并到一次IO
提升写性能：写密集型场景效果显著

3.3 配置

# 开启Change Buffer（默认开启）
innodb_change_buffering = all
# 可选值：inserts, deletes, changes, purges, all, none

# Change Buffer占Buffer Pool的比例（默认25%）
innodb_change_buffer_max_size = 25

3.4 监控

-- 查看Change Buffer使用情况
SHOW ENGINE INNODB STATUS;

-- 相关输出：
-- INSERT BUFFER AND ADAPTIVE HASH INDEX
-- Ibuf: size 1, free list len 0, seg size 2, 0 merges
-- Ibuf: size = 缓存的页数
-- merges = 合并次数

四、Adaptive Hash Index

4.1 原理

InnoDB自动为频繁访问的索引页建立哈希索引，加速等值查询：

B+树查找：需要遍历树，约3-4次比较
哈希查找：O(1)直接定位

4.2 自动构建

自动为Buffer Pool中的热点页建立
不需要DBA干预
只适用于等值查询（=、IN）

4.3 配置

# 开启AHI（默认开启）
innodb_adaptive_hash_index = ON

# AHI分区数（减少锁竞争）
innodb_adaptive_hash_index_parts = 8

4.4 监控

SHOW ENGINE INNODB STATUS;

-- Hash table size: 内存中的AHI大小
-- Hash searches/s: 使用AHI的查询次数
-- Non-hash searches/s: 未使用AHI的查询次数

-- AHI使用率 = hash searches / (hash + non-hash searches)

注意：

大量并发写时，AHI可能成为瓶颈（锁竞争）
可临时关闭：SET GLOBAL innodb_adaptive_hash_index = OFF

五、Redo Log

5.1 为什么需要Redo Log

保证事务的持久性（Durability）。数据修改先写Redo Log（顺序写），再异步刷数据页（随机写）。

写入流程：
1. 修改Buffer Pool中的数据页
2. 生成Redo Log记录
3. 写入Redo Log Buffer
4. 事务提交时刷Redo Log到磁盘
5. 后台线程异步刷脏页

崩溃恢复：
- 重启时根据Redo Log恢复未刷盘的数据
- 保证已提交事务不丢失

5.2 Redo Log结构

Redo Log File（循环使用）：
┌─────────────────────────────────────────────────┐
│  LSN 1000    │  LSN 2000    │  LSN 3000        │
│  ┌────────┐  │  ┌────────┐  │  ┌────────┐     │
│  │Record 1│  │  │Record 2│  │  │Record 3│     │
│  └────────┘  │  └────────┘  │  └────────┘     │
└─────────────────────────────────────────────────┘
      ▲                                   │
      └────────── checkpint LSN ──────────┘

- checkpoint之前的日志：已刷盘，可覆盖
- checkpoint之后的日志：未刷盘，需保留

5.3 配置

# Redo Log文件大小（默认48MB，建议1-2GB）
innodb_log_file_size = 1G

# Redo Log文件数量
innodb_log_files_in_group = 3

# Redo Log缓冲区（默认16MB）
innodb_log_buffer_size = 64M

# 提交时刷盘策略
# 0: 每秒刷盘
# 1: 每次事务刷盘（最安全）
# 2: 写OS缓存，每秒刷盘
innodb_flush_log_at_trx_commit = 1

5.4 Redo Log刷盘策略对比

值	安全性	性能	说明
0	低	最高	每秒刷盘，崩溃可能丢失1秒数据
1	高	低	每次事务fsync，最安全
2	中	高	写OS缓存，MySQL崩溃不丢，OS崩溃可能丢

建议：

金融系统：= 1
一般系统：= 2（配合UPS和RAID电池）

六、Undo Log

6.1 作用

事务回滚：记录数据修改前的状态
MVCC：提供历史版本数据
崩溃恢复：协助Redo Log恢复

6.2 存储位置

MySQL 5.7：系统表空间（ibdata1）
MySQL 8.0：独立的Undo Tablespace

# MySQL 8.0 Undo Tablespace配置
innodb_undo_tablespaces = 2  # Undo表空间数量
innodb_max_undo_log_size = 1G # 单个Undo表空间最大大小

6.3 Undo Log类型

insert undo log：

INSERT操作产生
事务提交后即可删除（不需要MVCC）

update undo log：

UPDATE/DELETE产生
需要保留到没有更早的ReadView存在

6.4 Undo Log清理

Purge线程负责清理：
1. 找到所有活跃ReadView中最老的trx_id
2. 删除比该trx_id更早且已提交的Undo Log
3. 清理标记为删除的记录

七、Double Write Buffer

7.1 部分写问题

16KB的页写到磁盘时，如果写到一半服务器宕机，页可能损坏（partial page write）。

7.2 Double Write机制

1. 脏页刷盘前，先复制到Double Write Buffer（2MB，顺序写）
2. 再将脏页写到数据文件（随机写）
3. 如果写数据文件时崩溃：
   - 从Double Write Buffer恢复完整页
   - 再根据Redo Log恢复

7.3 配置

# 开启Double Write（默认开启）
innodb_doublewrite = ON

# 原子写支持（某些SSD支持16KB原子写，可关闭Double Write）
# innodb_doublewrite = OFF  # 仅当存储支持原子写时

八、关键参数汇总

参数	推荐值	说明
innodb_buffer_pool_size	物理内存50%-75%	缓存数据页
innodb_buffer_pool_instances	4-8	Buffer Pool实例数
innodb_log_file_size	1-2G	Redo Log文件大小
innodb_log_files_in_group	2-4	Redo Log文件数
innodb_flush_log_at_trx_commit	1或2	提交刷盘策略
innodb_flush_method	O_DIRECT	直接IO，避免OS缓存
innodb_io_capacity	200-2000	磁盘IO能力
innodb_read_io_threads	4-16	读IO线程数
innodb_write_io_threads	4-16	写IO线程数
innodb_change_buffer_max_size	25	Change Buffer比例
innodb_adaptive_hash_index	ON	自适应哈希索引

九、InnoDB状态监控

-- 查看InnoDB状态（大量信息）
SHOW ENGINE INNODB STATUS;

-- Buffer Pool命中率
SELECT 
    (1 - SUM(VARIABLE_VALUE) / 
     (SELECT VARIABLE_VALUE 
      FROM performance_schema.global_status 
      WHERE VARIABLE_NAME = 'Innodb_buffer_pool_read_requests')
    ) * 100 AS hit_ratio
FROM performance_schema.global_status
WHERE VARIABLE_NAME = 'Innodb_buffer_pool_reads';

-- 查看Buffer Pool详情（MySQL 8.0）
SELECT 
    POOL_ID,
    POOL_SIZE,
    FREE_BUFFERS,
    DATABASE_PAGES,
    OLD_DATABASE_PAGES,
    PAGES_MADE_YOUNG,
    PAGES_NOT_MADE_YOUNG
FROM information_schema.innodb_buffer_pool_stats;

十、总结

组件	作用	关键配置
Buffer Pool	缓存数据和索引页	buffer_pool_size
Change Buffer	缓存二级索引修改	change_buffer_max_size
Adaptive Hash	加速等值查询	adaptive_hash_index
Redo Log	保证持久性	log_file_size, flush_log_at_trx_commit
Undo Log	回滚和MVCC	undo_tablespaces
Double Write	防止部分写	doublewrite

InnoDB的核心设计思想：

写优先：顺序写Redo Log，异步随机写数据页
读优化：Buffer Pool缓存热点数据，AHI加速查询
空间换时间：Change Buffer减少随机IO
安全机制：Double Write保证页完整性

理解这些机制，有助于：

合理配置InnoDB参数
诊断性能问题
优化SQL和表结构

核心要点

索引设计的原则：最左前缀原则、避免索引列参与计算、选择合适的索引类型
SQL 优化的方法：使用 EXPLAIN 分析执行计划、避免 SELECT *、优化 JOIN
事务隔离级别的选择：根据业务需求选择合适的级别
常见的锁问题：行锁、表锁、死锁的处理

总结

MySQL 优化是一个持续的过程，需要结合业务特点和数据量来调整。在实际项目中，定期分析慢查询日志、优化索引、调整配置参数，都能提升数据库性能。

转载规则

《MySQL存储引擎InnoDB详解》由小乐采用知识共享署名 4.0 国际许可协议进行许可。

Java 中 equals 和 hashCode 的正确理解

详解Java 中 equals 和 hashCode 的正确理解的核心概念与实践方法，结合真实开发场景说明使用注意事项。

2024-07-26 Java基础

学习笔记 JAVA

文件上传服务如何保证稳定

详解文件上传服务如何保证稳定的核心概念与实践方法，结合真实开发场景说明使用注意事项。

2024-07-25 系统设计

架构系统设计