MySQL 索引原理：揭秘 B+ 树的查询艺术

在处理海量数据的数据库中，索引常被类比为“书的目录”。然而，在计算机底层，索引的实现远比简单的页码映射复杂。深入理解 MySQL（尤其是 InnoDB 引擎）的索引原理，不仅能帮助我们写出更高效的 SQL，更是通往高级后端工程师的必经之路。

一、为什么选择 B+ 树？

在众多的数据结构中，为什么 MySQL 偏偏选择了 B+ 树？

二叉查找树（BST）在最坏情况下会退化为链表。平衡二叉树（AVL 或红黑树）虽然保证了平衡，但在海量数据下，树的高度依然过高。由于数据库索引存储在磁盘上，每一次跨节点的搜索都可能意味着一次昂贵的 磁盘 I/O。

B+ 树通过多叉平衡结构，极大地降低了树的高度（通常 3-4 层即可支持千万级数据）。

在 InnoDB 引擎中，索引的组织方式直接决定了数据的存储结构。

聚簇索引并不是一种单独的索引类型，而是一种数据存储方式。它将索引和数据行存放在一起。

也称为非聚簇索引或辅助索引。

理解了底层原理，我们就能明白许多优化原则背后的逻辑：

在复合索引 (a, b, c) 中，B+ 树是按照 a -> b -> c 的顺序排序的。如果你查询 WHERE b = 1，由于 a 的不确定性，索引将无法生效。

如果一个二级索引包含（覆盖）了查询所需的所有字段，MySQL 就不再需要“回表”，查询效率将得到质的飞跃。

-- 假设存在索引 idx_name_age(name, age)
-- 这是一个覆盖索引，无需回表
SELECT name, age FROM users WHERE name = '小明';