【数据结构】数组：最基础也最重要

如果要选一个最能代表计算机底层思维的数据结构，那非**数组（Array）**莫属。

它是所有编程语言里最常见的结构，也是几乎所有高级数据结构（比如堆、栈、哈希表）的基石。但你真的了解它吗？为什么数组下标要从 0 开始？为什么它的随机访问快如闪电，而插入删除却慢如蜗牛？

今天，小明带你揭开数组的“裙摆”。

一、数组的定义：连续与一致

在计算机科学中，数组的定义非常严苛：数组是一种线性表数据结构，它用一组连续的内存空间，来存储一组具有相同类型的数据。

关键词有三个：

正是因为这三点，数组获得了一个逆天的技能：随机访问。

想象一下，内存就像一排整齐的储物柜。每个柜子都有一个编号（内存地址）。

当你向系统申请一个长度为 5 的 int 数组时，系统会分配一段连续的空位给你。假设首地址是 1000，每个 int 占 4 字节。

那么：

计算公式就是：a[i]_address = base_address + i * data_type_size。

因为计算机计算这个加法和乘法非常快，而且不需要遍历，所以无论数组有多长，根据下标找数据的时间复杂度都是 O(1)。

如果下标从 1 开始，公式就变成了： a[i]_address = base_address + (i - 1) * data_type_size。

看到了吗？多了一个 (i - 1) 的减法运算。对于数组这种最底层、使用最频繁的操作，能省掉一个减法就是巨大的性能提升。

成也萧何败也萧何。数组为了保持内存的“连续性”，在修改数据时付出了沉重的代价。

如果你想在数组的第 1 个位置插入一个数据，为了腾出空位，你需要把后面所有的元素都往后挪一个位置。

同理，删掉中间一个元素，为了不留“坑”，后面所有的元素都要往前挪。

小明的小贴士： 在某些高性能场景下，如果我们需要连续删除多个元素，可以先记录下这些“待删除”标记，等数组空间不够时，再统一进行一次大规模的搬移（这就是 JVM 标记-清除垃圾回收算法的核心思想）。

有些朋友会问：“小明，我在 JS 里用数组，又是插又是删，还能存不同类型的数据，没感觉慢啊？”

那是由于高级语言的数组已经不是纯粹的底层数组了。

但无论如何封装，连续内存空间带来的 CPU 缓存友好性（CPU Cache Locality）是其他结构无法比拟的。

小明建议： 如果你在做性能极其敏感的开发，或者在处理大规模数值计算，请务必使用最原始、类型确定的数组。如果只是处理日常业务，高级语言提供的动态数组（如 JS 的 Array, Python 的 List）是更方便的选择。

“为什么数组这么快？” “因为它比你想象的更‘简单’，而计算机最喜欢简单的东西。” —— 小明

最后，送你一个冷笑话：一个程序员去相亲，女方问：“你有什么特长？” 程序员想了想说：“我能在一秒钟内找到数组里的任意一个元素。” 女方：“……那插入呢？” 程序员：“那得看你能不能接受 O(n) 的等待时间。” 程序员，卒。