【发布时间】:2021-08-29 19:22:17
【问题描述】:
最近在研究数据库中索引树的实现,了解到使用B+tree可以在一个磁盘块中存储尽可能多的key,这样搜索过程就可以读取尽可能少的磁盘。
但是我有一个问题,为什么一个磁盘块不能存储多个索引树节点?每个节点的指针可以设计为blockNumber + offset。
【问题讨论】:
标签: b-tree database-indexes disk-io
最近在研究数据库中索引树的实现,了解到使用B+tree可以在一个磁盘块中存储尽可能多的key,这样搜索过程就可以读取尽可能少的磁盘。
但是我有一个问题,为什么一个磁盘块不能存储多个索引树节点?每个节点的指针可以设计为blockNumber + offset。
【问题讨论】:
标签: b-tree database-indexes disk-io
一个磁盘块当然可以存储多个索引树节点。您需要做的就是定义您想要的任何块大小,然后文件系统将其映射到正确的物理块。
通常您不想这样做,但主要是出于性能原因。随着时间的推移,树节点往往会分散在各处,然后将它们重新加载最终会加载完整的物理块。块中的其余节点可能不需要,但您支付的加载成本超出了您的需要。为了摊销成本,将节点大小与块大小相匹配是一个好主意。这有助于降低执行索引扫描的成本,因为无论如何您最终都会读取整个节点。
如果以纯随机方式访问索引,并且条目相对较小,则节点大小是否小于物理块大小无关紧要。但是数据库的目标是通用的,它们并不真正提前知道索引最终将如何使用。将节点大小与物理块大小相匹配是一个安全的选择。
【讨论】: