我手写了一个 Java 内存数据库（三）：删除、合并与范围查询

张

张建站

2026/4/29 8:28:30

10分钟阅读

我手写了一个 Java 内存数据库三删除、合并与范围查询上一篇写了插入与分裂。这篇拆解两个主题删除时的借位与合并整个项目里最绕的部分以及范围查询B 树最大亮点。一、删除最绕的部分删除比插入复杂得多。插入最多就是分裂、传播逻辑是单向的。但删除要判断删完够不够不够的话先向兄弟借借不了再合并合并之后父节点可能又不够了……一路递归上去。整体流程1. 从根向下找到目标叶子节点 2. 删除 key 3. 如果剩余 key 数 M/2 a. 先看兄弟节点能不能借一个 b. 借不了就合并 4. 合并可能触发父节点也不满足条件递归向上叶子节点删除publicbooleanremove(Comparablekey,BPTreetree){if(isLeaf){if(!contains(key))returnfalse;if(isRoot){returnremove(key);// 既是叶子又是根直接删}if(entries.size()tree.getOrder()/2entries.size()2){returnremove(key);// 删完还够直接删}// 删完不够了要借或合并...}}向兄弟借优先看前兄弟再后兄弟。有个重要前提只能从同一个父节点下的兄弟借不能跨父节点previous.getParent() parent。// 向前兄弟借最后一个if(previous!nullprevious.getEntries().size()tree.getOrder()/2previous.getEntries().size()2previous.getParent()parent){Entry...entryprevious.getEntries().get(previous.getEntries().size()-1);previous.getEntries().remove(entry);entries.add(0,entry);// 借过来的放首位remove(key);}// 向后兄弟借第一个elseif(next!nullnext.getEntries().size()tree.getOrder()/2next.getEntries().size()2next.getParent()parent){Entry...entrynext.getEntries().get(0);next.getEntries().remove(entry);entries.add(entry);// 借过来的放末尾remove(key);}画个图M4最少 2 个 key借位前 ┌──────┐ ┌──────┐ ┌──────┐ │ 3 | 7│ │ 12 │ │18 |25│ └──────┘ └──────┘ └──────┘ 前兄弟当前后兄弟 (够借) (要删12) (也够) 向前兄弟借 7 ┌────┐ ┌──────┐ ┌──────┐ │ 3 │ │ 7 │ │18 |25│ └────┘ └──────┘ └──────┘合并兄弟也不富裕时只能合并// 与前兄弟合并if(previous!null(previous.getEntries().size()tree.getOrder()/2||previous.getEntries().size()2)previous.getParent()parent){// 把前兄弟的 entries 全搬过来for(intiprevious.getEntries().size()-1;i0;i--){entries.add(0,previous.getEntries().get(i));}remove(key);previous.setParent(null);previous.setEntries(null);parent.getChildren().remove(previous);// 维护链表——又是最容易出 bug 的地方if(previous.getPrevious()!null){Nodetempprevious;temp.getPrevious().setNext(this);previoustemp.getPrevious();temp.setPrevious(null);temp.setNext(null);}else{tree.setHead(this);// 前兄弟是链表头previous.setNext(null);previousnull;}}合并后父节点的子节点少了一个可能也不满足 M/2 的要求所以要递归调用parent.updateRemove(tree)。updateRemove非叶子节点的平衡protectedvoidupdateRemove(BPTreetree){validate(this,tree);if(children.size()tree.getOrder()/2||children.size()2){if(isRoot){if(children.size()2)return;// 根只剩一个子节点——树变矮了Noderootchildren.get(0);tree.setRoot(root);root.setParent(null);root.setRoot(true);}else{// 同样的套路先借借不了合并Nodepreviousparent.getChildren().get(prevIdx);Nodenextparent.getChildren().get(nextIdx);if(previous!nullprevious.getChildren().size()tree.getOrder()/2){// 从前兄弟借最后一个子节点Nodeborrowprevious.getChildren().remove(lastIdx);borrow.setParent(this);children.add(0,borrow);}elseif(next!nullnext.getChildren().size()tree.getOrder()/2){// 从后兄弟借第一个子节点Nodeborrownext.getChildren().remove(0);borrow.setParent(this);children.add(borrow);}else{// 合并}parent.updateRemove(tree);// 递归向上}}}树变矮只发生在根节点——当根只剩一个子节点时那个子节点晋升为新根。这是 B 树高度减少的唯一方式。二、范围查询B 树最大亮点这是我最满意的部分。B 树之所以比 Hash、红黑树更适合做数据库索引核心就是范围查询——叶子节点有双向链表找到边界后沿链表扫就行。我实现了三种范围查询每种都用了自己写的二分查找变体。searchless找最后一个小于等于 key 的位置标准二分只找等于这个变体找边界publicintsearchless(ListEntry...list,Comparablekey){intlow0,highlist.size()-1,mid0;while(lowhigh){mid(lowhigh)/2;if(list.get(mid).getKey().compareTo(key)0){lowmid1;}elseif(list.get(mid).getKey().compareTo(key)0){highmid-1;}else{lowmid;break;}}if(low0)return-1;returnlow-1;}searchmore找第一个大于等于 key 的位置publicintsearchmore(ListEntry...list,Comparablekey){intlow0,highlist.size()-1,mid0;while(lowhigh){mid(lowhigh)/2;if(list.get(mid).getKey().compareTo(key)0){lowmid1;}elseif(list.get(mid).getKey().compareTo(key)0){highmid-1;}else{highmid1;break;}}if(highlist.size()||lowlist.size())return-1;returnhighlow?low:high;}这两个变体我反复调试了好几遍边界条件确实容易出错。小于查询 getLessThenpublicListListgetLessThen(Comparablekey){ListListlistnewArrayList();intbindsearchless(entries,key);if(isLeaf){if(bind0){for(inti0;ibind;i){list.add(entries.get(i).getValue());}returnlist;}returnnull;}else{if(bind0){for(inti0;ibind;i){Listlist1children.get(i).getLessThen(key);if(list1!null)list.addAll(list1);}}else{// bind 0 说明当前节点所有 entry 都比 key 大// 但最左子树可能还有更小的值Listlist1children.get(0).getLessThen(key);if(list1!null)list.addAll(list1);}returnlist.size()0?null:list;}}举例查所有 15 的[10 | 20] / | \ [3|5|7] [10|12] [20|25|30] ↑ ↑ 全部符合部分符合10,12 结果3, 5, 7, 10, 12Between 查询 getMoreAndLessThen同时用两个二分变体定位上下界if(isLeaf){intbind1searchless(entries,key2);// 上界intbind2searchmore(entries,key1);// 下界for(intibind2;ibind1bind20;i){list.add(entries.get(i).getValue());}}非叶子节点的处理稍微复杂else{intbind1searchless(entries,key2);intbind2searchmore(entries,key1);if(bind10){// 所有 entry key2走最左子树碰运气children.get(0).getMoreAndLessThen(key1,key2);}elseif(bind20){// 所有 entry key1走最右子树碰运气children.get(entries.size()-1).getMoreAndLessThen(key1,key2);}else{// 遍历 bind2-1 到 bind1 的子树for(intibind2-10?bind2-1:bind2;ibind1;i){children.get(i).getMoreAndLessThen(key1,key2);}}}为什么从bind2 - 1开始这个我调了很久才想通。searchmore找到的是第一个 key1 的 entry但它的前一个子树的最右叶子可能也有符合条件的值。必须多看一个子树才不会漏。举例查 5 key 25[10 | 20] / | \ [3|5|7] [10|12] [20|25|30] ↑ ↑ ↑ 部分符合全部符合部分符合结果7, 10, 12, 20这篇的坑总结删除后的链表维护——和分裂一样容易搞错指向searchless/searchmore 的边界——low 0还是low 0返回 -1 还是真的下标调了好多遍Between 查询漏子树——bind2 - 1这个偏移量是踩了坑才发现的递归向上时 validate 漏调——和插入一样的问题关键字没同步就路由错了上一篇上一篇[我手写了一个 Java 内存数据库二B 树的插入与分裂]下一篇B 树的增删查都写完了。最后一篇把它组装起来——索引引擎Table B 树怎么配合、SQL 解析、软删除以及对整个项目的反思。下一篇[我手写了一个 Java 内存数据库四索引引擎、SQL 解析与总结]系列我手写了一个 Java 内存数据库共 4 篇

告别桌面混乱：3步用NoFences打造高效整洁的Windows工作空间

告别桌面混乱：3步用NoFences打造高效整洁的Windows工作空间【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 你的Windows桌面是不是经常被各种图标、文件和快捷方式…...

2026/4/29 8:27:45 阅读更多 →

注册表惹的祸？深度解析Windows 11软件打开方式失效的底层逻辑与一劳永逸的预防方案

Windows 11打开方式失效的底层机制分析与系统级预防策略每次双击文档却弹出一堆重复选项，或是根本打不开关联程序——这种困扰在Windows 11用户中相当普遍。表面看是简单的文件关联问题，实则暴露了Windows注册表管理的深层机制缺陷。本文将带您穿透现象…...

2026/4/29 8:27:44 阅读更多 →

ARM内存管理：Heap1与Heap2实现原理与性能对比

1. ARM内存管理中的堆实现基础在嵌入式系统开发中，内存管理是决定系统性能和可靠性的关键因素。作为动态内存分配的核心数据结构，堆(heap)的实现方式直接影响着malloc()、free()等关键函数的性能表现。ARM架构为开发者提供了两种经典的堆实现方案&#x…...

2026/4/29 8:27:36 阅读更多 →

AI智能体工作流编排：从单体架构到流水线协作的工程实践

1. 项目概述：当AI智能体学会“流水线”协作最近在探索AI智能体（Agent）的落地应用时，我遇到了一个非常有意思的项目：coleam00/ottomator-agents。这个名字本身就充满了想象力——“Ottomator”，听起来像是“…...

2026/4/29 5:20:31 阅读更多 →

ChatGPT翻译能力解析与实战技巧

1. ChatGPT翻译能力深度解析作为一名长期从事语言技术研究的从业者，我最近系统测试了ChatGPT在多语言翻译场景下的实际表现。与传统的机器翻译工具相比，ChatGPT展现出几个独特优势：首先，它的上下文理解能力远超传统翻译引擎。当处…...

2026/4/26 0:13:35 阅读更多 →

2026届毕业生推荐的十大降AI率助手实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在内容生产这个过程当中，要降低AIGC也就是人工智能生成内容所占的比例&#xff…...

2026/4/29 7:49:02 阅读更多 →