从LeetCode一道题出发，实战解析C++ multiset中upper_bound/lower_bound的正确用法

张

张建站

2026/5/7 12:28:21

10分钟阅读

从LeetCode一道题出发，实战解析C++ multiset中upper_bound/lower_bound的正确用法

从LeetCode实战解析C multiset中upper_bound与lower_bound的高效应用在算法竞赛和面试准备中处理动态数据流并快速查询统计信息是常见需求。想象这样一个场景你需要实时维护一个不断变化的数字集合并频繁回答当前有多少数字小于给定值这类查询。这类问题在LeetCode中频繁出现比如295. Find Median from Data Stream或315. Count of Smaller Numbers After Self。面对这类问题C标准模板库(STL)中的multiset容器配合upper_bound和lower_bound成员函数往往能提供优雅高效的解决方案。1. 为什么选择multiset处理有序数据在解决需要维护有序数据的算法问题时开发者通常面临几种选择原生数组、vector、set或multiset。每种结构都有其适用场景但multiset在处理允许重复元素的有序集合时展现出独特优势。multiset的核心特性自动按升序排列元素可通过自定义比较器修改允许存储重复值插入、删除操作的平均时间复杂度为O(log n)提供高效的二分查找接口与普通set相比multiset的价值在于它能正确处理重复元素。考虑这样一个测试用例multisetint ms; ms.insert(3); ms.insert(1); ms.insert(4); ms.insert(1); ms.insert(5); for(int x : ms) cout x ; // 输出1 1 3 4 5而vector虽然可以通过std::sort实现有序但每次插入新元素都需要重新排序时间复杂度升至O(n log n)。当数据频繁变动时这种开销将变得不可接受。2. 理解lower_bound与upper_bound的行为差异lower_bound和upper_bound是multiset提供的两个关键成员函数它们的行为差异直接影响算法设计的正确性。让我们通过具体示例来剖析它们的区别。2.1 lower_bound的精确查找特性lower_bound(k)返回指向第一个不小于k的元素的迭代器。具体行为包括如果存在等于k的元素返回第一个这样的元素如果不存在k返回第一个大于k的元素如果k大于所有元素返回end()multisetint ms {1, 2, 2, 3, 4, 4, 4, 5}; auto lb ms.lower_bound(3); cout *lb; // 输出3第一个等于3的元素 lb ms.lower_bound(6); if(lb ms.end()) cout Not found; // 输出Not found2.2 upper_bound的边界定位能力upper_bound(k)返回指向第一个大于k的元素的迭代器。其特点包括无论k是否存在都返回第一个大于k的元素如果k大于所有元素返回end()multisetint ms {1, 2, 2, 3, 4, 4, 4, 5}; auto ub ms.upper_bound(3); cout *ub; // 输出4第一个大于3的元素 ub ms.upper_bound(2); cout *ub; // 输出3注意不是最后一个2关键提示在multiset中equal_range(k)等价于make_pair(lower_bound(k), upper_bound(k))可一次性获取所有等于k的元素范围。3. 实战应用解决LeetCode中位数问题让我们通过295. Find Median from Data Stream这道经典题目展示multiset如何优雅解决实际问题。题目要求设计一个数据结构支持添加数字到数据流查找当前所有数字的中位数3.1 双multiset解法设计高效解决方案的核心在于维护两个平衡的multisetleft存储较小的一半数字大根堆语义right存储较大的一半数字小根堆语义class MedianFinder { private: multisetint left, right; public: void addNum(int num) { if(left.empty() || num *left.rbegin()) { left.insert(num); if(left.size() right.size() 1) { right.insert(*left.rbegin()); left.erase(--left.end()); } } else { right.insert(num); if(right.size() left.size()) { left.insert(*right.begin()); right.erase(right.begin()); } } } double findMedian() { if(left.size() right.size()) { return *left.rbegin(); } return (*left.rbegin() *right.begin()) / 2.0; } };3.2 关键操作解析插入元素时的平衡维护新元素根据当前中位数决定插入left或right通过rbegin()获取left的最大值模拟堆顶当左右大小失衡时转移元素保持平衡查找中位数的效率直接访问left和right的边界元素时间复杂度O(1)远优于每次查询都排序的方案这种实现方式相比优先队列方案的优势在于支持随机访问边界元素删除操作更直观高效可以方便扩展到需要查询任意分位数的场景4. 性能对比成员函数与通用算法STL提供了两种使用lower_bound/upper_bound的方式作为multiset的成员函数或作为通用算法。它们在接口相似的表象下隐藏着重要的性能差异。4.1 时间复杂度对比操作类型成员函数版本通用算法版本lower_boundO(log n)O(log n)upper_boundO(log n)O(log n)范围查询O(log n)O(log n)虽然时间复杂度相同但成员函数版本在实际运行中通常快2-5倍原因在于避免间接调用带来的开销更好的缓存局部性编译器对成员函数的优化空间更大4.2 实际测试数据以下是在包含1,000,000个随机整数的multiset上进行的测试结果单位毫秒操作成员函数通用算法lower_bound1538upper_bound1641equal_range1845测试代码片段multisetint large_ms; // 填充100万个随机数... auto start chrono::high_resolution_clock::now(); auto it large_ms.lower_bound(target); auto end chrono::high_resolution_clock::now(); cout Member lower_bound: chrono::duration_castchrono::milliseconds(end-start).count() ms\n; start chrono::high_resolution_clock::now(); it lower_bound(large_ms.begin(), large_ms.end(), target); end chrono::high_resolution_clock::now(); cout Generic lower_bound: chrono::duration_castchrono::milliseconds(end-start).count() ms\n;5. 高级技巧与边界情况处理在实际应用中正确处理边界情况和掌握一些高级技巧可以避免常见错误。5.1 安全访问迭代器在使用lower_bound或upper_bound返回的迭代器前必须检查它是否有效auto it ms.lower_bound(key); if(it ! ms.end()) { // 安全使用*it } else { // 处理未找到情况 }5.2 统计区间元素数量统计multiset中值在[L, R]范围内的元素数量int count distance(ms.lower_bound(L), ms.upper_bound(R));这种方法比遍历整个容器高效得多时间复杂度仅为O(log n k)其中k是范围内元素数量。5.3 处理自定义类型当multiset存储自定义类型时需要确保比较逻辑一致struct Point { int x, y; bool operator(const Point other) const { return x other.x || (x other.x y other.y); } }; multisetPoint points; points.insert({1,2}); points.insert({3,4}); auto it points.lower_bound({2,0}); // 返回指向(3,4)的迭代器5.4 性能优化技巧批量插入优化vectorint values {...}; ms.insert(values.begin(), values.end()); // 比循环插入更高效预留空间multisetint ms; ms.reserve(1000); // 预分配内存减少插入时的重新分配使用emplace代替insertms.emplace(42); // 避免临时对象构造对复杂类型更高效在解决LeetCode315. Count of Smaller Numbers After Self问题时我曾尝试多种数据结构最终发现结合multiset和逆序处理的方案最为高效。关键点在于对每个元素使用distance(ms.begin(), ms.lower_bound(nums[i]))来统计已处理元素中比当前元素小的数量这种方法的平均时间复杂度为O(n log n)。

中小企业如何利用Taotoken统一接入多模型降低AI开发门槛

中小企业如何利用Taotoken统一接入多模型降低AI开发门槛对于资源有限的中小企业或初创团队而言，将大模型能力集成到产品中是一个既充满机遇又颇具挑战的工程任务。直接与多家模型厂商对接，意味着需要处理不同的API协议、计费方式、密钥管理和文档体系&…...

2026/5/7 12:27:49 阅读更多 →

GD32F450实战：从25MHz晶振到200MHz系统时钟，手把手配置AHB/APB分频

GD32F450时钟树实战：从25MHz晶振到200MHz系统的精准配置指南当一块GD32F450开发板放在你面前，25MHz的晶振静静躺在PCB一角，如何让它驱动整个系统飙升至200MHz？这不仅仅是修改几个参数的问题，更是一场对时钟树的精确调…...

2026/5/7 12:27:28 阅读更多 →

别再只懂协同过滤了！从零到一，用Python手把手实现一个基于内容的电影推荐系统（附完整代码）

从零构建基于内容的电影推荐系统：Python实战指南 1. 理解基于内容推荐的核心逻辑当Netflix向你推荐《怪奇物语》的同类剧集，或是豆瓣根据你喜欢的《星际穿越》推荐《盗梦空间》时，背后很可能采用了基于内容的推荐算法。与协同过滤不同&…...

2026/5/7 12:27:04 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/5 12:09:26 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/7 9:02:42 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/6 16:59:09 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/5 9:51:58 阅读更多 →