如何选择适合项目的「限流 / 熔断 / 降级」方案一、先分清 3 个核心概念避免选错限流防刷、防打爆、控制 QPS熔断依赖服务超时 / 报错太多直接断开防止雪崩比如大模型接口超时、向量库卡顿降级服务不行时返回兜底文案、走简化逻辑AI 项目特点大模型响应慢、外部 API 不稳定、文件上传耗资源 →熔断 限流必须同时要有二、主流方案 核心能力速览表格方案限流熔断降级分布式集群性能运维成本适用场景Resilience4j✅✅ 强需配合 Redis极高低单体 / 微服务通用、AI 项目首选Sentinel✅✅✅高中控制台阿里生态、需要可视化规则Redisson✅❌✅高低只做分布式限流Bucket4j✅❌支持 Redis极高极低高并发纯限流、大文件上传Guava RateLimiter✅❌❌极高0小项目、临时简单防刷RedisLua✅❌✅高极低无框架、轻量自研Hystrix✅✅✅低高老旧项目彻底淘汰三、按「项目类型」直接选型抄作业1. 单体项目你当前 RAG 项目✅最终推荐Resilience4j自带限流 熔断 降级 超时控制无中间件强依赖、轻量、Spring 官方维护完美适配 AI 大模型慢接口、文档上传、向量库异常不需要控制台、配置简单、注解即用你的项目直接用这套Resilience4j 全覆盖完全替代 Sentinel2. 集群 / 多实例部署后续扩容✅ 组合方案熔断降级Resilience4j本地熔断防单实例雪崩分布式限流Redisson全局统一 QPS、多节点流量统一管控原因Resilience4j 没有原生分布式限流Redisson 只有限流、没有熔断两者互补企业微服务标准搭配3. 高并发场景大文件上传、高频问答✅Bucket4j纯令牌桶实现性能天花板支持精细化限流、流量整形适合分片上传、批量文档解析、高频 AI 问答4. 小型项目、内部工具、极简架构✅Guava RateLimiter零配置、几行代码搞定只做简单 QPS 限制够用、无复杂度缺点单机、不能集群5. 极简技术栈、不想引入任何中间件框架✅Redis Lua 原生限流无第三方组件、轻量自研适合小团队、技术栈极简主义6. 阿里生态、需要可视化动态规则✅Sentinel可视化控制台、动态改限流 / 熔断规则适合中台、复杂微服务缺点阿里生态绑定、过重四、AI RAG 项目 专属选型原则重点你的业务依赖外部大模型 API不稳定、超时多文档解析、向量化 耗 CPU/IO多轮对话、长耗时接口强制搭配规则必须要有熔断→ 选 Resilience4j必须要有接口限流→ 单机用 Resilience4j 自带限流集群加 Redisson大文件 / 分片上传→ 搭配 Bucket4j 做单独限流禁止只用纯限流框架Guava/Redisson/Lua没有熔断会雪崩五、最简选型口诀单体 AI 项目→ 直接Resilience4j集群多节点→ Resilience4j Redisson高并发上传→ Bucket4j小项目简单防刷→ Guava不要复杂框架→ RedisLua阿里生态要控制台→ Sentinel六、给你固定不变的长期技术栈直接长期用plaintext熔断降级Resilience4j永久标配 单机限流Resilience4j 内置限流 分布式限流Redisson 高并发特殊接口Bucket4j这套组合无厂商绑定性能拉满维护活跃适配单体 / 微服务 / AI 业务全覆盖