Java开发者必看!LangChain4j手把手教你构建企业级智能文档问答系统
目录引言为什么需要 RAGRAG 核心原理详解LangChain4j 框架介绍项目架构与环境搭建核心代码解析实际案例企业智能客服系统生产环境升级方案总结与最佳实践引言为什么需要 RAG1.1 大模型的局限性在使用大语言模型LLM时我们常常遇到以下问题❌ 问题 1模型不知道企业内部信息用户我们公司的年假政策是什么AI抱歉我不知道贵公司的具体政策...❌ 问题 2模型会产生幻觉用户张三经理的联系方式是什么AI张三经理的电话是 138-xxxx-xxxx实际是编造的❌ 问题 3知识更新滞后用户公司 2024 年最新的产品价格是多少AI模型训练数据只到 2023 年无法回答1.2 RAG 的解决方案RAGRetrieval-Augmented Generation检索增强生成技术应运而生┌─────────────────────────────────────────────────────────────┐│ RAG 核心思想 │├─────────────────────────────────────────────────────────────┤│ ││ 传统 LLM用户问题 → 大模型 → 答案 ││ ││ RAG 增强用户问题 → 检索相关文档 → 问题 文档 → 大模型 → 答案 ││ │└─────────────────────────────────────────────────────────────┘RAG 的优势• ✅准确可靠基于真实文档回答减少幻觉• ✅知识可更新添加新文档即可更新知识• ✅数据私有化企业数据无需上传到模型训练• ✅成本可控使用较小模型 私有数据降低 API 成本1.3 为什么选择 LangChain4j框架语言特点LangChainPython/JS功能强大但需要 Python 技术栈Spring AIJavaSpring 官方出品生态整合好LangChain4jJava轻量级、API 简洁、学习曲线平缓LangChain4j 的核心理念让 Java 开发者也能像调用普通方法一样使用 AI 能力RAG 核心原理详解2.1 RAG 完整流程┌─────────────────────────────────────────────────────────────┐│ RAG 完整工作流程 │├─────────────────────────────────────────────────────────────┤│ ││ 【准备阶段 - 应用启动时执行】 ││ ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ 1. 加载 │ → │ 2. 分割 │ → │ 3. 向量化│ → │ 4. 存储 │ ││ │ 文档 │ │ 文档 │ │ Embedding│ │ 向量库 │ ││ └──────────┘ └──────────┘ └──────────┘ └──────────┘ ││ ││ 【问答阶段 - 用户提问时执行】 ││ ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ 5. 用户 │ → │ 6. 检索 │ → │ 7. 构建 │ → │ 8. 生成 │ ││ │ 提问 │ │ 相关文档 │ │ 提示词 │ │ 答案 │ ││ └──────────┘ └──────────┘ └──────────┘ └──────────┘ ││ │└─────────────────────────────────────────────────────────────┘2.2 什么是向量Embedding向量是将文本转换成的数字数组语义相似的文本向量也相似。文本 → 向量简化示例实际有 1536 维公司的年假政策 → [0.12, -0.34, 0.56, 0.78, ...]年假有多少天 → [0.11, -0.33, 0.55, 0.77, ...] ← 向量很接近今天天气不错 → [0.89, 0.23, -0.67, 0.45, ...] ← 向量差别大请假流程是什么 → [0.15, -0.31, 0.52, 0.75, ...] ← 向量也很接近相似度计算余弦相似度similarity cos(θ) (A·B) / (||A|| × ||B||)结果范围-1 到 1- 1完全相同- 0无关- -1完全相反通常设定阈值 0.5-0.7低于阈值的认为不相关2.3 文档分割策略为什么需要分割• 向量模型有输入长度限制通常 512-8192 tokens• 检索时需要精确匹配相关片段而非整篇文档常用分割方法// LangChain4j 的递归分割器DocumentSplitter splitter DocumentSplitters.recursive( 500, // 每个文本块最大 500 字符 50 // 文本块之间重叠 50 字符保持上下文连贯);// 分割示例原文档2000 字符 ↓文本块 10-500 字符文本块 2450-950 字符 ← 重叠 50 字符文本块 3900-1400 字符文本块 41350-1850 字符文本块 51800-2000 字符2.4 检索与生成用户提问公司的年假政策是什么 ↓【Step 1: 问题向量化】调用 Embedding 模型 → 问题向量 [0.13, -0.32, 0.54, ...]【Step 2: 向量检索】在向量数据库中搜索相似向量- 文本块 A年假政策相似度 0.89 ✓- 文本块 B请假流程相似度 0.72 ✓- 文本块 C产品介绍相似度 0.31 ✗- 文本块 D联系方式相似度 0.28 ✗【Step 3: 构建提示词】系统你是一个智能助手请基于以下参考信息回答问题。参考信息[文本块 A 内容工作满 1 年享受 5 天带薪年假...][文本块 B 内容请假需提前 3 个工作日申请...]用户问题公司的年假政策是什么【Step 4: 调用大模型生成】qwen-max 生成答案 → 根据员工手册工作满 1 年可享受 5 天带薪年假...LangChain4j 框架介绍3.1 核心组件┌─────────────────────────────────────────────────────────────┐│ LangChain4j 核心组件架构 │├─────────────────────────────────────────────────────────────┤│ ││ ┌─────────────────┐ ┌─────────────────┐ ││ │ ChatLanguage │ │ Embedding │ ││ │ Model │ │ Model │ ││ │ (对话模型) │ │ (向量化模型) │ ││ └────────┬────────┘ └────────┬────────┘ ││ │ │ ││ └────────┬───────────┘ ││ │ ││ ┌────────▼────────┐ ││ │ AiServices │ ← 核心抽象层 ││ │ (AI 服务构建器) │ ││ └────────┬────────┘ ││ │ ││ ┌──────────────┼──────────────┐ ││ │ │ │ ││ ▼ ▼ ▼ ││ ┌──────┐ ┌──────────┐ ┌──────────┐ ││ │ 记忆 │ │ 检索器 │ │ 工具 │ ││ │Memory│ │Retriever │ │ Tools │ ││ └──────┘ └──────────┘ └──────────┘ ││ │└─────────────────────────────────────────────────────────────┘3.2 AiServices最强大的抽象传统 AI 调用方式RestControllerpublic class AiController { Autowired private RestTemplate restTemplate; PostMapping(/chat) public String chat(RequestBody ChatRequest request) { // 1. 手动构建提示词 String prompt 你是客服助手请基于以下信息回答\n getContext() \n 用户问题 request.getQuestion(); // 2. 调用 HTTP API HttpHeaders headers new HttpHeaders(); headers.set(Authorization, Bearer apiKey); HttpEntityMap entity new HttpEntity(...); ResponseEntityString response restTemplate.postForEntity(...); // 3. 解析结果 JsonNode root objectMapper.readTree(response.getBody()); return root.get(choices).get(0).get(message).get(content).asText(); }}LangChain4j 方式// 1. 定义接口interface Assistant { String chat(MemoryId String userId, UserMessage String question);}// 2. 创建服务Assistant assistant AiServices.builder(Assistant.class) .chatLanguageModel(model) .contentRetriever(retriever) .build();// 3. 使用像调用普通方法一样简单String answer assistant.chat(user123, 公司的年假政策是什么);3.3 支持的模型提供商LangChain4j 支持多种大模型提供商提供商模型依赖阿里云通义千问langchain4j-dashscopeOpenAIGPT-3.5/4langchain4j-open-ai百度文心一言langchain4j-qianfan本地部署Ollamalangchain4j-ollama项目架构与环境搭建4.1 项目结构langchain4j-rag-demo/├── pom.xml # Maven 配置├── src/main/java/com/example/rag/│ ├── RagDemoApplication.java # 主启动类│ ├── config/│ │ ├── RagConfig.java # RAG 配置│ │ └── RagInitializer.java # RAG 初始化│ ├── service/│ │ └── AiAssistantService.java # AI 助手服务│ └── controller/│ └── AiController.java # REST API└── src/main/resources/ ├── application.yml # 配置文件 └── documents/ ├── company-policy.txt # 公司政策文档 └── product-info.txt # 产品文档4.2 核心依赖properties java.version17/java.version langchain4j.version0.29.0/langchain4j.version/propertiesdependencies !-- Spring Boot Web -- dependency groupIdorg.springframework.boot/groupId artifactIdspring-boot-starter-web/artifactId /dependency !-- LangChain4j 核心 -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j/artifactId version${langchain4j.version}/version /dependency !-- LangChain4j Spring Boot Starter -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j-spring-boot-starter/artifactId version${langchain4j.version}/version /dependency !-- LangChain4j DashScope阿里云通义千问 -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j-dashscope/artifactId version${langchain4j.version}/version /dependency/dependencies4.3 配置文件server: port: 8080spring: application: name: langchain4j-rag-demo# LangChain4j 配置langchain4j: dashscope: chat-model: api-key: ${DASHSCOPE_API_KEY:sk-xxx} model-name: qwen-max # 对话模型 temperature: 0.7 embedding-model: api-key: ${DASHSCOPE_API_KEY:sk-xxx} model-name: text-embedding-v2 # 向量化模型# 日志配置logging: level: com.example: DEBUG dev.langchain4j: DEBUG4.4 快速启动# 1. 设置 API Keyexport DASHSCOPE_API_KEYsk-your-api-key# 2. 启动项目cd langchain4j-rag-demomvn spring-boot:run# 3. 测试接口curl -G http://localhost:8080/api/ask \ --data-urlencode question公司的年假政策是什么核心代码解析5.1 RAG 配置类RagConfig.javaConfigurationpublic class RagConfig { /** * 向量数据库内存版 * 生产环境可替换为PgVectorEmbeddingStore, ChromaEmbeddingStore 等 */ Bean public EmbeddingStoreTextSegment embeddingStore() { return new InMemoryEmbeddingStore(); } /** * 内容检索器 * 用于从向量数据库中检索与查询最相关的文本块 */ Bean public ContentRetriever contentRetriever( EmbeddingStoreTextSegment embeddingStore, EmbeddingModel embeddingModel) { return EmbeddingStoreContentRetriever.builder() .embeddingStore(embeddingStore) // 向量数据库 .embeddingModel(embeddingModel) // 嵌入模型 .maxResults(3) // 每次检索返回 3 个最相关结果 .minScore(0.5) // 最低相似度阈值 .build(); }}5.2 RAG 初始化器RagInitializer.javaComponentpublic class RagInitializer implements CommandLineRunner { Autowired private EmbeddingModel embeddingModel; Autowired private EmbeddingStoreTextSegment embeddingStore; Override public void run(String... args) throws Exception { log.info(开始初始化 RAG 知识库...); // Step 1: 加载文档 ListDocument documents loadDocuments(); log.info(✓ 加载了 {} 个文档, documents.size()); // Step 2: 分割文档 ListTextSegment segments splitDocuments(documents); log.info(✓ 分割成 {} 个文本块, segments.size()); // Step 3: 向量化并存储 embedAndStore(segments); log.info(✓ 向量化完成已存储到向量数据库); } private ListDocument loadDocuments() throws IOException { ListDocument documents new ArrayList(); // 加载公司政策文档 String companyPolicy loadFile(documents/company-policy.txt); if (companyPolicy ! null) { documents.add(Document.from(companyPolicy)); } // 加载产品文档 String productDoc loadFile(documents/product-info.txt); if (productDoc ! null) { documents.add(Document.from(productDoc)); } return documents; } private ListTextSegment splitDocuments(ListDocument documents) { // 创建文档分割器500 字符/块重叠 50 字符 DocumentSplitter splitter DocumentSplitters.recursive(500, 50); ListTextSegment segments new ArrayList(); for (Document document : documents) { segments.addAll(splitter.split(document)); } return segments; } private void embedAndStore(ListTextSegment segments) { for (TextSegment segment : segments) { // 调用嵌入模型将文本转换为向量 ResponseEmbedding response embeddingModel.embed(segment); Embedding embedding response.content(); // 将向量和原始文本存储到向量数据库 embeddingStore.add(embedding, segment); } }}5.3 AI 助手服务AiAssistantService.javaServicepublic class AiAssistantService { Autowired private ChatLanguageModel chatLanguageModel; Autowired private ContentRetriever contentRetriever; private Assistant assistant; private final MapString, ChatMemory userMemories new ConcurrentHashMap(); PostConstruct public void init() { // 创建 AI 助手 this.assistant AiServices.builder(Assistant.class) .chatLanguageModel(chatLanguageModel) .contentRetriever(contentRetriever) .build(); } public String ask(String userId, String question) { // 获取或创建用户记忆最多保留 10 条消息 ChatMemory memory userMemories.computeIfAbsent( userId, id - MessageWindowChatMemory.withMaxMessages(10) ); // 添加用户消息到记忆 memory.add(UserMessage.userMessage(question)); // 调用 AI 助手自动使用 RAG 检索 String response assistant.chat(userId, question); // 添加 AI 回复到记忆 memory.add(AiMessage.aiMessage(response)); return response; } // AI 助手接口定义 interface Assistant { String chat(MemoryId String userId, UserMessage String userMessage); }}5.4 REST 控制器AiController.javaRestControllerRequestMapping(/api)public class AiController { Autowired private AiAssistantService aiAssistantService; /** * 智能问答接口POST * * curl -X POST http://localhost:8080/api/ask \ * -H Content-Type: application/json \ * -d {userId: user123, question: 公司的年假政策是什么} */ PostMapping(/ask) public MapString, String ask(RequestBody AskRequest request) { String answer aiAssistantService.ask(request.getUserId(), request.getQuestion()); return Map.of(answer, answer); } /** * 简单问答接口GET * * curl -G http://localhost:8080/api/ask \ * --data-urlencode question公司的年假政策是什么 */ GetMapping(/ask) public MapString, String askGet(RequestParam String question) { String answer aiAssistantService.ask(default-user, question); return Map.of(answer, answer); } public static class AskRequest { private String userId; private String question; // getters and setters... }}5.5 完整数据流图┌─────────────────────────────────────────────────────────────────┐│ RAG 完整数据流 │├─────────────────────────────────────────────────────────────────┤│ ││ 用户请求 ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ AiController.ask() │ ││ │ - 接收 HTTP 请求 │ ││ │ - 提取 userId 和 question │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ AiAssistantService.ask() │ ││ │ - 获取用户记忆MessageWindowChatMemory │ ││ │ - 保存用户问题到记忆 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ Assistant.chat() [AiServices 代理] │ ││ │ - 触发 ContentRetriever 检索 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ ContentRetriever.retrieve() │ ││ │ 1. 调用 EmbeddingModel 将问题向量化 │ ││ │ 2. 在 EmbeddingStore 中检索 Top 3 相似文本 │ ││ │ 3. 返回相关文本块 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ 构建 RAG 提示词 │ ││ │ ┌─────────────────────────────────────────────────────┐ │ ││ │ │ 系统你是智能助手请基于参考信息回答问题 │ │ ││ │ │ │ │ ││ │ │ 参考信息 │ │ ││ │ │ [文本块 1: 工作满 1 年享受 5 天带薪年假...] │ │ ││ │ │ [文本块 2: 每增加 1 年增加 1 天上限 15 天...] │ │ ││ │ │ [文本块 3: 请假需提前 3 个工作日申请...] │ │ ││ │ │ │ │ ││ │ │ 用户问题公司的年假政策是什么 │ │ ││ │ └─────────────────────────────────────────────────────┘ │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ ChatLanguageModel.generate() │ ││ │ - 调用 qwen-max 模型 │ ││ │ - 生成答案 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ 返回答案 │ ││ │ 根据员工手册工作满 1 年可享受 5 天带薪年假每增加 1 年... │ ││ └───────────────────────────────────────────────────────────┘ ││ │└─────────────────────────────────────────────────────────────────┘实际案例企业智能客服系统6.1 场景描述背景某科技公司有 200 员工HR 部门每天需要回答大量重复问题• 年假有多少天• 五险一金怎么缴纳• 公司产品有哪些• 智能客服系统多少钱需求构建一个 7x24 小时在线的智能客服自动回答员工咨询。6.2 文档准备公司政策文档company-policy.txt示例科技有限公司 - 员工手册第一章 公司简介示例科技有限公司成立于 2024 年是一家专注于人工智能技术的高新技术企业。第三章 员工福利1. 薪酬福利 - 具有竞争力的薪资水平 - 年终奖金1-3 个月薪资2. 社会保障 - 五险一金全额缴纳社会保险和住房公积金3. 休假制度 - 带薪年假工作满 1 年享受 5 天带薪年假每增加 1 年增加 1 天上限 15 天 - 带薪病假每年 5 天带薪病假4. 工作时间 - 弹性工作早上 9-10 点弹性打卡 - 周末双休产品文档product-info.txt示例科技 - 产品信息文档产品一智能客服系统 (SmartCS)价格方案- 基础版9999 元/年1000 次/天- 专业版29999 元/年5000 次/天- 企业版99999 元/年不限次数产品二文档助手 (DocHelper)价格方案- 基础版4999 元/年10GB 存储- 专业版14999 元/年100GB 存储- 企业版49999 元/年不限存储6.3 接口测试# 单轮问答测试 # 测试 1年假政策curl -G http://localhost:8080/api/ask \ --data-urlencode question公司的年假政策是什么# 预期输出# {# answer: 根据示例科技有限公司的员工手册公司的年假政策如下# - 工作满 1 年的员工可以享受 5 天带薪年假# - 每增加 1 年工龄年假天数增加 1 天# - 年假天数上限为 15 天# }# 测试 2产品价格curl -G http://localhost:8080/api/ask \ --data-urlencode question智能客服系统多少钱一年# 预期输出# {# answer: 根据产品信息文档智能客服系统 (SmartCS) 的价格方案如下# - 基础版9999 元/年支持每天 1000 次交互# - 专业版29999 元/年支持每天 5000 次交互# - 企业版99999 元/年不限每日交互次数# }# 测试 3工作时间curl -G http://localhost:8080/api/ask \ --data-urlencode question# 预期输出# {# answer: 公司实行弹性工作制# - 上班时间早上 9-10 点弹性打卡# - 周末双休# - 不鼓励加班# }# 多轮对话测试 # 第一轮询问产品功能curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 智能客服系统有什么功能 }# 第二轮追问价格AI 会记住上下文curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 那专业版多少钱 }# 第三轮继续追问curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 有售后服务吗 }6.4 前端集成示例Vue 3 前端组件template div classchat-container div classmessages div v-formsg in messages :keymsg.id :class[message, msg.role] div classcontent{{ msg.content }}/div /div /div div classinput-area input v-modelinputMessage keyup.entersendMessage placeholder输入问题... / button clicksendMessage发送/button /div /div/templatescript setupimport { ref } from vueconst messages ref([])const inputMessage ref()const userId ref(user- Date.now())async function sendMessage() { if (!inputMessage.value.trim()) return // 添加用户消息 messages.value.push({ id: Date.now(), role: user, content: inputMessage.value }) // 调用 API const response await fetch(/api/ask, { method: POST, headers: { Content-Type: application/json }, body: JSON.stringify({ userId: userId.value, question: inputMessage.value }) }) const data await response.json() // 添加 AI 回复 messages.value.push({ id: Date.now() 1, role: assistant, content: data.answer }) inputMessage.value }/script生产环境升级方案7.1 替换向量数据库从内存版升级到 PostgreSQL pgvectorConfigurationpublic class ProductionRagConfig { Bean public EmbeddingStoreTextSegment embeddingStore(DataSource dataSource) { return PgVectorEmbeddingStore.builder() .dataSource(dataSource) .tableName(document_embeddings) .dimension(1536) // text-embedding-v2 的维度 .createTable(true) .dropTableFirst(false) .build(); }}使用 ChromaDBBeanpublic EmbeddingStoreTextSegment embeddingStore() { return ChromaEmbeddingStore.builder() .baseUrl(http://localhost:8000) .collectionName(company-knowledge) .build();}使用 RedisBeanpublic EmbeddingStoreTextSegment embeddingStore() { return RedisEmbeddingStore.builder() .host(localhost) .port(6379) .indexName(rag-embeddings) .dimension(1536) .build();}7.2 支持更多文档格式Componentpublic class DocumentLoader { /** * 加载 PDF 文档 */ public Document loadPdf(String path) { return PdfDocumentLoader.from(path); } /** * 加载 Word 文档 */ public Document loadWord(String path) { return WordDocumentLoader.from(path); } /** * 加载网页 */ public Document loadWeb(String url) { return JsoupDocumentLoader.from(url); } /** * 批量加载目录下的所有文档 */ public ListDocument loadDirectory(String dirPath) { ListDocument documents new ArrayList(); Path dir Path.of(dirPath); try (var stream Files.walk(dir)) { stream.filter(Files::isRegularFile) .forEach(path - { try { String ext path.toString().toLowerCase(); if (ext.endsWith(.pdf)) { documents.add(PdfDocumentLoader.from(path.toString())); } else if (ext.endsWith(.docx)) { documents.add(WordDocumentLoader.from(path.toString())); } else if (ext.endsWith(.txt)) { documents.add(TextDocumentLoader.from(path.toString())); } } catch (IOException e) { log.warn(加载文件失败{}, path, e); } }); } catch (IOException e) { throw new RuntimeException(e); } return documents; }}7.3 添加 Agent 工具调用让 AI 能够调用外部 API如天气、计算器等Servicepublic class WeatherAgent { Tool(查询指定城市的天气) public String getWeather(P(城市名称) String city) { // 调用天气 API return 北京晴25°C东南风 2 级; } Tool(计算数学表达式) public double calculate(P(数学表达式) String expression) { // 使用脚本引擎计算 ScriptEngine engine new ScriptEngineManager() .getEngineByName(JavaScript); try { return ((Number) engine.eval(expression)).doubleValue(); } catch (ScriptException e) { return 0; } }}// 注册工具Servicepublic class AiAssistantService { Autowired private WeatherAgent weatherAgent; PostConstruct public void init() { this.assistant AiServices.builder(Assistant.class) .chatLanguageModel(chatLanguageModel) .contentRetriever(contentRetriever) .tools(weatherAgent) // 注册工具 .build(); }}// 使用// 用户问北京今天天气怎么样25 度加 10 度等于多少// AI 会自动调用 getWeather(北京) 和 calculate(2510)7.4 添加监控和日志Componentpublic class RagMetrics { private final MeterRegistry meterRegistry; private final Counter questionCounter; private final Timer responseTimer; public RagMetrics(MeterRegistry meterRegistry) { this.meterRegistry meterRegistry; this.questionCounter meterRegistry.counter(rag.questions.total); this.responseTimer meterRegistry.timer(rag.response.time); } public void recordQuestion() { questionCounter.increment(); } public T T recordResponse(SupplierT supplier) { return responseTimer.record(supplier); }}// 在 Service 中使用Servicepublic class AiAssistantService { Autowired private RagMetrics metrics; public String ask(String userId, String question) { metrics.recordQuestion(); return metrics.recordResponse(() - { // ... 原有逻辑 }); }}7.5 生产配置示例# application-prod.ymlserver: port: 8080spring: datasource: url: jdbc:postgresql://localhost:5432/rag_db username: rag_user password: ${DB_PASSWORD}langchain4j: dashscope: chat-model: api-key: ${DASHSCOPE_API_KEY} model-name: qwen-max temperature: 0.7 max-tokens: 2000 embedding-model: api-key: ${DASHSCOPE_API_KEY} model-name: text-embedding-v2# 连接池配置langchain4j: dashscope: connect-timeout: 30000 read-timeout: 60000# 日志配置logging: level: dev.langchain4j: INFO pattern: console: %d{yyyy-MM-dd HH:mm:ss} [%thread] %-5level %logger{36} - %msg%n总结与最佳实践8.1 学习路线回顾阶段内容关键代码理解 RAG检索增强生成原理问题→检索→增强→生成向量基础Embedding 向量化embeddingModel.embed(text)文档处理加载与分割DocumentSplitters.recursive(500, 50)向量存储存储与检索EmbeddingStore.add(),retrieve()AI 服务AiServices 抽象AiServices.builder().build()多轮对话记忆管理MessageWindowChatMemory8.2 最佳实践建议1. 文档分割策略推荐配置- 文本块大小300-800 字符- 重叠字符数30-100 字符- 按段落/句子边界分割2. 检索参数调优推荐配置- maxResults: 3-5返回结果数量- minScore: 0.5-0.7相似度阈值- 阈值过高会漏掉相关信息过低会引入噪声3. 提示词设计好的 RAG 提示词应包含- 明确的角色设定- 清晰的回答规则- 参考信息的明确标识- 处理不知道的情况4. 成本控制- 使用较小的嵌入模型text-embedding-v2- 合理设置 max-tokens 限制- 对常见问题使用缓存- 批量处理文档向量化8.3 常见问题与解决方案问题原因解决方案回答不准确检索结果不相关调整 minScore 阈值优化文档分割回答太简短提示词约束不足在系统提示词中要求详细回答响应速度慢向量检索慢使用向量数据库索引如 pgvector多轮对话丢失上下文记忆配置问题检查 MessageWindowChatMemory 配置8.4 后续扩展方向多模态 RAG支持图片、表格的检索混合检索结合关键词检索和向量检索知识图谱引入结构化知识增强Agent 编排使用多个 Agent 协同完成任务8.5 参考资源• LangChain4j 官方文档• LangChain4j GitHub• LangChain4j 示例代码• 阿里云 DashScope 文档• pgvector GitHub附录完整测试脚本#!/bin/bash# test-rag-apis.sh - RAG API 测试脚本BASE_URLhttp://localhost:8080echo 测试 1公司政策问答 curl -G $BASE_URL/api/ask \ --data-urlencode question公司的年假政策是什么echo -e \n\n 测试 2产品问答 curl -G $BASE_URL/api/ask \ --data-urlencode question智能客服系统多少钱echo -e \n\n 测试 3多轮对话 USER_IDtest-user-$(date %s)echo 第一轮询问产品功能curl -X POST $BASE_URL/api/ask \ -H Content-Type: application/json \ -d {\userId\: \$USER_ID\, \question\: \智能客服系统有什么功能\}echo -e \n\n第二轮追问价格curl -X POST $BASE_URL/api/ask \ -H Content-Type: application/json \ -d {\userId\: \$USER_ID\, \question\: \专业版多少钱\}echo -e \n\n 测试完成 2026年AI行业最大的机会毫无疑问就在应用层字节跳动已有7个团队全速布局Agent大模型岗位暴增69%年薪破百万腾讯、京东、百度开放招聘技术岗80%与AI相关……如今超过60%的企业都在推进AI产品落地而真正能交付项目的大模型应用开发工程师****却极度稀缺落地AI应用绝对不是写几个prompt调几个API就能搞定的企业真正需要的是能搞定这三项核心能力的人✅RAG融入外部信息修正模型输出给模型装靠谱大脑✅Agent智能体让AI自主干活通过工具调用Tools环境交互多步推理完成复杂任务。比如做智能客服等等……✅微调针对特定任务优化让模型适配业务目前脉脉上有超过1000家企业发布大模型相关岗位人工智能岗平均月薪7.8w实习生日薪高达4000远超其他行业收入水平技术的稀缺性才是你「值钱」的关键具备AI能力的程序员比传统开发高出不止一截有的人早就转行AI方向拿到百万年薪AI浪潮正在重构程序员的核心竞争力现在入场仍是最佳时机我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】⭐️从大模型微调到AI Agent智能体搭建剖析AI技术的应用场景用实战经验落地AI技术。从GPT到最火的开源模型让你从容面对AI技术革新大模型微调掌握主流大模型如DeepSeek、Qwen等的微调技术针对特定场景优化模型性能。学习如何利用领域数据如制造、医药、金融等进行模型定制提升任务准确性和效率。RAG应用开发深入理解检索增强生成Retrieval-Augmented Generation, RAG技术构建高效的知识检索与生成系统。应用于垂类场景如法律文档分析、医疗诊断辅助、金融报告生成等实现精准信息提取与内容生成。AI Agent智能体搭建学习如何设计和开发AI Agent实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等。如果你也有以下诉求快速链接产品/业务团队参与前沿项目构建技术壁垒从竞争者中脱颖而出避开35岁裁员危险期顺利拿下高薪岗迭代技术水平延长未来20年的新职业发展……那这节课你一定要来听因为留给普通程序员的时间真的不多了立即扫码即可免费预约「AI技术原理 实战应用 职业发展」「大模型应用开发实战公开课」还有靠谱的内推机会直聘权益完课后赠送大模型应用案例集、AI商业落地白皮书