起因一次让我抓狂的文档解析经历上周我有一个任务几十个项目答辩材料堆在飞书多维表格里格式混杂PDF Word PPT需要逐一解析、提取信息、做评审打分。我第一反应是交给 Claude Code。然后噩梦开始了Claude Code 自作主张安装了系统默认解析工具200 页的 PDF它只解析了前 10 页输出的分析结果看起来很完整——但实际上基于残缺信息我完全没有感知到问题直到翻看原文才发现这就是最危险的情况不是报错而是静默失败。后来我接入了 MinerU MCP重跑了一遍。两次结果差距大到让人无法接受。这篇文章记录这套工作流以及我踩过的所有坑。先搞清楚为什么 Claude Code 默认不用好工具这是一个很少被讨论的问题。当你让 Claude Code 处理文档时它会在自己的知识库里找合适的工具。问题是MarkItDown微软出品知名度高Claude 经常主动选它DoclingIBM 出品HuggingFace 描述写得好Claude 容易识别MinerU解析质量最强但在 Claude 的工具推荐权重里存在感不够不是 MinerU 不好是它还没有充分出现在 AI 的训练数据和工具推荐路径里。这就是为什么我们需要主动配置 MCP把 MinerU 放进 Claude 的工具箱。第一步5 分钟接入 MinerU MCP什么是 MCPMCPModel Context Protocol是让 AI 直接调用外部工具的协议。配置完成后Claude Code 遇到文档任务会主动调用 MinerU而不是用它自己找的随机工具。配置方法Claude Desktop打开 设置 → MCP Servers添加{ mcpServers: { mineru: { command: uvx, args: [mineru-open-mcp], env: { MINERU_API_TOKEN: your-token } } } }Cursor / Cline / Windsurf在项目根目录创建对应配置文件内容相同。Token 说明模式Token限制适合场景Flash不需要20页 / 10MB快速测试、短文档Precision需要免费申请无限制学术论文、财报、大文件申请地址https://mineru.net/apiManage/token免费注册即可获得额度验证成功重启工具后在对话里输入列出当前可用的 MCP 工具看到 mineru 出现即配置成功。MinerU 2.5背后跑的是什么MinerU MCP 调用的是最新的 MinerU2.5——一个 1.2B 参数的视觉语言模型专为文档解析设计。在 OmniDocBench 综合评测中排名第一超过 GPT-4o。三个关键突破直接对应你在实际使用中会遇到的痛点 全文完整解析不截断系统默认工具遇到大文件会自动截断MinerU2.5 专门优化了长文档处理200 页照样完整输出。 公式还原质量 SOTA复杂数学公式、中英混合公式输出为标准 LaTeX 格式。学术论文审稿的核心需求。 复杂表格全覆盖旋转表格、无边框表格、缺边框表格——以前各种工具翻车的地方MinerU2.5 稳定输出。核心 Prompt 技巧让 Claude Code 用对工具这是最容易被忽略、但最关键的部分。❌ 容易失效的写法帮我分析这份 PDFClaude 可能用任何它觉得合适的工具。✅ 明确指定的写法请使用 MinerU MCP 工具解析这份 PDF 完整提取全文包括最后一页 然后帮我分析...✅ 更自然、描述需求的写法我需要高质量解析这份 200 页的财报 要求公式完整、表格结构清晰、全文不截断。 解析完成后告诉我总页数确认全文都已获取再开始分析。✅ 在 Claude 项目里设置系统提示一劳永逸在 Claude Desktop 的项目里加入当用户需要解析 PDF/Word/PPT 文档时 始终优先使用 MinerU MCP 工具。 确保完整解析全文不要只处理前几页。 解析完成后主动确认总页数。配置一次之后对话里不需要每次都强调。实战场景一项目评审50 份文档批量处理背景 飞书多维表格里有几十个项目每行包含项目介绍和答辩材料附件PDF/Word/PPT 混杂。完整 Prompt我需要评审以下项目答辩材料请帮我逐一处理 文件列表 - 项目A_答辩材料.pdf预计 50 页 - 项目B_技术报告.docx - 项目C_路演PPT.pptx ...共 20 份 处理步骤 1. 用 MinerU 完整解析每份文档必须解析全文不能截断 2. 解析完成后先报告每份文档的总页数确认完整性 3. 从每份中提取 - 项目名称和核心方向1-2句 - 技术方案关键技术点 - 团队背景 - 预期成果或已有数据 4. 按以下维度打分1-10分 - 创新性 - 技术可行性 - 商业价值 - 团队匹配度 5. 最终输出一份汇总表格 注意每份文档必须完整解析这是评审的基础请不要跳过任何页面。实际效果对比--不用MinerU用MinerU解析完整度前10页5%全文100%公式识别乱码 / 跳过完整LaTeX分析结论⚠️ 基于5%内容✅ 基于全文你的决策质量❌ 基于残缺信息✅ 可靠实战场景二学术论文审稿背景 收到投稿论文PDF需要快速做初审判断。核心痛点 论文里的公式是判断研究质量的关键但 Claude 直读 PDF 时公式经常变乱码。Prompt 模板请用 MinerU 解析这篇论文[paper.pdf] 这是一篇关于 [领域] 的论文审稿重点在 1. 方法论创新性重点看 Section 3-4 的公式推导 2. 实验设计严谨性提取所有对比实验表格 3. 与已有工作的差异 解析完成后请 1. 先列出论文结构章节标题 2. 提取摘要、核心方法、主要实验结果 3. 找出所有数据对比表格逐一解读 4. 给出 300 字审稿意见包括优点、不足和建议为什么 MinerU 在这个场景特别重要论文里的公式是核心内容解析质量直接影响审稿质量MinerU2.5 的公式识别达到 SOTA输出为 LaTeXClaude 可以完整理解和分析普通 PDF 解析工具遇到复杂公式基本报废实战场景三财报 / 合同批量对比分析背景 多份季报或合同文件需要提取关键数据做横向对比。Prompt 模板请用 MinerU 依次解析以下三份财报Precision 模式确保表格完整 - 2024Q1_财报.pdf - 2024Q2_财报.pdf - 2024Q3_财报.pdf 每份提取 - 营业收入绝对值 同比增速 - 净利润绝对值 利润率 - 毛利率 - 研发投入及占比 - 管理层展望关键词 输出格式 1. 三期数据对比表格 2. 核心趋势分析200字 3. 需要重点关注的异常项关键提示 财报里的数据表格经常是复杂格式跨行合并、带批注普通工具解析后列数据会错位。MinerU2.5 的表格鲁棒性专门针对这类情况做了优化。实战场景四RAG 知识库搭建如果你需要把文档导入知识库而不是一次性分析MinerU 有官方的 LangChain 和 LlamaIndex 集成LangChainfrom langchain_mineru import MinerULoader from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_openai import OpenAIEmbeddings from langchain_community.vectorstores import FAISS # 高质量解析 docs MinerULoader( sourcetechnical_manual.pdf, modeprecision, tokenyour-token, formulaTrue, # 保留公式 tableTrue # 保留表格结构 ).load() # 切分 向量化 chunks RecursiveCharacterTextSplitter( chunk_size1200, chunk_overlap200 ).split_documents(docs) vectorstore FAISS.from_documents(chunks, OpenAIEmbeddings()) results vectorstore.similarity_search(安装要求, k3)LlamaIndexfrom llama_index.readers.mineru import MinerUReader from llama_index.core import VectorStoreIndex docs MinerUReader( modeprecision, tokenyour-token, ocrTrue, formulaTrue, tableTrue ).load_data(paper.pdf) index VectorStoreIndex.from_documents(docs) response index.as_query_engine().query(核心方法是什么) print(response)和 MCP 方式的区别MCP 方式SDK 方式适合场景一次性分析任务需要持久化的知识库使用门槛极低对话直接用需要写代码集成灵活性依赖 AI 工具完全可编程典型场景项目评审、论文审稿RAG 系统、文档问答进阶与 OpenClaw 结合使用如果你在用 OpenClaw或类似的 AI 助手平台MinerU Skill 可以实现更自动化的工作流场景定时处理飞书多维表格里的新文档每天 9:00 检查飞书多维表格「项目库」 → 找到「解析状态」为空的行 → 下载对应附件PDF/Word/PPT → 调用 MinerU 解析 → 提取项目简介、核心亮点 → 写回多维表格对应列 → 标记「解析状态」为完成常见问题QFlash 模式 20 页限制怎么办对于大文件申请 Token 使用 Precision 模式。Token 免费注册即有额度。Q如何确认 Claude Code 真的用了 MinerU 而不是别的工具**在 Prompt 里加一句完成后告诉我使用了哪个工具进行解析。或者在 Claude Desktop 里打开工具调用日志查看。QWord / PPT 也支持吗支持。MinerU MCP 支持 PDF / Word / PPT 多种格式对应真实工作场景里的混合文件。Q解析速度怎么样- Flash 模式通常 10-30 秒- Precision 模式视文件大小一般 30 秒 - 2 分钟- vllm 自部署A100 上 2.12 fps200 页约 1.5 分钟总结如果你的场景是...推荐配置偶尔分析几份文档Flash 模式 Claude Desktop MCP经常处理学术论文Precision 模式开 formulaTrue批量处理大量文件Precision 模式 明确 Prompt 要求完整解析需要知识库长期查询langchain-mineru 或 llama-index-readers-mineru自动化工作流OpenClaw MinerU Skill相关链接- MCP 配置https://mcp.so 搜索 MinerU- 在线 Demohttps://mineru.net/OpenSourceTools/Extractor- Token 申请https://mineru.net/apiManage/token- GitHubhttps://github.com/opendatalab/MinerU- 技术报告https://arxiv.org/abs/2509.22186你现在可以做一件事打开 Claude Desktop5分钟配置 MinerU MCP。下次让 Claude Code 处理文档时它会用对工具。就这一个改变值得你读完这篇文章。