MinerU 系列教程 第七篇本篇教程将深入 Hybrid 后端的混合推理策略。在前两课中,我们分别剖析了 Pipeline 后端(7+ 专用模型流水线)和 VLM 后端(一个模型端到端),本课将揭示如何将两者的优势融合 —— 用 VLM 完成版面检测和内容提取,再用 Pipeline 的专用模型对文本和公式进行精炼。你将看到两种工作模式如何根据文档特征自动切换,以及 Hybrid MagicModel 如何将混合结果统一转换为标准 Middle JSON。学习目标完成本课学习后,你将能够:理解 Hybrid 后端的核心价值:取 VLM 和 Pipeline 两家之长掌握两种工作模式:VLM OCR 完全模式与 Pipeline 混合模式理解模式切换决策函数_should_enable_vlm_ocr()的判断逻辑了解MineruHybridModel的精简模型组合(OCR + Layout + MFR)掌握 Pipeline 混合模式中 VLM 检测 + Pipeline OCR/公式识别的协作流程理解 Hybrid MagicModel 如何融合 VLM 块、OCR 结果、行内公式为统一的块结构读懂hybrid_analyze.py、hybrid_magic_model.py、hybri