MinerU 系列教程 第十八篇本篇教程作为模块五:原理篇 - 数据流与中间格式的第二课,将深入剖析 MinerU 的 Magic Model 转换层。每种后端都有一个专属的 Magic Model,负责将各自的原始输出标准化为上一课学习的 Middle JSON 块结构。本课将揭示四个版本的 Magic Model 在块类型映射、坐标转换、内容处理和结构组织上的具体实现差异。学习目标完成本课学习后,你将能够:理解 Magic Model 在 MinerU 架构中的统一职责掌握 Pipeline Magic Model 基于 Layout 检测结果的标准化流程了解 VLM Magic Model 如何处理归一化坐标与行内公式提取理解 Hybrid Magic Model 融合 VLM 内容与 Pipeline Span 填充的双模式设计掌握 Office Magic Model 基于 DOCX 原生结构的解析机制对比四个版本的设计差异与共同模式一、Magic Model 的统一职责1.1 转换层定位Magic Model 是 MinerU 架构中的标准化层,位于原始模型输出和 Midd