MinerU

开源

开发者：上海人工智能实验室

上海AI实验室开源的PDF智能提取工具，精准识别表格公式转Markdown

访问官网

AI办公 AI 角色大语言模型 (LLMs)

MinerU是什么？

MinerU是由上海AI实验室开源的一款高精度PDF文档智能提取工具，专为大模型训练和RAG应用打造。它能精准识别复杂排版、表格与数学公式，并一键转换为结构化Markdown格式。相比传统OCR工具，MinerU在学术文献和技术文档处理上表现卓越，支持多语言及内置翻译功能，完全开源免费，是科研人员与AI开发者处理非结构化数据的得力助手。

MinerU主要功能

✅️ 高精度版面分析

采用先进视觉模型精准解析PDF复杂排版，自动区分标题、段落、图表及页眉页脚，还原真实阅读逻辑结构。

✅️ 表格与公式识别

针对学术论文优化，能完美还原跨页表格与复杂数学公式为LaTeX或Markdown代码，解决传统工具乱码痛点。

✅️ 一键转换Markdown

将非结构化PDF文档批量转化为高质量结构化Markdown文本，直接适配主流大语言模型微调与知识库构建需求。

✅️ 多语言支持与翻译

原生支持中英日韩等多种语言文档识别，并内置智能翻译模块，可在提取过程中同步完成跨语言内容转换。

MinerU收费策略

MinerU作为上海AI实验室主导的开源项目，核心代码与模型权重均免费开放。用户可本地部署使用全部功能，无需支付任何许可费用，同时也提供云端API服务供企业按需调用。

MinerU使用场景

学术文献数字化：批量处理海量科研论文PDF，精准提取摘要、实验数据与参考文献，助力学术知识库自动化建设与管理。

RAG知识库构建：将企业技术手册与行业报告转为结构化语料，大幅提升检索增强生成系统的召回准确率与回答质量。

大模型预训练清洗：从互联网公开PDF中高效提取高质量文本数据，过滤噪声与乱码，为大模型训练提供优质语料素材。

跨语言文档处理：快速提取外文技术资料并同步翻译为中文Markdown，帮助研发团队零障碍获取全球前沿技术信息。

MinerU常见问题

MinerU支持哪些操作系统？
MinerU支持Windows、macOS及Linux主流发行版，推荐使用Linux环境以获得最佳性能与兼容性体验。
处理扫描件PDF效果如何？
MinerU内置高精度OCR引擎，对扫描版PDF有良好识别能力，但清晰度越高效果越好，建议分辨率不低于300DPI。
是否支持批量处理文件？
支持命令行批量模式，可指定文件夹路径自动遍历处理所有PDF文件，适合大规模文档数字化任务场景。
提取结果能否保留原始图片？
可以，MinerU在转换时会同步提取文档内嵌图片并按顺序命名保存，同时在Markdown中以相对路径引用。
本地部署需要GPU吗？
强烈建议使用NVIDIA GPU加速推理，纯CPU模式虽可运行但速度较慢，处理百页以上文档时效率差距显著。

学AI用AI，51智学网