2026-06-29
按住下方图标,点击小程序
免费领取AI学习资料、精选提示词

搞科研、写论文的朋友们,你们是不是也经历过这种崩溃时刻?
好不容易在知网或者 arXiv 上下载了十几篇核心参考文献,兴致勃勃地准备大干一场。结果一打开 PDF,心态直接裂开。
双栏排版把文字切得支离破碎,读起来还要自己在脑子里重新拼图;好不容易有个重要的数据表格,偏偏跨页了,上一半在上一页,下一半在下一页,复制下来全是乱序。
要命的是那些数学公式,在 PDF 里看着挺正常,一粘贴到 Word 或者 Latex 里,直接变成一堆火星文。
今天必须得好好介绍一下MinerU,这个超过71000星,曾经拿过github每日最佳的重磅开源来解决大家的难题。
最爽的是,MinerU还支持0部署在线使用和桌面客户端,小白也能直接上手。


开源地址:https://github.com/opendatalab/mineru
在线:https://mineru.net/OpenSourceTools/Extractor
简单来说,MinerU就是帮你把复杂文档变成大模型看得懂的Markdown或JSON。
就像给文档做了个翻译,从人类阅读的格式翻译成 AI 能理解的格式,而且翻得很完整,连公式、表格、多栏排版这些复杂的结构都能处理。
功能展示
咱们细说下MinerU到底都能干点啥。
先说支持格式PDF、Word、PowerPoint、Excel、图片、网页统统没问题,一百多种语言都能识别。这个覆盖范围已经相当惊人了。
公式转换这块真的让人眼前一亮,所有数学公式都能自动变成 LaTeX 格式,大模型最喜欢这种表达方式了。
表格处理也特别溜,不仅把表格变成 HTML 格式,还能自动合并跨页的表格,读起来就像一张完整的表,不会因为分页就断掉。

多栏排版之前一直是文档解析的噩梦,MinerU 能够按照人类阅读的顺序重新组织内容,自动去掉页眉页脚这些干扰信息。就像有个老练的编辑帮你把文章整理得井井有条。
OCR 识别用了双引擎技术,一个负责精确识别,一个负责整体理解,结合在一起准确率就特别高,连手写字都能认得出来,一百多种语言都支持。

兼容性也非常强,跟主流的 AI 开发工具对接基本丝滑对接。
登录/注册后继续阅读
立即登录/注册 >