71k star霸榜Github!这个PDF转换王炸,把学生、科研党从杂乱文献里救出来了

2026-06-29

按住下方图标,点击小程序

免费领取AI学习资料、精选提示词

图片

搞科研、写论文的朋友们,你们是不是也经历过这种崩溃时刻?

好不容易在知网或者 arXiv 上下载了十几篇核心参考文献,兴致勃勃地准备大干一场。结果一打开 PDF,心态直接裂开。

双栏排版把文字切得支离破碎,读起来还要自己在脑子里重新拼图;好不容易有个重要的数据表格,偏偏跨页了,上一半在上一页,下一半在下一页,复制下来全是乱序。

要命的是那些数学公式,在 PDF 里看着挺正常,一粘贴到 Word 或者 Latex 里,直接变成一堆火星文。

今天必须得好好介绍一下MinerU,这个超过71000星,曾经拿过github每日最佳的重磅开源来解决大家的难题。

最爽的是,MinerU还支持0部署在线使用和桌面客户端,小白也能直接上手。

开源地址:https://github.com/opendatalab/mineru

在线:https://mineru.net/OpenSourceTools/Extractor

简单来说,MinerU就是帮你把复杂文档变成大模型看得懂的MarkdownJSON

就像给文档做了个翻译,从人类阅读的格式翻译成 AI 能理解的格式,而且翻得很完整,连公式、表格、多栏排版这些复杂的结构都能处理。

功能展示

咱们细说下MinerU到底都能干点啥。

先说支持格式PDFWordPowerPointExcel、图片、网页统统没问题,一百多种语言都能识别。这个覆盖范围已经相当惊人了。

公式转换这块真的让人眼前一亮,所有数学公式都能自动变成 LaTeX 格式,大模型最喜欢这种表达方式了。

表格处理也特别溜,不仅把表格变成 HTML 格式,还能自动合并跨页的表格,读起来就像一张完整的表,不会因为分页就断掉。

多栏排版之前一直是文档解析的噩梦,MinerU 能够按照人类阅读的顺序重新组织内容,自动去掉页眉页脚这些干扰信息。就像有个老练的编辑帮你把文章整理得井井有条。

OCR 识别用了双引擎技术,一个负责精确识别,一个负责整体理解,结合在一起准确率就特别高,连手写字都能认得出来,一百多种语言都支持。

兼容性也非常强,跟主流的 AI 开发工具对接基本丝滑对接。

确定要退出登录吗?
确定 取消