北大、谷歌推出PaperBanana,AI一键自动生成科研插图

2026-02-07

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

北京大学和谷歌云研究人员,联合推出了重磅框架PaperBanana,直接把科研插图生成这件苦差事给自动化了。

以前做学术研究最头疼的莫过于写完论文还要花好几天画方法论图、统计图表,专业设计工具门槛高不说,还得反复修改贴合期刊风格。

现在有了PaperBanana,只要把论文里的方法描述和想要的图注输进去,它就能自动生成符合顶会标准的插图。

即将开源地址:https://github.com/dwzhu-pku/PaperBanana

下面这些科研论文图表都是PaperBanana自动生成的,感觉和人工制作的几乎没有任何区别了。

以前大家要么用代码画,比如TikZPython-PPTX这些工具,虽然精准但想画点自定义图标或者复杂结构就特别费劲。

要么用图像生成模型,但生成的图总觉得不够学术,要么逻辑不对要么风格跑偏。

PaperBanana的核心思路特别好理解,就像组建了一个专属的AI设计团队,五个智能体各司其职又互相配合,一步步把文字变成高质量插图。

检索器:找对参考少走弯路

这个模块就像团队里的资料搜集员,拿到你的需求后,先从海量顶会论文里找出最像的参考图。

它不是瞎找,而是精准匹配研究领域和图表类型,比如你要画智能体相关的框架图,它就专门找同类型的参考,重点看人家的结构和风格,而不是只看文字相似度。

有了这些参考,后面生成的图就不会偏离学术规范。

规划器:把复杂方法拆成画图脚本

规划器是整个团队的大脑,它的工作是把论文里晦涩的方法描述,翻译成图像生成模型能看懂的画图脚本。

比如研究里有几个核心模块,模块之间怎么连接,数据怎么流动,这些关键信息它都能精准提炼出来,还会参考之前找到的例子,确保逻辑不跑偏。这一步就像把复杂的菜谱拆解成一步步简单的操作,让后续画图环节能精准落地。

样式器:给插图加顶会滤镜

样式器就像专业设计师,专门负责让插图看起来更学术。它会自动分析大量顶会论文的插图风格,总结出一套美学准则,比如用什么颜色搭配、选什么形状的模块、线条怎么画才规范。

不管你原始描述多简单,它都能按照学术期刊的审美来优化,让生成的图一看就很专业,不会有花里胡哨不符合规范的设计。

可视化器+批评家:反复打磨直到完美

这两个模块是一对黄金搭档,负责把脚本变成图像还不断优化。可视化器相当于绘图师,根据前面的优化描述生成初始插图;批评家就像审稿人,仔细检查生成的图有没有问题。

比如是不是和原文逻辑一致、有没有视觉瑕疵,发现问题就提出修改意见,让可视化器重新生成。

这个过程默认会重复三次,就像我们画图时反复修改一样,确保最终结果又准又好看。

值得一提的是,针对统计图表这种对数据精度要求高的情况,PaperBanana还专门做了适配,会生成可执行的代码来渲染图表,这样就不会出现数值不准的问题,比纯图像生成靠谱多了

确定要退出登录吗?
确定 取消
推广有奖