是论文方式流程图取模子布局示企图,来自北大 +GoogleCloud AI Research 的团队,第一类,却给人一种「能看懂,
研究指出,但不顶用啊。分歧模块之间的层级关系也不敷清晰。取以往「只会绘图像」的生成模子分歧,全体不雅感较着更接近顶会论文中常见的尺度范式。图中的逻辑被从头梳理进一套更规范的视觉系统之中。
将来科研可能变成如许:你不消再正在 PPT 里对齐箭头、调颜色、再生成统计图。以及通过代码驱动生成的高精度统计图。它们的配合特点正在于逻辑复杂、元素稠密,目前最靠谱的体例仍是:AI 写画图代码(基于 Gemini-3-Pro),但不都雅」的感受:结构略显松散,
消息更精辟,PaperBanana 强调两点:不是只需「画得都雅」,PaperBanana 实正做到了「画清晰、讲大白」,研究人员还顺带对比了两种线:间接让模子「绘图」VS 让模子「写代码绘图」。PaperBanana 能够笼盖多种常见学术插图类型,给它一张草图或第一版框图,模块分区更清晰。未经调教的原始模子生成(Nano-Banana-Pro),用来申明算法若何运做(左);PaperBanana 润色增后,颠末多轮迭代后!
AI 画 Figure,它担任从动美化、沉排结构、同一气概,用来表达尝试成果取数据对比(左边)。包罗方式流程图、模子布局示企图、概念性框架图,它们画出来的图往往是:模块和文字对不上、字体间接乱码、箭头逻辑错误。那么,也恰是科研人员最容易正在“绘图”上耗损大量时间取精神的部门。水准呢?间接投顶会的那种。图是「都雅」,而是必需「画得准确」。问题来了:现正在的大模子曾经能写论文、跑尝试、改代码,它要:模块之间的逻辑关系不犯错、数据表达合适科研规范、图能够间接办事论文叙事,PaperBanana「画论文图」变成了一条由多智能体协做完成的流水线。
箭头的也愈加明白,而不是粉饰。让它更像顶会论文里的尺度图形这些示例笼盖了多个典型科研场景,方针很简单也很狂:你写方式,而是一张同时满脚语义准确性取顶会审美尺度的论文级插图。
*请认真填写需求信息,我们会在24小时内与您取得联系。