科学工具
科学工具让世界更美好
让世界更美好

PaperBanana-CN 学术配图助手

PaperBanana-CN 是一款基于开源项目PaperBanana改造的学术论文配图生成工具,用AI驱动,支持粘贴论文方法章节自动生成高质量学术配图。PaperBanana-CN 不需要复杂配置,大幅降低学术配图制作门槛,是科研人员、学生的论文辅助工具。

候选配图生成

只需粘贴论文的方法章节和图注,PaperBanana-CN就能自动生成多个候选配图供选择,由5个AI Agent协作完成全流程:

• 检索器:从参考库中查找类似图片,为生成提供参考。

• 规划器:将文字描述转化为清晰的图表描述。

• 风格化器:优化图片的学术美学风格,贴合学术论文规范。

• 可视化器:基于描述生成初始图像。

• 评审器:审查图像质量并提出改进建议。

评审器和可视化器会自动迭代3轮,逐步优化图表质量。生成功能支持并行产出1-20个候选方案,可选择21:9、16:9、3:2等宽高比,每个候选方案都能查看演化时间线,了解各阶段中间结果。生成后支持单张下载、ZIP批量下载或JSON完整结果导出。

图片精修功能

上传已生成的配图或任意图片,描述具体修改需求,就能生成2K/4K高分辨率版本。支持image-to-image编辑(基于原图修改)、纯文字描述重新生成两种模式,无论是调整细节、优化风格还是提升分辨率,都能快速实现,让配图质量更贴合学术发表标准。

智能检索

原版PaperBanana参考图检索需发送200篇论文全文,单次消耗约80万tokens,费用较高。PaperBanana-CN优化后默认仅发送图注,tokens消耗降至约3万,效果基本不变。

检索模式 Token消耗/候选 说明
auto ~3万 LLM智能匹配参考图,仅发送图注(推荐)
auto-full ~80万 发送完整论文文本,高精度但费用高
random 0 随机选10个参考,不调用API
none 0 不使用参考图

默认配置(5候选+auto检索)比原版省96%检索费用,界面会明确标注每种模式的费用提示,避免用户踩坑。

API支持和扩展

工具内置两种API提供商,开箱即用:

模式 说明 网络要求
Evolink(默认) 国内API代理,直连可用 无需翻墙
Google Gemini Google官方API 需要科学上网

在界面侧边栏可一键切换API模式,模型名称会自动更新。工具与Evolink无商业关联,用户可自行集成智谱AI、通义千问、硅基流动、火山引擎等兼容OpenAI接口的API服务商,只需参照 providers/base.py 的接口实现 generate_text()generate_image() 两个方法,参考 providers/evolink.py 的实现即可完成扩展。

PaperBanana-CN 安装和使用

第一步:获取API Key

• 推荐选择Evolink:前往 https://evolink.ai/dashboard/keys 注册获取。

• 也可选择Google Gemini:前往 https://aistudio.google.com/apikey 获取。

第二步:启动程序

• macOS用户:双击项目中的mac-start.command文件。

• Windows用户:双击win-start.bat文件。

Windows用户提示:若本地未安装Python,建议先打开Microsoft Store搜索“Python 3.12”安装,再运行脚本,避免自动安装耗时过长。

首次启动会自动完成以下操作(约2-3分钟):

1、检测或自动安装Python(需≥3.10版本)。

2、创建虚拟环境。

3、安装所有依赖。

4、启动程序并自动打开浏览器。

后续启动仅需几秒即可完成。

第三步:可选操作——下载参考数据集

程序内置的“检索Agent”可从参考图库中找到相似学术配图提升生成质量,如需使用该功能: 1、前往PaperBananaBench下载数据集。

2、将下载内容放到项目的data/PaperBananaBench/目录下,目录结构如下:

data/
└── PaperBananaBench/
    ├── diagram/
    │   ├── images/        ← 论文配图图片
    │   ├── ref.json       ← 参考数据
    │   └── test.json
    └── plot/
        ├── images/        ← 论文图表图片
        ├── ref.json
        └── test.json

不下载数据集也能正常使用,只需在侧边栏将“检索设置”改为none,此时跳过参考图检索,不影响其他功能。

第四步:生成学术配图

1、在左侧边栏选择API提供商,填入获取的API Key。

2、切换到“生成候选方案”标签页。

3、粘贴论文方法章节内容+图注。

4、点击“生成候选方案”,等待几分钟。

5、从生成的多个候选图中挑选满意的进行下载。

侧边栏设置说明

工具侧边栏提供丰富的自定义设置选项,可根据需求调整参数:

设置项 说明
API Provider 选择Evolink(国内直连)或Gemini(需翻墙)
API Key 填入对应API提供商的密钥
文本模型 用于规划/评审的模型(默认gemini-2.5-flash)
图像模型 用于生成图片的模型(默认nano-banana-2-lite)
流水线模式 demo_planner_critic(快速)或demo_full(含风格化,更美观)
检索设置 auto/auto-full/random/none,对应不同检索模式
候选方案数量 1-20个,建议选择3-5个平衡效率与质量
宽高比 可选21:9/16:9/3:2
最大评审轮次 1-5轮,默认3轮

手动安装方法(可选)

若一键脚本运行出现问题,可通过以下步骤手动安装:

1、确保已安装Python 3.10+,可通过python3 --version命令查看版本。

2、创建虚拟环境:python3 -m venv .venv

3、激活虚拟环境:

• macOS/Linux:source .venv/bin/activate

• Windows:.venv\Scripts\activate

4、安装依赖:pip install -r requirements.txt

5、启动程序:streamlit run demo.py --server.port 8501

6、浏览器打开 http://localhost:8501 即可使用。