PaperBanana-CN 学术配图助手

PaperBanana-CN 是一款基于开源项目PaperBanana改造的学术论文配图生成工具，用AI驱动，支持粘贴论文方法章节自动生成高质量学术配图。PaperBanana-CN 不需要复杂配置，大幅降低学术配图制作门槛，是科研人员、学生的论文辅助工具。

候选配图生成

只需粘贴论文的方法章节和图注，PaperBanana-CN就能自动生成多个候选配图供选择，由5个AI Agent协作完成全流程：

• 检索器：从参考库中查找类似图片，为生成提供参考。

• 规划器：将文字描述转化为清晰的图表描述。

• 风格化器：优化图片的学术美学风格，贴合学术论文规范。

• 可视化器：基于描述生成初始图像。

• 评审器：审查图像质量并提出改进建议。

评审器和可视化器会自动迭代3轮，逐步优化图表质量。生成功能支持并行产出1-20个候选方案，可选择21:9、16:9、3:2等宽高比，每个候选方案都能查看演化时间线，了解各阶段中间结果。生成后支持单张下载、ZIP批量下载或JSON完整结果导出。

图片精修功能

上传已生成的配图或任意图片，描述具体修改需求，就能生成2K/4K高分辨率版本。支持image-to-image编辑（基于原图修改）、纯文字描述重新生成两种模式，无论是调整细节、优化风格还是提升分辨率，都能快速实现，让配图质量更贴合学术发表标准。

智能检索

原版PaperBanana参考图检索需发送200篇论文全文，单次消耗约80万tokens，费用较高。PaperBanana-CN优化后默认仅发送图注，tokens消耗降至约3万，效果基本不变。

检索模式	Token消耗/候选	说明
auto	~3万	LLM智能匹配参考图，仅发送图注（推荐）
auto-full	~80万	发送完整论文文本，高精度但费用高
random	0	随机选10个参考，不调用API
none	0	不使用参考图

默认配置（5候选+auto检索）比原版省96%检索费用，界面会明确标注每种模式的费用提示，避免用户踩坑。

API支持和扩展

工具内置两种API提供商，开箱即用：

模式	说明	网络要求
Evolink（默认）	国内API代理，直连可用	无需翻墙
Google Gemini	Google官方API	需要科学上网

在界面侧边栏可一键切换API模式，模型名称会自动更新。工具与Evolink无商业关联，用户可自行集成智谱AI、通义千问、硅基流动、火山引擎等兼容OpenAI接口的API服务商，只需参照 providers/base.py 的接口实现 generate_text() 和 generate_image() 两个方法，参考 providers/evolink.py 的实现即可完成扩展。

PaperBanana-CN 安装和使用

第一步：获取API Key

• 推荐选择Evolink：前往 https://evolink.ai/dashboard/keys 注册获取。

• 也可选择Google Gemini：前往 https://aistudio.google.com/apikey 获取。

第二步：启动程序

• macOS用户：双击项目中的mac-start.command文件。

• Windows用户：双击win-start.bat文件。

Windows用户提示：若本地未安装Python，建议先打开Microsoft Store搜索“Python 3.12”安装，再运行脚本，避免自动安装耗时过长。

首次启动会自动完成以下操作（约2-3分钟）：

1、检测或自动安装Python（需≥3.10版本）。

2、创建虚拟环境。

3、安装所有依赖。

4、启动程序并自动打开浏览器。

后续启动仅需几秒即可完成。

第三步：可选操作——下载参考数据集

程序内置的“检索Agent”可从参考图库中找到相似学术配图提升生成质量，如需使用该功能： 1、前往PaperBananaBench下载数据集。

2、将下载内容放到项目的data/PaperBananaBench/目录下，目录结构如下：

data/
└── PaperBananaBench/
    ├── diagram/
    │   ├── images/        ← 论文配图图片
    │   ├── ref.json       ← 参考数据
    │   └── test.json
    └── plot/
        ├── images/        ← 论文图表图片
        ├── ref.json
        └── test.json

不下载数据集也能正常使用，只需在侧边栏将“检索设置”改为none，此时跳过参考图检索，不影响其他功能。

第四步：生成学术配图

1、在左侧边栏选择API提供商，填入获取的API Key。

2、切换到“生成候选方案”标签页。

3、粘贴论文方法章节内容+图注。

4、点击“生成候选方案”，等待几分钟。

5、从生成的多个候选图中挑选满意的进行下载。

侧边栏设置说明

工具侧边栏提供丰富的自定义设置选项，可根据需求调整参数：

设置项	说明
API Provider	选择Evolink（国内直连）或Gemini（需翻墙）
API Key	填入对应API提供商的密钥
文本模型	用于规划/评审的模型（默认gemini-2.5-flash）
图像模型	用于生成图片的模型（默认nano-banana-2-lite）
流水线模式	demo_planner_critic（快速）或demo_full（含风格化，更美观）
检索设置	auto/auto-full/random/none，对应不同检索模式
候选方案数量	1-20个，建议选择3-5个平衡效率与质量
宽高比	可选21:9/16:9/3:2
最大评审轮次	1-5轮，默认3轮