PaperBanana-CN 是一款基于开源项目PaperBanana改造的学术论文配图生成工具,用AI驱动,支持粘贴论文方法章节自动生成高质量学术配图。PaperBanana-CN 不需要复杂配置,大幅降低学术配图制作门槛,是科研人员、学生的论文辅助工具。
只需粘贴论文的方法章节和图注,PaperBanana-CN就能自动生成多个候选配图供选择,由5个AI Agent协作完成全流程:
• 检索器:从参考库中查找类似图片,为生成提供参考。
• 规划器:将文字描述转化为清晰的图表描述。
• 风格化器:优化图片的学术美学风格,贴合学术论文规范。
• 可视化器:基于描述生成初始图像。
• 评审器:审查图像质量并提出改进建议。
评审器和可视化器会自动迭代3轮,逐步优化图表质量。生成功能支持并行产出1-20个候选方案,可选择21:9、16:9、3:2等宽高比,每个候选方案都能查看演化时间线,了解各阶段中间结果。生成后支持单张下载、ZIP批量下载或JSON完整结果导出。
上传已生成的配图或任意图片,描述具体修改需求,就能生成2K/4K高分辨率版本。支持image-to-image编辑(基于原图修改)、纯文字描述重新生成两种模式,无论是调整细节、优化风格还是提升分辨率,都能快速实现,让配图质量更贴合学术发表标准。
原版PaperBanana参考图检索需发送200篇论文全文,单次消耗约80万tokens,费用较高。PaperBanana-CN优化后默认仅发送图注,tokens消耗降至约3万,效果基本不变。
| 检索模式 | Token消耗/候选 | 说明 |
|---|---|---|
| auto | ~3万 | LLM智能匹配参考图,仅发送图注(推荐) |
| auto-full | ~80万 | 发送完整论文文本,高精度但费用高 |
| random | 0 | 随机选10个参考,不调用API |
| none | 0 | 不使用参考图 |
默认配置(5候选+auto检索)比原版省96%检索费用,界面会明确标注每种模式的费用提示,避免用户踩坑。
工具内置两种API提供商,开箱即用:
| 模式 | 说明 | 网络要求 |
|---|---|---|
| Evolink(默认) | 国内API代理,直连可用 | 无需翻墙 |
| Google Gemini | Google官方API | 需要科学上网 |
在界面侧边栏可一键切换API模式,模型名称会自动更新。工具与Evolink无商业关联,用户可自行集成智谱AI、通义千问、硅基流动、火山引擎等兼容OpenAI接口的API服务商,只需参照 providers/base.py 的接口实现 generate_text() 和 generate_image() 两个方法,参考 providers/evolink.py 的实现即可完成扩展。
• 推荐选择Evolink:前往 https://evolink.ai/dashboard/keys 注册获取。
• 也可选择Google Gemini:前往 https://aistudio.google.com/apikey 获取。
• macOS用户:双击项目中的mac-start.command文件。
• Windows用户:双击win-start.bat文件。
Windows用户提示:若本地未安装Python,建议先打开Microsoft Store搜索“Python 3.12”安装,再运行脚本,避免自动安装耗时过长。
首次启动会自动完成以下操作(约2-3分钟):
1、检测或自动安装Python(需≥3.10版本)。
2、创建虚拟环境。
3、安装所有依赖。
4、启动程序并自动打开浏览器。
后续启动仅需几秒即可完成。
程序内置的“检索Agent”可从参考图库中找到相似学术配图提升生成质量,如需使用该功能: 1、前往PaperBananaBench下载数据集。
2、将下载内容放到项目的data/PaperBananaBench/目录下,目录结构如下:
data/
└── PaperBananaBench/
├── diagram/
│ ├── images/ ← 论文配图图片
│ ├── ref.json ← 参考数据
│ └── test.json
└── plot/
├── images/ ← 论文图表图片
├── ref.json
└── test.json
不下载数据集也能正常使用,只需在侧边栏将“检索设置”改为none,此时跳过参考图检索,不影响其他功能。
1、在左侧边栏选择API提供商,填入获取的API Key。
2、切换到“生成候选方案”标签页。
3、粘贴论文方法章节内容+图注。
4、点击“生成候选方案”,等待几分钟。
5、从生成的多个候选图中挑选满意的进行下载。
工具侧边栏提供丰富的自定义设置选项,可根据需求调整参数:
| 设置项 | 说明 |
|---|---|
| API Provider | 选择Evolink(国内直连)或Gemini(需翻墙) |
| API Key | 填入对应API提供商的密钥 |
| 文本模型 | 用于规划/评审的模型(默认gemini-2.5-flash) |
| 图像模型 | 用于生成图片的模型(默认nano-banana-2-lite) |
| 流水线模式 | demo_planner_critic(快速)或demo_full(含风格化,更美观) |
| 检索设置 | auto/auto-full/random/none,对应不同检索模式 |
| 候选方案数量 | 1-20个,建议选择3-5个平衡效率与质量 |
| 宽高比 | 可选21:9/16:9/3:2 |
| 最大评审轮次 | 1-5轮,默认3轮 |
若一键脚本运行出现问题,可通过以下步骤手动安装:
1、确保已安装Python 3.10+,可通过python3 --version命令查看版本。
2、创建虚拟环境:python3 -m venv .venv。
3、激活虚拟环境:
• macOS/Linux:source .venv/bin/activate。
• Windows:.venv\Scripts\activate。
4、安装依赖:pip install -r requirements.txt。
5、启动程序:streamlit run demo.py --server.port 8501。
6、浏览器打开 http://localhost:8501 即可使用。
PowerPoint演示文稿智能生成工具 PowerPoint Slides Skill
金融 AI 新工具 FinClaw,免费提供1000+ 金融专属Skills
PPT Agent 演示文稿生成框架
端到端自主AI科研引擎 NanoResearch
CitationClaw 学术论文智能引用画像和分析报告
pi-autoresearch:pi自动化实验优化循环
OpenClaw Control Center:为OpenClaw用户(包括团队和个人)提供统一的监控和管理界面
OpenClaw Dashboard 仪表盘:让OpenClaw管理更简单
PaperBanana-CN 学术配图助手
996.ICU:工作 996, 生病 ICU