科学工具
科学工具让世界更美好
让世界更美好

端到端自主AI科研引擎 NanoResearch

NanoResearch 是一个 AI 科研引擎,可以真正跑起计算实验,而不仅仅是生成文本大纲或论文草稿。NanoResearch能自动完成文献检索、研究思路生成、实验方案设计、编写可运行代码,然后把代码提交到 GPU 集群或本地执行训练,收集实验结果、分析数据,自动生成论文配图(包括架构图、结果对比图和消融实验图),最后产出一篇有真实实验数据支撑的完整 LaTeX 论文,并且还能自动审阅和修订。

NanoResearch 支持两种运行模式:Python CLI 和 Claude Code。其中 Claude Code 模式不需要配置外部 API Key,直接利用其内置的 WebSearch、Bash 执行和文件读写能力就能驱动整个科研流程。另外,它还集成了飞书机器人,用户可以在聊天界面里启动科研任务、查询进度,最后直接接收 PDF 论文。整个流程自动化程度很高,每个阶段都支持断点续跑,也可以灵活配置不同的模型,保证了科研过程的效率、可重复性和可追溯性。

常规的 AI 科研工具大多只能生成文本大纲或论文草稿。NanoResearch 的不同之处在于,它能执行完整的计算实验流程:

Idea Generation 自动检索文献、发现研究空白、提出假说
 ↓
Experiment Planning 设计详细实验方案与技术路线
 ↓
Code Generation 生成可运行实验代码(包含训练脚本、数据加载、模型定义)
 ↓
GPU Execution 自动提交到 SLURM 集群或本地 GPU 执行训练
 ↓
Results Analysis 解析训练日志、提取指标、生成结构化实验证据
 ↓
Figure Generation 依据真实实验数据自动生成论文配图
 ↓
Paper Writing 基于真实实验结果撰写 LaTeX 论文
 ↓
Review & Revision 自动审稿并完成修订

论文里所有数据、表格、图表都来自实际运行的实验。

功能对比

特性 传统 AI 写作工具 NanoResearch
文献检索 部分支持 OpenAlex + Semantic Scholar 自动检索
实验设计 不支持 自动生成实验方案
代码生成 部分支持 完整可运行实验代码
实验执行 不支持 自动提交 GPU 训练,支持本地与 SLURM
结果分析 不支持 解析真实训练日志与指标
论文配图 不支持 基于真实数据生成图表
论文撰写 大纲/草稿 基于实验证据的完整 LaTeX 论文
断点续跑 不支持 任意阶段失败后可恢复
多模型协作 单一模型 各阶段可配置不同模型

适用场景

  • 科研原型验证:快速把研究想法转化成完整的实验和论文。
  • 自主实验:系统自动生成代码、提交 GPU 训练、分析结果。
  • Benchmark 批量生成:批量跑多个课题,生成可复现的实验结果。
  • 论文初稿辅助:基于真实实验数据产出 LaTeX 草稿。
  • 科研流程审计:完整保留工作空间、中间产物和日志,方便追溯每一步操作。

运行流水线

Research Topic
 ↓
IDEATION → PLANNING → SETUP → CODING → EXECUTION → ANALYSIS → FIGURE_GEN → WRITING → REVIEW
 ↓
Exported workspace: paper.pdf / paper.tex / references.bib / figures / code / data
阶段 功能 说明
IDEATION 文献检索与创意生成 搜索学术文献、发现研究空白、提出假说、收集必引文献
PLANNING 实验方案设计 将研究想法转化为详细的实验设计
SETUP 环境准备 准备代码仓库、依赖环境、模型与数据集
CODING 代码生成 生成完整的可运行实验项目
EXECUTION 实验执行 在本地 GPU 或 SLURM 集群上运行训练,支持自动重试与调试
ANALYSIS 结果分析 解析训练日志与指标,生成结构化的实验证据
FIGURE_GEN 图表生成 创建架构图、结果对比图、消融实验图
WRITING 论文撰写 基于实验证据与引用撰写 LaTeX 论文
REVIEW 审稿与修订 自动审阅各章节,检测问题并修订

EXECUTION 阶段具备自动提交 SLURM 作业、本地 GPU 执行、自动调试与重试、实时日志监控、混合执行模式等能力。

核心能力

基于实证写作

论文内容依托结构化的实验证据、引用和实验产物,追踪必引文献及引用质量,输出带 BibTeX 支持的 LaTeX 论文。

真实实验依据

写作与配图都使用真实的实验输出和分析产物,表格、数据声明、图表都与实际实验结果绑定,保留中间 JSON 产物,方便调试和审计。

混合图表生成

架构图由图像模型生成,结果图与消融图由代码基于真实数据生成,图表提示、脚本和输出都会保存到工作空间。

断点续跑

各阶段的产物会写入磁盘,失败后可以从上次断点继续跑,不用从头再来。

安装配置

1. 安装

git clone https://github.com/OpenRaiser/NanoResearch.git
cd NanoResearch
pip install -e ".[dev]"

2. 配置

创建 ~/.nanoresearch/config.json,把 base_urlapi_key 换成自己 OpenAI 兼容的 API 端点,并为各阶段选择可用的模型。

3. 验证

nanoresearch run --topic "Adaptive Sparse Attention Mechanisms" --dry-run

4. 运行

nanoresearch run --topic "Adaptive Sparse Attention Mechanisms" --format neurips --verbose

5. 恢复

nanoresearch resume --workspace ~/.nanoresearch/workspace/research/{session_id} --verbose

6. 导出

nanoresearch export --workspace ~/.nanoresearch/workspace/research/{session_id} --output ./my_paper

Claude Code 模式

NanoResearch 支持通过 Claude Code 直接驱动研究流水线,不需要配置任何 API Key。

操作步骤

# 1. Clone 项目
git clone https://github.com/OpenRaiser/NanoResearch.git
cd NanoResearch

# 2. 启动 Claude Code
claude

# 3. 运行完整流水线
/project:research "Your Research Topic Here"

常用指令

指令 功能
/project:research 运行完整 9 阶段流水线
/project:ideation 文献检索 + 假说生成
/project:planning 实验方案设计
/project:experiment 环境准备 + 代码生成 + 实验执行
/project:analysis 实验结果分析
/project:writing 图表生成 + 论文撰写
/project:review 多视角审稿 + 修订
/project:status 查看流水线状态
/project:resume 断点恢复流水线

飞书机器人集成

NanoResearch 内置了飞书机器人,可以在飞书聊天里触发流水线、查看进度、接收论文。

配置与启动

pip install lark-oapi
export FEISHU_APP_ID="cli_xxx"
export FEISHU_APP_SECRET="xxx"
nanoresearch feishu

支持指令

指令 描述
/run <课题> 启动研究流水线
/status 查看任务进度
/list 列出历史研究会话
/stop 停止当前流水线
/export 导出最近完成的研究
/new 重置对话记忆
/help 显示帮助信息

常见问题

系统真的会跑实验吗? 会。系统生成的是可运行的代码,在本地 GPU 或 SLURM 集群上执行,论文里的数据都来自真实实验。

支持断点续跑吗? 支持。工作空间按阶段保存检查点,执行恢复命令就能从未完成的地方继续。

每个阶段必须配置不同的模型吗? 不一定。系统支持按阶段配置不同的模型路由,也可以统一用同一个模型。

生成的论文能直接投稿吗? 生成的内容可以作为高质量的初稿,投稿前还是建议人工审阅和修订一下。

环境要求

  • Python 3.10 及以上版本
  • OpenAI 兼容的 API 端点
  • 可选:图像模型访问权限
  • tectonic 或 pdflatex(推荐用 tectonic 编译 PDF)