科学工具
科学工具让世界更美好
让世界更美好

PPT Agent 演示文稿生成框架

PPT Agent 是一套用代码驱动生成演示文稿的框架,它把“内容策划”和“视觉排版”分开处理,先把数据结构理清楚,再按需调用素材库,最终生成高保真的 HTML 文件和可以二次编辑的 PPTX 文件,避免大模型因为提示词太长而乱排版或自己编内容。

主要特点

  • 架构与设计分开:先产出能描述每一页结构的 JSON 文件并校验,再把它渲染成 HTML。
  • 按需加载:系统有 60 多个模块素材,通过多级树干只给当前页面注入需要的组件,减少 Token 消耗,也避免指令互相干扰。
  • 写的时候就能校验(QA):内部脚本在写入时会实时检查 JSON 格式,自动挂载预置资源并组装成 Prompt,人工只需要审阅和提需求。
  • 两种输出方式:渲染结果时,可以生成兼容性好的 PNG 图片流,也可以生成保留矢量图形和文字可编辑性的 SVG 文件。
  • 状态保存:生成超长任务时,每个节点都会实时存到 progress.json 文件,随时可以中断,后面接着继续跑。

工作流程

生成过程分 6 步:

  1. 需求确认:反复问清楚受众和使用场景。
  2. 并行搜索:多方向找信息,交叉验证。
  3. 搭大纲:定好叙事结构和论证方式。
  4. 单页结构化(JSON):确定每一页的布局和信息放哪里。
  5. 视图组装(HTML):加载 CSS 变量,渲染出最终界面。
  6. 打包输出(PPTX):通过脚本把内容拼成标准的 Office 文稿。

快速上手

这是一个零配置的 AI 技能,不需要自己搭环境或提前装东西,运行依赖会在执行过程中由智能体自动补齐。

怎么运行

项目目前以 Skill 形式存在,在交互窗口里直接说出需求,Agent 就会自动跑完整个流程。比如:

“帮我生成一份 15 页的路演 Deck,主题是 AI 大模型算力消耗趋势。”

生成的文件会放在根目录的 ppt-output/ 文件夹里,包含一个可以在浏览器里翻页的 preview.html 和一个 presentation.pptx 文件。

目录结构

ppt-agent-skill/
├── SKILL.md                 # 给 Agent 看的调度说明
├── scripts/                 # 自动化脚本(处理 Prompt、SVG 注入、格式挂载)
└── references/              # 可插拔的静态素材库
    ├── blocks/              # 预设的卡片组件
    ├── layouts/             # Bento 等网格布局模板
    ├── charts/              # 纯 SVG 的统计图表
    └── styles/              # 设计用的 8 套配色规则