智能体训练框架 Agent Lightning

Agent Lightning 是一个灵活可扩展的智能体训练框架，为现有智能体框架提供无缝的模型训练能力，由一个训练服务器和多个智能体组成，服务器负责管理训练数据、准备样本和提供语言模型（LLM）端点，并收集智能体返回的LLM交互轨迹以优化模型，智能体从服务器获取样本并进行处理。该框架支持与AutoGen、LiteLLM、LangChain等多种主流智能体框架集成，默认集成了AgentOps进行智能体追踪。

Agent Lightning安装

以下是环境搭建和安装的详细流程，文中用/path/to/agentlightning指代包含本README文件的目录。

1、设置环境 推荐创建新的虚拟环境，避免与其他包产生冲突，可使用conda或venv，建议使用Python 3.10及更高版本。

2、安装核心依赖 接下来需要安装必要的包：uv、PyTorch、FlashAttention和vLLM。

• 安装uv（部分MCP智能体需要，否则可能出现智能体挂起的情况）：

curl -LsSf https://astral.sh/uv/install.sh | sh

• 安装PyTorch、FlashAttention和vLLM：以下版本和安装顺序已测试可用。

pip install torch==2.7.0 torchvision==0.22.0 torchaudio==2.7.0 --index-url https://download.pytorch.org/whl/cu128
pip install flash-attn --no-build-isolation
pip install vllm==0.9.2

3、安装VERL

Agent Lightning需要VERL进行强化学习训练。请从主分支安装最新版本：

git clone https://github.com/volcengine/verl /path/to/your/verl
cd /path/to/your/verl
pip install -e .

4、安装Agent Lightning

完成上述步骤后，就可以安装Agent Lightning了：

cd /path/to/agentlightning
pip install -e .

5、安装可选框架

如果计划使用其他智能体框架，可以用以下命令安装。不需要的话可以跳过这一步。 • AutoGen（建议优先安装）：

pip install "autogen-agentchat" "autogen-ext[openai]"

• LiteLLM：

pip install "litellm[proxy]"

• MCP：

pip install mcp

• OpenAI Agents：

pip install openai-agents

• LangChain：

pip install langgraph "langchain[openai]" langchain-community langchain-text-splitters

• SQL相关依赖：

pip install sqlparse nltk

安装过程中若出现依赖冲突无需担心，按照上述顺序安装，冲突通常不影响使用。

Agent Lightning围绕训练服务器和一个或多个智能体构建。

• 服务器负责管理训练数据、为智能体准备样本、提供LLM端点。

• 智能体从服务器获取样本，进行处理（可能包括与LLM交互），然后将结果返回。这些结果（即“轨迹”）是LLM的提示和响应列表。

• 服务器收集这些轨迹，计算损失，用于优化语言模型。

• 安装包含开发依赖的版本：

pip install -e .[dev]

• 提交代码前请运行预提交钩子：

pre-commit install
pre-commit run --all-files --show-diff-on-failure --color=always

示例参考

详细的示例可以查看examples文件夹。

注意事项

AgentOps集成：Agent Lightning默认使用AgentOps进行智能体跟踪。如果自己的代码中已使用AgentOps，需要通过修改训练器的tracer参数禁用框架管理的AgentOps客户端。

调试跟踪：若跟踪出现问题，可以使用tracer.last_trace().visualize("tree_graph")可视化跟踪树。注意该API为实验性，未来可能变更。

启动服务器和智能体：目前训练服务器和智能体客户端必须在不同进程中启动。可以打开两个终端窗口，或让其中一个在后台运行。启动顺序通常不影响使用。

环境变量：ray init时的环境变量和工作目录很重要。若遇到“文件未找到”错误，尝试从当前工作目录重启Ray。

处理超时：若智能体端样本处理失败或超时，训练服务器可能挂起。建议限制提示和响应长度，这是最常见的失败原因。

VERL故障：请频繁保存检查点，因为使用vLLM的VERL可能偶尔出现内存不足问题。若VERL发生故障，可以从最后一个检查点恢复训练。

▶ 访问

AI智能体智能社交平台 MoChat

通过智能代理实时处理市场数据的AI自主交易系统OpenNof1

基于Next.js、AI SDK和Workflow DevKit构建的线索鉴定与人工审核代理工具 Lead Agent

历史人物事件时间线生成工具 Event Deep Research

ROMA 递归开放元代理框架

智能体训练框架 Agent Lightning

LLM 应用开发平台 Dify，支持AI 工作流、RAG 管道、Agent、模型管理

深度研究报告生成工具 Deep Research Agent

随用户的使用成长和学习的智能体框架 Agent Zero

AI智能体操作系统 SmythOS

GitHub AI自动化开发代理 Cairn 安装配置和使用指南

高效推理搜索LLM代理系统 SearchAgent-X 部署和使用指南

pi-autoresearch：pi自动化实验优化循环

Resophy：AI加持的开源论文阅读器，让文献阅读效率翻倍

图像分层分解和编辑工具 Qwen-Image-Layered

Wan-Move：通过潜在轨迹引导实现运动可控视频生成的框架

智能会话和编程辅助工具 CODING-TOOL

自主数据科学代理大型语言模型 DeepAnalyze

学术论文语义搜索工具 Paper Semantic Search，通过语义匹配帮助用户发现相似文献

Bananas 跨平台屏幕共享工具，支持 Windows、macOS 和 Linux 系统

旅行AI助手Voyant Travel Assistant

MCP服务器 codex-as-mcp：让 Claude Code、Cursor 等 AI 工具调用 OpenAI Codex 执行任务

人物实时姿态AI监测与提醒工具 Pose Nudge

VeritasGraph 企业级图谱增强生成（Graph RAG）框架

AI代理

数据加载中...

PowerPoint演示文稿智能生成工具 PowerPoint Slides Skill

金融 AI 新工具 FinClaw，免费提供1000+ 金融专属Skills

PPT Agent 演示文稿生成框架

端到端自主AI科研引擎 NanoResearch

CitationClaw 学术论文智能引用画像和分析报告

pi-autoresearch：pi自动化实验优化循环

OpenClaw Control Center：为OpenClaw用户（包括团队和个人）提供统一的监控和管理界面

OpenClaw Dashboard 仪表盘：让OpenClaw管理更简单

PaperBanana-CN 学术配图助手

996.ICU：工作 996，生病 ICU