测试阶段控制大语言模型推理速度的通用框架 AlphaOne 使用指南

AlphaOne（α1）是一个通用框架，能在测试阶段调节大型推理模型（LRMs）的推理过程，首次引入了α时刻的概念，用通用参数α来衡量思考阶段，在这个按比例缩放的前α时刻阶段，框架通过把推理转换标记的插入建模为伯努利随机过程，来动态安排慢思考的转换，过了α时刻后，α1会用思考结束标记确定性地终止慢思考，然后推动快速推理和生成高效答案。该方法统一推广了现有的单调缩放方法，能实现灵活密集的慢到快推理调节，为推理能力和计算效率的联合优化提供了参考方案。

AlphaOne 安装

安装AlphaOne环境可参考以下步骤。

创建并激活conda环境：

conda create -n alphaone python=3.10
conda activate alphaone

安装所需的依赖：

cd eval/latex2sympy
pip install -e .

cd ..
pip install -r requirements.txt 
pip install vllm==0.5.1 --no-build-isolation
pip install transformers==4.42.3

完成这些步骤后，就可以启动α1 LRMs了。

AlphaOne使用

建议在运行评估脚本时进行输出重定向：

nohup bash ./scripts/alphaone/eval_linear_deepseek_7b.sh >> deepseek-7b-alpha-1.4.log &

这样做方便实时监控进度，也能跟踪多次运行的情况。

模型评估方法

提供了评估脚本，用于在数学和科学基准上评估α1 LRMs，这些基准包括AIME24、AMC23、Minerva-Math、MATH500和OlympiadBench等。

不同模型的评估方式

DeepSeek-R1-Distill-Qwen-1.5B：

cd AlphaOne/eval
./scripts/alphaone/eval_linear_deepseek_1_5b.sh

DeepSeek-R1-Distill-Qwen-7B：

cd AlphaOne/eval
./scripts/alphaone/eval_linear_deepseek_7b.sh

Qwen QwQ-32B：

cd AlphaOne/eval
./scripts/alphaone/eval_linear_qwq.sh

LiveCodeBench（专注于代码生成和执行）：

./scripts/alphaone/eval_linear_code.sh

如果要评估基线模型，可以参考docs/BASELINE.md中的详细说明。

▶ 访问

端到端自主AI科研引擎 NanoResearch

在本地云端都能部署的专属个人AI助手 CoPaw

浏览器端智能答题插件：AI 自动答题助手

vLLM Kunlun 昆仑 XPU 硬件插件

虚假新闻检测器

XiaomiMiMo/MiMo-Audio-7B-Instruct模型微调工具MiMo-Audio-Training

旅行AI助手Voyant Travel Assistant

AI Pose Transfer Studio 智能姿态迁移，能够让照片中的人物摆出任何想要的姿势

PAI 个人AI生活工作编排框架

Quests 桌面应用构建器

人物实时姿态AI监测与提醒工具 Pose Nudge

Arxiv论文智能翻译PDF生成工具ChinarXiv

端到端自主AI科研引擎 NanoResearch

在本地云端都能部署的专属个人AI助手 CoPaw

聊天机器人 AI-Chatbot

Wan-Move：通过潜在轨迹引导实现运动可控视频生成的框架

基于Next.js、AI SDK和Workflow DevKit构建的线索鉴定与人工审核代理工具 Lead Agent

AI 编码代理工具 deer-code，帮助开发者学习和构建智能的编码助手

蜂群机场，直连原生双线路，输入优惠码享受更低折扣

AI智能在线PPT制作工具 OpenPPT

PAI 个人AI生活工作编排框架

VilaVPN官网客户端，IPLC专线机场

DevTeam CLI 为本地编码智能体设计的终端工具

AutoDocs 代码自动化文档与智能分析工具

AI工具

数据加载中...

PowerPoint演示文稿智能生成工具 PowerPoint Slides Skill

金融 AI 新工具 FinClaw，免费提供1000+ 金融专属Skills

PPT Agent 演示文稿生成框架

端到端自主AI科研引擎 NanoResearch

CitationClaw 学术论文智能引用画像和分析报告

pi-autoresearch：pi自动化实验优化循环

OpenClaw Control Center：为OpenClaw用户（包括团队和个人）提供统一的监控和管理界面

OpenClaw Dashboard 仪表盘：让OpenClaw管理更简单

PaperBanana-CN 学术配图助手

996.ICU：工作 996，生病 ICU