科学工具

科学工具让世界更美好

让世界更美好

vLLM Kunlun 昆仑 XPU 硬件插件

vLLM Kunlun是一个专为昆仑XPU设计的社区维护硬件插件，让vLLM框架能够在昆仑XPU上无缝高效运行。vLLM Kunlun 通过提供一个可插拔的硬件接口，实现了昆仑XPU与vLLM的解耦集成，让各类主流开源大模型，包括Transformer类、混合专家（MoE）、Embedding以及多模态LLM，均可在此架构上运行。vLLM Kunlun 持Qwen、LLama、GLM等生成式模型及Qianfan-VL、InternVL等多模态模型，提供量化、LoRA和分段昆仑图等关键功能，能在昆仑3 P800硬件环境下实现卓越的高性能计算能力。

vLLM Kunlun 运行前提条件

• 硬件：昆仑芯3 P800

• 操作系统：Ubuntu 22.04

• 软件环境：Python 版本不低于3.10，PyTorch 版本不低于2.5.1，vLLM（需与vllm-kunlun版本保持一致）

支持的模型

生成式模型

模型	支持情况	量化	LoRA	分段昆仑芯图	备注
Qwen2/2.5	✅	-	✅	✅	-
Qwen3	✅	-	✅	✅	-
Qwen3-Moe/Coder	✅	✅	✅	✅	-
QwQ-32B	✅	-	-	✅	-
Llama2/3/3.1	✅	-	-	✅	-
GLM-4.5/Air	✅	✅	✅	✅	-
Qwen3-next	⚠️	-	-	-	即将支持
GPT OSS	⚠️	-	-	-	即将支持
DeepSeek-v3/3.2	⚠️	-	-	-	即将支持

多模态语言模型

模型	支持情况	量化	LoRA	分段昆仑芯图	备注
Qianfan-VL	✅	-	-	✅	-
Qwen2.5-VL	✅	-	-	✅	-
InternVL2.5/3/3.5	✅	-	-	✅	-
InternS1	✅	-	-	✅	-
Qwen2.5-Omni	⚠️	-	-	-	即将支持
Qwen3-VL	⚠️	-	-	-	即将支持
GLM-4.5V	✅	-	-	✅	-

性能表现

在昆仑芯3 P800上，不同模型展现出高效的计算能力。测试环境为16路并发，输入/输出尺寸2048，各模型吞吐量数据如下：

• Qwen3-30B-A3B：1927.4

• Qwen3-14B：1781.1

• Qwen3-8B：1779.8

• Qwen2 5 14B linstruct：1592.7

• Qwen3-32B：927.7

• Qwen3-235B-A22B：927.5

• Qwen2.5-32B-instruct：916.5

• Qwen2.5.72B-lnstruct：819.5

▶ 访问

端到端自主AI科研引擎 NanoResearch

在本地云端都能部署的专属个人AI助手 CoPaw

浏览器端智能答题插件：AI 自动答题助手

vLLM Kunlun 昆仑 XPU 硬件插件

虚假新闻检测器

XiaomiMiMo/MiMo-Audio-7B-Instruct模型微调工具MiMo-Audio-Training

旅行AI助手Voyant Travel Assistant

AI Pose Transfer Studio 智能姿态迁移，能够让照片中的人物摆出任何想要的姿势

PAI 个人AI生活工作编排框架

Quests 桌面应用构建器

人物实时姿态AI监测与提醒工具 Pose Nudge

Arxiv论文智能翻译PDF生成工具ChinarXiv

小牛加速器

贝雪云加速器

招聘求职工具

格式转换工具

PPT Agent 演示文稿生成框架

端到端自主AI科研引擎 NanoResearch

CitationClaw 学术论文智能引用画像和分析报告

开源自主代理操作系统 OpenFang

LLM提示词优化与管理工具 PromptManager

基于DeepSeek-OCR模型的文档解析工具 DeepSeek-OCR Studio

历史人物事件时间线生成工具 Event Deep Research

get_jobs 求职者投递简历工具

蜂群机场，直连原生双线路，输入优惠码享受更低折扣

AI智能在线PPT制作工具 OpenPPT

ROMA 递归开放元代理框架

DevTeam CLI 为本地编码智能体设计的终端工具

数据加载中...

PowerPoint演示文稿智能生成工具 PowerPoint Slides Skill

金融 AI 新工具 FinClaw，免费提供1000+ 金融专属Skills

PPT Agent 演示文稿生成框架

端到端自主AI科研引擎 NanoResearch

CitationClaw 学术论文智能引用画像和分析报告

pi-autoresearch：pi自动化实验优化循环

OpenClaw Control Center：为OpenClaw用户（包括团队和个人）提供统一的监控和管理界面

OpenClaw Dashboard 仪表盘：让OpenClaw管理更简单

PaperBanana-CN 学术配图助手

996.ICU：工作 996，生病 ICU