谷歌开源的本地大模型 Google AI Edge Gallery 使用指南

Google AI Edge Gallery 把前沿生成式AI模型的能力直接交到用户手中，可在安卓设备上完全本地运行（iOS版本即将推出），模型加载后无需互联网连接，能尝试不同模型、聊天、用图片提问、探索提示词等。

Gallery有多个模型可供选择，比如 Gemma3 - 1B - IT q4，这是 google/Gemma - 3 - 1B - IT 的4位量化版本，可通过 MediaPipe LLM Inference API 在安卓设备上部署，最大令牌数为1024，有 Hammer2.1 - 1.5b q8，大小约1.6GB，Qwen2.5 - 1.5B - lnstruct q8，大小约1.6GB等。

Ask Image（图像转文本）

• 从主屏幕点击“Ask Image”。

• 选择兼容的多模态模型（如 Gemma 3N，若未下载需先下载）。

• （可选）调整推理参数。

• 点击“+”从设备图库选择图片或拍照（需相机/存储权限）。

• 选图后添加文本提示（如“这张图里有什么”“帮我解这道数学题”），然后点击“发送”。

• 查看输出，可复制或查看性能统计数据。

Prompt Lab（单轮任务）

• 从主屏幕点击“Prompt Lab”。

• 选择模型（未下载需先下载）。

• 从可用选项中选择任务模板：

自由提示：输入对模型的任何指令。
文本总结：提供要总结的文本。
改写语气：输入文本，选择目标语气（如正式、随意）。
代码片段：描述想要的代码功能，选择语言。

• 输入文本或从示例提示中选择。

• （可选）调整推理参数。

• 点击“发送/生成”按钮。

• 查看输出，复制查看性能统计数据。

AI Chat（多轮对话）

• 从主屏幕点击“AI Chat”。

• 选择模型（未下载需先下载）。

• 在输入框中输入消息然后发送。

• 模型会响应并保持对话上下文。

• （可选）调整推理参数。

• 可查看每轮的性能统计数据。

其他功能

• 本地运行，完全离线：无需互联网连接，所有处理直接在设备上进行。

• 选择模型：可轻松在来自 Hugging Face 的不同模型间切换然后比较性能。

• 性能洞察：实时获取基准数据（首令牌时间、解码速度、延迟）。

• 导入自己的模型：测试本地的 LiteRT .task 模型。

• 开发者资源：可快速访问模型卡片和源代码。

• Google AI Edge：用于设备端机器学习的核心API和工具。

• LiteRT：轻量级运行时，用于优化模型执行。

• LLM Inference API：为设备端大型语言模型提供动力。

• Hugging Face集成：便于发现和下载模型。

Gallery下载安装

下载APK

获取最新的APK，可查看发布页面获取更多版本。

安装说明

方法1：直接安装（最简单）

1、APK下载到设备后（如“下载”文件夹），打开设备的文件管理器。

2、找到点击下载的.apk文件。

3、可能会提示允许从“未知来源”安装，若如此，启用此权限（通常在设备设置的“安全”或“应用”下，系统会引导操作）。

4、确认安装。

方法2：通过ADB安装

此方法需要ADB且设备启用USB调试。

1、启用开发者选项和USB调试：

• 在安卓设备上，进入“设置”>“关于手机”。

• 多次点击“版本号”（通常7次），直到看到“你现在是开发者！”的消息。

• 返回“设置”>“系统”>“开发者选项”（位置可能因安卓版本/制造商略有不同）。

• 启用开发者选项（若未启用）。

• 启用USB调试。

2、连接设备：用USB线将安卓设备连接到电脑。

3、使用ADB安装：

• 在电脑上打开终端或命令提示符。

• 导航到下载APK文件的目录。

• 运行命令：adb install -t ai-edge-gallery.apk，-t标志允许测试适用于比设备更新平台版本的APK。

▶ 访问

OpenCoder：支持中英文的开放代码大语言模型

从零使用纯Python实现OpenAI的GPT-OSS大型语言模型

自主数据科学代理大型语言模型 DeepAnalyze

MemOS大模型记忆操作系统

腾讯混元A13B MoE架构大语言模型安装使用指南

谷歌开源的本地大模型 Google AI Edge Gallery 使用指南

生物分子相互作用预测模型 Boltz 使用指南

LLManager 用于管理审批请求的 LangGraph 工作流

DeepResearcher基于强化学习的框架，端到端地训练基于LLM（大型语言模型）的深度研究代理

MCP Server for Milvus 让LLM应用可以通过模型上下文协议(MCP)访问Milvus向量数据库的功能

Llama3从零开始实现指南

FlashMLA专为Hopper架构GPU设计的高效解码内核

金融 AI 新工具 FinClaw，免费提供1000+ 金融专属Skills

LLM提示词优化与管理工具 PromptManager

AI Studio/Gemini提示词工具Banana Prompt Quicker

从零使用纯Python实现OpenAI的GPT-OSS大型语言模型

AI驱动的股票研究平台 Multi-Agent Investment Research Platform

AI-Trader：让多个AI模型在纳斯达克100股票市场中进行完全自主的零人工干预的竞争性交易

AI智能实时语音控制编排工具 Big Three Realtime Agents

低成本实现最佳ChatGPT全栈大型语言模型平替 nanochat

AI漫画创作工具 AIMangaStudio

蛐蛐 QuQu 开源免费中文智能语音工具

Qwen3-Omni 全模态多语言实时交互大模型

GoDuck加速器，新用户注册送 7 天免费试用

大语言模型

数据加载中...

PowerPoint演示文稿智能生成工具 PowerPoint Slides Skill

金融 AI 新工具 FinClaw，免费提供1000+ 金融专属Skills

PPT Agent 演示文稿生成框架

端到端自主AI科研引擎 NanoResearch

CitationClaw 学术论文智能引用画像和分析报告

pi-autoresearch：pi自动化实验优化循环

OpenClaw Control Center：为OpenClaw用户（包括团队和个人）提供统一的监控和管理界面

OpenClaw Dashboard 仪表盘：让OpenClaw管理更简单

PaperBanana-CN 学术配图助手

996.ICU：工作 996，生病 ICU