自动驾驶具身智能与自动驾驶VLM MiMo-Embodied

MiMo-Embodied 是一个跨跨领域的具身视觉语言模型，首次将自动驾驶与具身AI任务两大关键领域集成并开源，能显著增强模型在动态物理环境中的理解和推理能力。MiMo-Embodied在具身AI（包括任务规划、可供性预测和空间理解等17项基准测试）和自动驾驶（包括环境感知、状态预测和驾驶规划等12项基准测试）方面均展现出最先进的性能，超越了现有开源和闭源的视觉语言模型，在8项通用视觉理解基准上保持并增强了其通用能力，证明了领域专业化训练能够提升而非削弱模型的整体熟练度，能够有效处理具身导航和操作等真

数据加载中...

自动驾驶 ORION端到端自动驾驶框架，通过视觉语言模型指导动作生成，实现整体的自主驾驶

端到端的自动驾驶方法在交互式的闭环评估中然难以做出正确的决策，主要是因为这种方法的因果推理能力有限，目前大家试图利用视觉语言模型（VLM）强大的理解和推理能力来解决这个难题，但是由于语义推理空间与动作空间中纯粹的数值轨迹输出之间的差距，很少有VLM在闭环评估中有比较良好的表现。为了解决这个问题，我们提出了ORION，ORION是一个通过视觉语言指导的动作生成来实现端到端自动驾驶的框架，结合了QT-Former来聚合长期历史上下文，大型语言模型（LLM）用于驾驶场景推理，生成规划器用于精确轨迹预测。ORI

论文工具 Resophy：AI加持的开源论文阅读器，让文献阅读效率翻倍

Resophy是一款基于HTML开发的开源AI论文阅读器，依托HTML+JavaScript+Python Flask轻量技术栈打造，主打AI翻译、论文分析、arXiv每日推荐等功能，采用Vibe Coding开发理念，能让用户自定义功能。Resophy能解决科研人员海量论文阅读效率低的痛点，支持论文解析、智能翻译和个性化推荐，支持MinerU官方云API，无需部署本地服务器，无GPU也能使用AI解析功能。Resophy采用前后端分离的架构设计，核心服务与AI服务可分开部署，能将主服务和AI服务器部署在

终端工具辅助软件开发任务和终端操作的命令行代理工具 Kimi CLI

Kimi CLI是能辅助软件开发任务和终端操作的命令行代理工具，提供Shell-like的用户界面，支持直接执行原始Shell命令（用户可通过快捷键切换模式），与Zsh Shell深度集成以赋能AI代理能力，原生支持Agent Client Protocol (ACP)以实现与兼容编辑器或IDE的协同工作，支持MCP配置约定来连接指定的MCP服务器。Kimi CLI作为一个Python包发布，主要支持macOS和Linux系统。• 支持类 Shell 界面与原生 Shell 命令执行• 可与 Zsh 集

PPT工具 AI智能在线PPT制作工具 OpenPPT

OpenPPT 是一个功能强大基于 Web 的智能 PPT 生成工具，支持从空白新建、导入现有文件、通过 AI 主题生成，到内容编辑、排版美化、幻灯片播放、演讲辅助、动画效果，支持导出多种格式和分享。OpenPPT 兼容主流 Office 文档格式（导入导出兼容性超 93%），深度融合了多项 AI 智能服务，如 AI 生成内容、AI 辅助写作、AI 智能排版和 AI 图片生成等，极大地提升了创作效率和智能化体验。OpenPPT 提供了丰富的页面元素（文本、图形、图片、表格、图表、视频、音频、公式、互动网

编程开发基于Tauri、React和Rust构建变成工具 Codexia

Codexia是一个基于Tauri、React和Rust构建的强大图形用户界面和工具包，增强OpenAI Codex CLI的开发者体验，支持多会话聊天与自动恢复、实时流式响应、内置Web搜索及图像输入能力。Codexia 提供文件树集成、Git Diff查看，内置对PDF、CSV和XLSX文件格式的预览与选择，提供灵活的配置选项，允许用户选择不同的AI提供商和按会话定制模型。在安全性与控制方面，Codexia通过沙盒执行模式、敏感操作审批流程、可配置的命令执行策略及会话隔离来确保安全，同时所有数据本地

笔记工具 Notion 辅助工具 Slashy，能 Notion 自定义各种快捷命令，如开启摄像头、录音、绘图、创建注释、可复用的内容模块等

Slashy是一款开源浏览器扩展，为Notion设计，用户能通过Slashy位Notion创建自定义命令，实现录制音视频、绘图、添加可复用组件等功能，所有功能完全免费，无需注册登录。Slashy核心功能• 自定义Notion命令：创建专属命令，输入斜杠“/”就能触发。• 音视频录制：用“/record”命令，不离开Notion就能录制视频和音频。• 绘图与标注：通过“/draw”命令，在Notion页面添加手绘或标注内容。• 可复用内容：轻松制作命令，用于插入重复使用的区块和内容。• 插件开发：借助Sl