科学工具
科学工具让世界更美好
让世界更美好
自动驾驶
自动驾驶具身智能与自动驾驶VLM MiMo-Embodied
MiMo-Embodied 是一个跨跨领域的具身视觉语言模型,首次将自动驾驶与具身AI任务两大关键领域集成并开源,能显著增强模型在动态物理环境中的理解和推理能力。MiMo-Embodied在具身AI(包括任务规划、可供性预测和空间理解等17项基准测试)和自动驾驶(包括环境感知、状态预测和驾驶规划等12项基准测试)方面均展现出最先进的性能,超越了现有开源和闭源的视觉语言模型,在8项通用视觉理解基准上保持并增强了其通用能力,证明了领域专业化训练能够提升而非削弱模型的整体熟练度,能够有效处理具身导航和操作等真
自动驾驶
数据加载中...
自动驾驶
自动驾驶ORION端到端自动驾驶框架,通过视觉语言模型指导动作生成,实现整体的自主驾驶
端到端的自动驾驶方法在交互式的闭环评估中然难以做出正确的决策,主要是因为这种方法的因果推理能力有限,目前大家试图利用视觉语言模型(VLM)强大的理解和推理能力来解决这个难题,但是由于语义推理空间与动作空间中纯粹的数值轨迹输出之间的差距,很少有VLM在闭环评估中有比较良好的表现。为了解决这个问题,我们提出了ORION,ORION是一个通过视觉语言指导的动作生成来实现端到端自动驾驶的框架,结合了QT-Former来聚合长期历史上下文,大型语言模型(LLM)用于驾驶场景推理,生成规划器用于精确轨迹预测。ORI
论文工具
论文工具PaperBanana-CN 学术配图助手
PaperBanana-CN 是一款基于开源项目PaperBanana改造的学术论文配图生成工具,用AI驱动,支持粘贴论文方法章节自动生成高质量学术配图。PaperBanana-CN 不需要复杂配置,大幅降低学术配图制作门槛,是科研人员、学生的论文辅助工具。候选配图生成只需粘贴论文的方法章节和图注,PaperBanana-CN就能自动生成多个候选配图供选择,由5个AI Agent协作完成全流程:• 检索器:从参考库中查找类似图片,为生成提供参考。• 规划器:将文字描述转化为清晰的图表描述。• 风格化器:
知识库工具
知识库工具PandaWik:由 AI 驱动的开源知识库系统
PandaWiki是由AI大模型驱动的开源知识库搭建系统,能帮助用户快速创建智能化的产品文档、技术文档、FAQ和博客平台。PandaWiki深度融合AI能力,提供智能创作辅助、智能问答和AI搜索功能,配备强大的富文本编辑器,兼容Markdown和HTML,支持导出为Word、PDF等多种格式。PandaWiki可作为网页挂件嵌入其他网站,或与钉钉、飞书等企业聊天机器人对接,同时支持通过网页URL、Sitemap、RSS订阅及离线文件等多样化来源导入内容。PandaWiki 核心优势事AI与知识库功能的深
提示词工具
提示词工具AI Studio/Gemini提示词工具Banana Prompt Quicker
如果你正在为在Google AI Studio和Gemini官网上频繁搬运复制提示词而烦恼,现在推荐的Banana Prompt Quicker这个Chrome扩展提供了一个优雅的解决方案,能快速插入热门提示词,一键插入全网热门(如Twitter)提示词,支持Google AI Studio和Gemini,允许用户自由添加和管理自定义提示词。通过Banana Prompt Quicker你就能告别繁琐的复制粘贴,能更高效地与AI进行交互。• 一键插入全网热门提示词(多来自Twitter),省去搜索和复制
OCR工具
OCR工具DeepSeek-OCR 实时光学字符识别服务 DeepSeek-OCR Client
DeepSeek-OCR Client 是基于 Electron 的为 DeepSeek-OCR 提供实时光学字符识别(OCR)服务,支持图像拖放上传、即时OCR处理、通过点击区域复制识别文本,最后能将结果以包含 Markdown 图像的ZIP文件形式导出。DeepSeek-OCR Client利用CUDA实现GPU加速以优化性能,主要面向 Windows 10/11 用户,要求安装 Node.js、Python 和支持CUDA的NVIDIA GPU。DeepSeek-OCR Client围绕用户实际使
文档分析工具
文档分析工具AutoDocs 代码自动化文档与智能分析工具
AutoDocs 是一个强大的自动化文档生成工具,能深度遍历代码库、解析抽象语法树(AST)并构建代码依赖图,自动生成准确、高质量且具备依赖感知的仓库级文档和摘要。AutoDocs提供了一个 FastAPI 后端用于代码摄入与搜索,以及一个 Next.js Web UI 界面用于文档的聊天和探索,内置了一个 MCP 服务器,使编码代理能够通过 HTTP 对代码进行深度查询,以回答仓库范围内的相关问题。1、借助 tree-sitter(AST 解析工具)和 SCIP(符号解析工具)解析代码仓库。2、构建代
1