科学工具
科学工具让世界更美好
让世界更美好
大语言模型
大语言模型OpenCoder:支持中英文的开放代码大语言模型
OpenCoder 是一个开放和可复现的代码大型语言模型(LLM),包含1.5B和8B规模的基础和对话模型,支持英语和中文。OpenCoder 从零开始训练,预训练数据涵盖了 2.5 万亿个令牌,其中90%是原始代码,10%为代码相关的网络数据。OpenCoder 在超过450万个高质量的监督微调(SFT)示例上进行了精细调优,最终达到了与顶级代码 LLM 相媲美的性能。OpenCoder 提供模型权重和推理代码,包括可复现的训练数据、完整的数据处理管道、实验消融结果和详细的训练协议,为研究人员的代码
大语言模型
数据加载中...
大语言模型
大语言模型从零使用纯Python实现OpenAI的GPT-OSS大型语言模型
GPT-OSS从零开始,使用纯Python实现OpenAI的大型语言模型,提供一个教育性强、深入解析大语言模型内部工作原理的开源实践,完整实现了GPT-OSS的Transformer架构,用C++实现的自定义BFloat16数据类型以确保数值精度,集成了专家混合(Mixture of Experts, MoE)架构,采用带有NTK感知缩放的旋转位置嵌入(RoPE),引入了支持注意力汇和滑动窗口的分组查询注意力(Grouped Query Attention),提供功能性的SwiGLU、RMSNorm、S
大语言模型
大语言模型自主数据科学代理大型语言模型 DeepAnalyze
DeepAnalyze 是用于自主数据科学的代理式大型语言模型,无需人工干预就能自主完成广泛的数据中心任务,能完成从数据准备、分析、建模、可视化到报告生成的整个数据科学流程。DeepAnalyze 支持对结构化、半结构化及非结构化等多样化数据源进行开放式深度研究,最终产出专业级别的分析报告。DeepAnalyze 提供了一个完全开源的解决方案,包括模型、代码、训练数据和演示,让用户能够轻松部署或扩展自己的数据分析助手,通过简洁的指令交互就能启动完成的数据分析流程。DeepAnalyze 核心功能1、包括
大语言模型
大语言模型MemOS大模型记忆操作系统
MemOS是一个专为大型语言模型(LLMs)设计的操作系统,为LLMs提供强大的长期记忆能力,使其能够高效地存储、检索并管理信息,从而实现更具上下文感知、一致性和个性化的交互。MemOS的主要功能围绕记忆增强生成(MAG)展开,提供统一的API接口,并采用模块化的MemCube架构,支持文本记忆、用于加速LLM推理和上下文复用的激活记忆(KVCacheMemory),以及存储模型适应参数的参数记忆等多种记忆类型。MemOS具备高度可扩展性,便于用户轻松集成和定制各类记忆模块、数据源及LLM集成,其在LO
大语言模型
大语言模型腾讯混元A13B MoE架构大语言模型安装使用指南
Hunyuan-A13B是一个创新且开源的大语言模型,基于细粒度MoE架构,通过130亿活跃参数(总计800亿参数)提供高效可扩展的最优性能,特别适用于资源受限环境下的高级推理和通用应用。Hunyuan-A13B核心功能包括支持快慢思维的混合推理模式、原生256K超长上下文理解能力、在智能体任务上的卓越表现。Hunyuan-A13B模型通过Grouped Query Attention (GQA) 和多量化格式实现高效推理,并且已开源预训练、指令微调、FP8和INT4量化版本,在多项基准测试(包括数学、
大语言模型
大语言模型谷歌开源的本地大模型 Google AI Edge Gallery 使用指南
Google AI Edge Gallery 把前沿生成式AI模型的能力直接交到用户手中,可在安卓设备上完全本地运行(iOS版本即将推出),模型加载后无需互联网连接,能尝试不同模型、聊天、用图片提问、探索提示词等。Gallery有多个模型可供选择,比如 Gemma3 - 1B - IT q4,这是 google/Gemma - 3 - 1B - IT 的4位量化版本,可通过 MediaPipe LLM Inference API 在安卓设备上部署,最大令牌数为1024,有 Hammer2.1 - 1.5
大语言模型
大语言模型生物分子相互作用预测模型 Boltz 使用指南
Boltz是用于生物分子相互作用预测的模型,Boltz-1是首个达到AlphaFold3精度的完全开源模型,最新的Boltz-2作为新型生物分子基础模型,通过联合建模复杂结构和结合亲和力,超越了AlphaFold3和Boltz-1。结合亲和力是精确分子设计的关键组成部分,Boltz-2是首个接近基于物理的自由能微扰(FEP)方法精度的深度学习模型,运行速度快1000倍,让早期药物发现中精确的计算机筛选变得可行。Boltz安装建议在新的Python环境中安装boltz。使用PyPI安装boltz(推荐方式
大语言模型
大语言模型LLManager 用于管理审批请求的 LangGraph 工作流
LLManager 是用于管理审批请求的 LangGraph 工作流,使用反射来随着时间的推移进行改进和学习,通过动态提示组合来处理各种审批请求。使用方法LLManager 可以通过设置两个自定义字段进行配置:approvalCriteria 和 rejectionCriteria。这些字段在图的配置对象中设置,可以与特定的助手关联,用于审批流程中,用来确定是否批准或拒绝请求。虽然不需要设置这些字段,因为 LLManager 会从过去的经验中学习并相应地更新其提示,但设置它们可以帮助模型做出更明智的决策
大语言模型
数据加载中...
大语言模型
大语言模型DeepResearcher基于强化学习的框架,端到端地训练基于LLM(大型语言模型)的深度研究代理
DeepResearcher是通过强化学习在真实环境中扩展基于大型语言模型的深度研究代理的端到端训练框架,能利用真实的网页搜索交互来增强模型的能力。DeepResearcher可以在huggingface-hub上使用,用户可以通过以下命令安装所需的依赖项:git clone https://github.com/GAIR-NLP/DeepResearcher.gitconda create -n deepresearcher python=3.10conda activate deepresearch
大语言模型
大语言模型MCP Server for Milvus 让LLM应用可以通过模型上下文协议(MCP)访问Milvus向量数据库的功能
MCP Server for Milvus 通过 Model Context Protocol (MCP) 将大型语言模型 (LLM) 应用,比如 Claude Desktop 和 Cursor,与 Milvus 向量数据库连接起来,允许 LLM 利用 Milvus 的向量搜索和数据存储能力,提升 LLM 应用的性能和功能。MCP协议作为开放标准协议,致力于消除LLM应用与传统数据源之间的交互壁垒,Milvus MCP服务器作为具体实现,通过标准化接口实现以下核心能力:1、支持向量相似度检索2、提供结构
1