💬 观点Nathan Lambert

Latest open artifacts (#20): New orgs! New types of — 盘点本月开源AI新模型：从多模态到专业工具，展现行业多元化创新

盘点本月开源AI新模型：从多模态到专业工具，展现行业多元化创新

2026-03-30原文

本文为要点摘要，完整细节以原文为准。

本月开源模型生态呈现爆发式增长，不再由少数巨头主导，而是涌现出大量针对特定场景的模型。

NVIDIA 发布了基于 LatentMoE 架构的 Nemotron Super 120B 模型，并公开了大部分预训练数据集，这为研究高效的专家混合模型架构提供了宝贵的开放资源。
印度公司 Sarvam 发布了在 12-16T 词元上训练的 105B 参数模型，在印度语言任务上表现卓越，凸显了主权AI和针对特定语言文化数据训练的重要性。
出现了众多专业工具模型，如 Cohere 开源的语音转录模型、Zed 的代码编辑预测模型以及多个OCR和检索增强生成（RAG）模型，表明开源社区正致力于构建覆盖工作流各环节的专用、低成本工具链。

原文：Latest open artifacts (#20): New orgs! New types of models! With Nemotron Super, Sarvam, Cohere Transcribe, & others · 作者 Nathan Lambert