💬 观点Nathan LambertLLM 自动摘要 · deepseek-v3-2-251201待验证
Latest open artifacts (#20): New orgs! New types of — 盘点本月开源AI新模型:从多模态到专业工具,展现行业多元化创新
盘点本月开源AI新模型:从多模态到专业工具,展现行业多元化创新
2026-03-30原文
本条为 LLM 自动摘要(model:
deepseek-v3-2-251201)。 细节以原文为准。发现错误请在 GitHub 提 issue。本月开源模型生态呈现爆发式增长,不再由少数巨头主导,而是涌现出大量针对特定场景的模型。
- NVIDIA 发布了基于 LatentMoE 架构的 Nemotron Super 120B 模型,并公开了大部分预训练数据集,这为研究高效的专家混合模型架构提供了宝贵的开放资源。
- 印度公司 Sarvam 发布了在 12-16T 词元上训练的 105B 参数模型,在印度语言任务上表现卓越,凸显了主权AI和针对特定语言文化数据训练的重要性。
- 出现了众多专业工具模型,如 Cohere 开源的语音转录模型、Zed 的代码编辑预测模型以及多个OCR和检索增强生成(RAG)模型,表明开源社区正致力于构建覆盖工作流各环节的专用、低成本工具链。
原文:Latest open artifacts (#20): New orgs! New types of models! With Nemotron Super, Sarvam, Cohere Transcribe, & others · 作者 Nathan Lambert