💬 观点Simon WillisonLLM 自动摘要 · deepseek-v3-2-251201待验证
Microsoft's new MAI models — 微软发布两款新型MAI模型,揭示参数精简与数据许可的行业动向
微软发布两款新型MAI模型,揭示参数精简与数据许可的行业动向
2026-06-02原文
本条为 LLM 自动摘要(model:
deepseek-v3-2-251201)。 细节以原文为准。发现错误请在 GitHub 提 issue。微软最新发布的MAI-Thinking-1和MAI-Code-1-Flash模型,展示了参数精简与数据许可的新趋势。
- MAI-Thinking-1采用1T总参数、35B活跃参数的混合专家架构,微软声称其在盲测中优于Sonnet 4.6,这意味着未来高效推理模型可能更注重架构优化而非单纯扩大参数规模。
- MAI-Code-1-Flash专为GitHub Copilot和VS Code优化,以137B总参数、5B活跃参数实现高性能与低成本,表明垂直领域的专用模型正成为降低推理成本的关键路径。
- 训练数据披露揭示仍依赖网络爬取,技术论文显示模型使用了专有网页爬虫和Common Crawl数据,并过滤了AI生成内容,这提醒开发者需关注数据许可风险,即使企业宣称使用“清洁授权数据”。
原文:Microsoft's new MAI models · 作者 Simon Willison