💬 观点Nathan Lambert

What I’ve been building: ATOM Report, post-training — Nathan Lambert 分享其近期项目：ATOM报告、RLHF新书、后训练

Nathan Lambert 分享其近期项目：ATOM报告、RLHF新书、后训练课程及前沿研究，为AI从业者提供生态洞察与实用资源。

2026-04-14原文

本文为要点摘要，完整细节以原文为准。

本文汇总了作者近期的多项工作，旨在为AI社区提供实用的工具和知识。

ATOM报告更新：介绍了用于追踪开源语言模型生态的“相对采用指标”（RAM），该指标能归一化地评估不同规模模型的采用趋势，例如分析了Gemma 4的早期采用数据。这对开发者意味着提供了一个量化工具，以更清晰地把握模型流行度和技术风向。
RLHF书籍与配套课程：作者完成了关于人类反馈强化学习（RLHF）的书籍，并配套开发了免费的视频课程，涵盖从基础到实现的完整学习路径。这为希望深入理解后训练技术的从业者提供了体系化的教育资源，降低了学习门槛。
前沿技术研究参与：作者参与了两篇论文，一篇探讨多轮对话中模型能力的差距与训练数据构建，另一篇研究将元学习与自我反思应用于智能体搜索。这些研究指向了AI智能体开发中的核心挑战——如何优化交互与持续学习，为工具链设计提供了新的思路。

原文：What I’ve been building: ATOM Report, post-training course, finishing my book, and ongoing research · 作者 Nathan Lambert