加载中…
Harness
Scaffolding / context window / tool use / eval loop 的工程实践文章。编辑部撰写,不走 LLM 自动摘要。
Subagent 不是 ChatGPT 多窗口:它是一个共享 prompt cache、持久化 memory、可断点续跑的进程模型。从源码理解它为什么这么设计。
BashTool 是 agent 最危险的工具 — 一条命令就能 rm -rf /。Anthropic 怎么用 5 层防御让它在生产可用?
Cursor 的护城河不是模型 size, 是 production-grade RL 闭环 + 自建 CursorBench + harness 工程纪律。三处反直觉决策拆给中文读者看。
295G SSD 挂在 /data, 根盘只 30G — 这条 HARD RULE 是怎么从一次 R5 节点失联 5 天的事故里逼出来的。
国内 IDC 部署非 .cn 域名要绕 ICP 拦截, Tailscale 关公网 22 又得显式 ssh root@ — 两层网络规则叠起来怎么不被锁死。