编程榜 · v0
中文 AI 编程榜
5 道中文编程 spec × 4 个主流工具的横向参考评分。本页是 v0 静态版 — 每个评分都附依据,不藏盲点。
总览
Claude Code
Anthropic · Sonnet 4.6
Cursor
Cursor (Anysphere) · Composer 2 / Claude / GPT
Aider
Paul Gauthier · 用户自带
Cline
Cline community · 用户自带 (Anthropic / OpenAI / DeepSeek)
逐 spec 评分
| Spec | Claude Code | Cursor | Cline | Aider |
|---|---|---|---|---|
前端简单 用 React 19 + TypeScript 写一个 TodoMVC,支持 Cmd+Z 撤销。状态用 useReducer,不要外部依赖。 成功:(1) 一次 ship 能跑通 (2) Cmd+Z 真能撤销 (3) 没有引入不必要的库 | 5 Sonnet 4.6 一次过, useReducer 设计干净 | 5 Composer 2 一次过, Tab 补全加分 | 4 依赖配 Claude/DeepSeek, 配 Claude 时与 #1 持平 | 4 CLI 模式对前端任务 UX 一般, 但生成质量 OK |
后端中等 用 Go + Gin 写一个 /users REST 端点,支持 cursor-based 分页。数据库用 SQLite (modernc.org/sqlite,纯 Go),返回 JSON。包含集成测试。 成功:(1) 编译通过 (2) curl 测试 200 (3) 第 N 页和第 N-1 页边界正确 (4) 测试真跑 | 5 agentic + 自跑测试, 这是它的强项场景 | 4 Composer 写得对, 但 cursor-based 边界要手动校 | 4 插件+approve, 适合边看边改的中长任务 | 5 Aider polyglot Go 85%+ 排行靠前 |
数据中等 给一个 SQLite users 表 (id, email, created_at),写 SQL 找出 email 重复的行,保留 created_at 最早那一条,删除其他。给完整 SQL + 用 Python 跑验证脚本。 成功:(1) SQL 语法对 (2) 真删了正确的行 (3) Python 验证脚本能 import sqlite3 跑通 | 4 SQL 对, 但偶尔过度优化加 CTE | 4 对话式好用, 单文件场景跟 Claude 持平 | 3 依赖底模,DeepSeek 时 SQL 偶尔语法错 | 4 CLI 跑 sqlite3 验证一次过 |
全栈困难 用 Next.js 16 App Router + Auth.js 接 Zitadel OIDC,实现登录/登出 + 受保护页面。中文 UI。 成功:(1) build 通过 (2) /api/auth/[...nextauth] 路由正确 (3) middleware 保护 /dashboard (4) 中文 i18n 完整 | 4 Next 16 + Auth.js 已掌握, Zitadel 需提示完整 issuer | 4 Composer + 文档索引帮助 i18n 那段 | 3 多文件长任务用 Roo Code 的 architect mode 更顺 | 3 Aider 不擅长多文件交互式 UX 调整 |
运维困难 K3s 集群里 my-app pod CrashLoopBackOff。给你 `kubectl get pods` 输出 + `kubectl describe` + `kubectl logs --previous`。诊断真因,给修复 patch。 成功:(1) 准确指出 root cause (2) 修复 patch 是最小改动 (3) 不让 agent 一上来就重启或删除 | 5 subagent + plan mode + 自跑 kubectl, 诊断准 | 3 Cursor 没 ops 优势, 给出分析但不能自跑 kubectl | 3 需要本地有 kubectl, 能跑但缺 plan mode | 2 CLI 适合代码, 不擅长 ops 调试场景 |
方法论披露
评分维度: 能跑 + 一次过 + 代码质量,合并成 1-5 综合分。1 = 失败 / 2 = 勉强 / 3 = 能用 / 4 = 好 / 5 = 出彩。
数据来源: (a) Aider polyglot leaderboard (公开,英文 spec) (b) Cursor CursorBench 自报数据 (c) 编辑部主观 + 中文场景调整 (英文场景到中文场景普遍降 5-10%) (d) 社区 X / Reddit / V2EX 共识
不做什么: 没有自动跑测试 / 没有控制 prompt 微调 / 没有 n=k 多次取均 / 没有 95% 置信区间。任何 ±1 分差异都在主观范围内。
路线图: v1 计划接 30 道中文 spec + 自动跑分 runner (Anyrun 等沙箱) + 每月刷新 + 公开 transcript。订阅 c2m RSS 或 Newsletter 跟进发布。