编程榜 · v0

中文 AI 编程榜

5 道中文编程 spec × 4 个主流工具的横向参考评分。本页是 v0 静态版 — 每个评分都附依据,不藏盲点。

v0 静态版,不是自动 benchmark。评分来源:Aider polyglot leaderboard (公开) + CursorBench (Cursor 自报) + 编辑部主观估值 + 中文场景调整。自动跑分管道在 c2m 下一阶段路线图里。看到的差异不要当 ±2% 精度的事实。

总览

#14.6 / 5

Claude Code

Anthropic · Sonnet 5

按 token (典型 $30-100)

#24.0 / 5

Cursor

Cursor (Anysphere) · Composer 2 / Claude / GPT

$20 Pro / $40 Business

#33.6 / 5

Aider

Paul Gauthier · 用户自带

$0 (按 LLM provider 计费)开源插件直连 + LLM 需代理

#43.4 / 5

Cline

Cline community · 用户自带 (Anthropic / OpenAI / DeepSeek)

$0 (按 LLM provider 计费)开源插件直连 + LLM 需代理

逐 spec 评分

Spec	Claude Code	Cursor	Cline	Aider
前端简单用 React 19 + TypeScript 写一个 TodoMVC,支持 Cmd+Z 撤销。状态用 useReducer,不要外部依赖。成功:(1) 一次 ship 能跑通 (2) Cmd+Z 真能撤销 (3) 没有引入不必要的库	5 Sonnet 5 一次过, useReducer 设计干净	5 Composer 2 一次过, Tab 补全加分	4 依赖配 Claude/DeepSeek, 配 Claude 时与 #1 持平	4 CLI 模式对前端任务 UX 一般, 但生成质量 OK
后端中等用 Go + Gin 写一个 /users REST 端点,支持 cursor-based 分页。数据库用 SQLite (modernc.org/sqlite,纯 Go),返回 JSON。包含集成测试。成功:(1) 编译通过 (2) curl 测试 200 (3) 第 N 页和第 N-1 页边界正确 (4) 测试真跑	5 agentic + 自跑测试, 这是它的强项场景	4 Composer 写得对, 但 cursor-based 边界要手动校	4 插件+approve, 适合边看边改的中长任务	5 Aider polyglot Go 85%+ 排行靠前
数据中等给一个 SQLite users 表 (id, email, created_at),写 SQL 找出 email 重复的行,保留 created_at 最早那一条,删除其他。给完整 SQL + 用 Python 跑验证脚本。成功:(1) SQL 语法对 (2) 真删了正确的行 (3) Python 验证脚本能 import sqlite3 跑通	4 SQL 对, 但偶尔过度优化加 CTE	4 对话式好用, 单文件场景跟 Claude 持平	3 依赖底模,DeepSeek 时 SQL 偶尔语法错	4 CLI 跑 sqlite3 验证一次过
全栈困难用 Next.js 16 App Router + Auth.js 接 Zitadel OIDC,实现登录/登出 + 受保护页面。中文 UI。成功:(1) build 通过 (2) /api/auth/[...nextauth] 路由正确 (3) middleware 保护 /dashboard (4) 中文 i18n 完整	4 Next 16 + Auth.js 已掌握, Zitadel 需提示完整 issuer	4 Composer + 文档索引帮助 i18n 那段	3 多文件长任务用 Roo Code 的 architect mode 更顺	3 Aider 不擅长多文件交互式 UX 调整
运维困难 K3s 集群里 my-app pod CrashLoopBackOff。给你 `kubectl get pods` 输出 + `kubectl describe` + `kubectl logs --previous`。诊断真因,给修复 patch。成功:(1) 准确指出 root cause (2) 修复 patch 是最小改动 (3) 不让 agent 一上来就重启或删除	5 subagent + plan mode + 自跑 kubectl, 诊断准	3 Cursor 没 ops 优势, 给出分析但不能自跑 kubectl	3 需要本地有 kubectl, 能跑但缺 plan mode	2 CLI 适合代码, 不擅长 ops 调试场景

方法论披露

评分维度: 能跑 + 一次过 + 代码质量,合并成 1-5 综合分。1 = 失败 / 2 = 勉强 / 3 = 能用 / 4 = 好 / 5 = 出彩。

数据来源: (a) Aider polyglot leaderboard (公开,英文 spec) (b) Cursor CursorBench 自报数据 (c) 编辑部主观 + 中文场景调整 (英文场景到中文场景普遍降 5-10%) (d) 社区 X / Reddit / V2EX 共识

不做什么: 没有自动跑测试 / 没有控制 prompt 微调 / 没有 n=k 多次取均 / 没有 95% 置信区间。任何 ±1 分差异都在主观范围内。

路线图: v1 计划接 30 道中文 spec + 自动跑分 runner (Anyrun 等沙箱) + 每月刷新 + 公开 transcript。订阅 c2m RSS 或 Newsletter 跟进发布。

最近一次估值更新:2026-05-26 (编辑部 v0)

中文 AI 编程榜

5 道中文编程 spec × 4 个主流工具的横向参考评分。本页是 v0 静态版 — 每个评分都附依据,不藏盲点。

总览

#14.6 / 5

Claude Code

Anthropic · Sonnet 5

按 token (典型 $30-100)

#24.0 / 5

Cursor

Cursor (Anysphere) · Composer 2 / Claude / GPT

$20 Pro / $40 Business

#33.6 / 5

Aider

Paul Gauthier · 用户自带

$0 (按 LLM provider 计费)开源插件直连 + LLM 需代理

#43.4 / 5

Cline

Cline community · 用户自带 (Anthropic / OpenAI / DeepSeek)

$0 (按 LLM provider 计费)开源插件直连 + LLM 需代理

逐 spec 评分

Spec	Claude Code	Cursor	Cline	Aider
前端简单用 React 19 + TypeScript 写一个 TodoMVC,支持 Cmd+Z 撤销。状态用 useReducer,不要外部依赖。成功:(1) 一次 ship 能跑通 (2) Cmd+Z 真能撤销 (3) 没有引入不必要的库	5 Sonnet 5 一次过, useReducer 设计干净	5 Composer 2 一次过, Tab 补全加分	4 依赖配 Claude/DeepSeek, 配 Claude 时与 #1 持平	4 CLI 模式对前端任务 UX 一般, 但生成质量 OK
后端中等用 Go + Gin 写一个 /users REST 端点,支持 cursor-based 分页。数据库用 SQLite (modernc.org/sqlite,纯 Go),返回 JSON。包含集成测试。成功:(1) 编译通过 (2) curl 测试 200 (3) 第 N 页和第 N-1 页边界正确 (4) 测试真跑	5 agentic + 自跑测试, 这是它的强项场景	4 Composer 写得对, 但 cursor-based 边界要手动校	4 插件+approve, 适合边看边改的中长任务	5 Aider polyglot Go 85%+ 排行靠前
数据中等给一个 SQLite users 表 (id, email, created_at),写 SQL 找出 email 重复的行,保留 created_at 最早那一条,删除其他。给完整 SQL + 用 Python 跑验证脚本。成功:(1) SQL 语法对 (2) 真删了正确的行 (3) Python 验证脚本能 import sqlite3 跑通	4 SQL 对, 但偶尔过度优化加 CTE	4 对话式好用, 单文件场景跟 Claude 持平	3 依赖底模,DeepSeek 时 SQL 偶尔语法错	4 CLI 跑 sqlite3 验证一次过
全栈困难用 Next.js 16 App Router + Auth.js 接 Zitadel OIDC,实现登录/登出 + 受保护页面。中文 UI。成功:(1) build 通过 (2) /api/auth/[...nextauth] 路由正确 (3) middleware 保护 /dashboard (4) 中文 i18n 完整	4 Next 16 + Auth.js 已掌握, Zitadel 需提示完整 issuer	4 Composer + 文档索引帮助 i18n 那段	3 多文件长任务用 Roo Code 的 architect mode 更顺	3 Aider 不擅长多文件交互式 UX 调整
运维困难 K3s 集群里 my-app pod CrashLoopBackOff。给你 `kubectl get pods` 输出 + `kubectl describe` + `kubectl logs --previous`。诊断真因,给修复 patch。成功:(1) 准确指出 root cause (2) 修复 patch 是最小改动 (3) 不让 agent 一上来就重启或删除	5 subagent + plan mode + 自跑 kubectl, 诊断准	3 Cursor 没 ops 优势, 给出分析但不能自跑 kubectl	3 需要本地有 kubectl, 能跑但缺 plan mode	2 CLI 适合代码, 不擅长 ops 调试场景

方法论披露

评分维度: 能跑 + 一次过 + 代码质量,合并成 1-5 综合分。1 = 失败 / 2 = 勉强 / 3 = 能用 / 4 = 好 / 5 = 出彩。

不做什么: 没有自动跑测试 / 没有控制 prompt 微调 / 没有 n=k 多次取均 / 没有 95% 置信区间。任何 ±1 分差异都在主观范围内。

路线图: v1 计划接 30 道中文 spec + 自动跑分 runner (Anyrun 等沙箱) + 每月刷新 + 公开 transcript。订阅 c2m RSS 或 Newsletter 跟进发布。

最近一次估值更新:2026-05-26 (编辑部 v0)