基准

Uni-CLI 的基准关注智能体真正付出的成本：发现命令要多久、返回内容有多大、失败后能不能定位和修复。

衡量什么

bash

npm run bench
npm run bench:quick
npm run bench:agent
npm run bench:gate

当前生成时间、运行环境、p50/p95 和完整结果见英文主报告 docs/BENCHMARK.md。

这些数字来自仓库生成的 stats.json 和静态 adapter manifest；固定 core 与主机动态发现命令不在下面的站点/命令总数中：

数字随开发更新，以 npm run stats 生成结果为准。

同一条命令可以按消费方选择格式：

bash

unicli hackernews top -f md
unicli hackernews top -f json
unicli hackernews top -f compact

人和智能体一起看时用 Markdown；脚本处理用 JSON；只做路由或摘要时用 compact。

失败不是只有“报错”。好的失败应该告诉智能体：

这也是 Uni-CLI 把错误包装进 AgentEnvelope 的原因。