Four-Lane Codex Independent Session Test

V0.1.8

This ABCD test channel supports cleaner four-lane comparison in the current runtime: the local backend creates four independent Codex sessions, dispatches neutral development prompts, and lets the collector read thread tokens, timing artifacts, and agent topology; workers do not need to know they are participating in a test.

四路Codex独立会话测试

V0.1.8

这个 ABCD 测试频道用于当前运行时里更干净的四组对照:本地后端创建四个独立 Codex 会话并分发中性的开发提示词,让 collector 读取 thread token、时间产物和 Agent 拓扑;各组 worker 不需要知道自己正在参与测试。

Freeze one prompt, then run four sessions in parallel.

The page records the dispatch point and generates a collector command. Actual execution happens inside four isolated Codex lanes.

先冻结一组提示词,再并行启动四个会话。

页面负责记录分发时间点并生成采集命令。真正开发发生在四个隔离 Codex 会话里。

自动保存:标题和提示词会永久保存;thread id 由后端每轮自动创建。

Parallel model live status · waiting model 并行模型实时状态 · 等待模型 等待连接四个会话。

SISAGA (等待计时) Web

等待实时状态。

SISAGA+Harness (等待计时) Web

等待实时状态。

Only Harness (等待计时) Web

等待实时状态。

原生Agent (等待计时) Web

等待实时状态。
本轮进行中/等待完成 等待 /api/independent-ab/live-status 返回当前测试轮。 等待当前版本证明。 下一轮当前版本状态待检测。 当前版本完成审计待检测。
Model大模型版本 等待真实模型证据
Lane链路 SISAGA Pure SISAGA+Harness Only Harness 原生Agent
Model version大模型版本 缺少真实模型证据 缺少真实模型证据 缺少真实模型证据 缺少真实模型证据
Improvement index提升指数? 缺少本轮证据 缺少本轮证据 缺少本轮证据 缺少本轮证据
Dispatch to acceptance分发到验收 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Startup offset启动偏移 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Active work window主动工作窗口 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Token usageToken 消耗 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Prime and peer listPrime 与 Peer 列表 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Test validity测试有效性 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成
Quality conclusion质量结论 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成 本轮进行中/等待完成

等待本轮后端一致性核对数据。

Parameter参数 SISAGA Pure SISAGA+Harness Only Harness 原生Agent Requirement要求 Status状态
等待本轮后端一致性核对数据。

Unified worker prompt

统一 worker 提示词

Collector command

Collector 命令