Four-Lane Codex Independent Session Test
V0.1.8This ABCD test channel supports cleaner four-lane comparison in the current runtime: the local backend creates four independent Codex sessions, dispatches neutral development prompts, and lets the collector read thread tokens, timing artifacts, and agent topology; workers do not need to know they are participating in a test.
四路Codex独立会话测试
V0.1.8这个 ABCD 测试频道用于当前运行时里更干净的四组对照:本地后端创建四个独立 Codex 会话并分发中性的开发提示词,让 collector 读取 thread token、时间产物和 Agent 拓扑;各组 worker 不需要知道自己正在参与测试。
Run setup
Freeze one prompt, then run four sessions in parallel.
The page records the dispatch point and generates a collector command. Actual execution happens inside four isolated Codex lanes.
运行设置
先冻结一组提示词,再并行启动四个会话。
页面负责记录分发时间点并生成采集命令。真正开发发生在四个隔离 Codex 会话里。
自动保存:标题和提示词会永久保存;thread id 由后端每轮自动创建。
| Lane链路 | SISAGA Pure | SISAGA+Harness | Only Harness | 原生Agent |
|---|---|---|---|---|
| Model version大模型版本 | 缺少真实模型证据 | 缺少真实模型证据 | 缺少真实模型证据 | 缺少真实模型证据 |
| Improvement index提升指数? | 缺少本轮证据 | 缺少本轮证据 | 缺少本轮证据 | 缺少本轮证据 |
| Dispatch to acceptance分发到验收 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Startup offset启动偏移 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Active work window主动工作窗口 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Token usageToken 消耗 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Prime and peer listPrime 与 Peer 列表 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Test validity测试有效性 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
| Quality conclusion质量结论 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 | 本轮进行中/等待完成 |
Fairness parameter alignment
一致性参数对照表
等待本轮后端一致性核对数据。
| Parameter参数 | SISAGA Pure | SISAGA+Harness | Only Harness | 原生Agent | Requirement要求 | Status状态 |
|---|---|---|---|---|---|---|
| 等待本轮后端一致性核对数据。 | ||||||