先跑測試,再說「完成」
結案前我的第一步是把四個指標實測一遍,不憑記憶。
分支 realign-rewrite-learn 的 working tree 乾淨;
git status 沒有 modified、staged 或 untracked 的東西;
與遠端同步停在 9c4cd7a9,沒有待 push 的 commit。
測試數字:Python pytest 154 passed,耗時 0.21 秒;Rust 的拆分測試模組加起來
同樣 154 通過;parity gate 的 14 個 fixture 全部 byte-for-byte 一致;clippy 0 warning。
記憶(M20 / 9c4cd7a9)與實測完全吻合。
這也是一個反向驗證:上次收工記錄是可信的。
北極星是否真正達成?
Headroom 學習重建的北極星是三件事:cache 不破、壓縮省錢、真 SSE 串流完整。 在評估 session 之前,這三件事有真流量證據嗎?有。
cache 不破:單 process Turn 2 觀察到 cache_read=63719,
代表所有前綴在第二輪全部命中,沒有因為壓縮改 bytes 而讓 cache 失效。
壓縮省錢:300 行 tool_result 的 input tokens 從 10516 降到 1939,省了 81.6%,
答案品質不變。真 SSE:重切器事件序列完整,沒有損失任何 token。
三個北極星目標全部有實測證據,不是紙上完成。
為什麼「現在」是結案點,不是繼續加策略
從 M12 到 M20,dispatcher 加了六片內容感知策略(log、diff、search、JSON、stack trace 加骨架),
每一片都是「一對 (applies, squeeze) + 註冊到 STRATEGIES,骨架不動」。
這個模式被驗證了超過十次。
此時繼續加策略,學到的不是新東西,是重複已經驗證的套路。 判定封存的標準不是「還能不能加」,而是「邊際學習價值是否趨近零」。 答案是肯定的。建構面已進入高原期。
三個候選的差異化處置
結案前還有三個選做候選,全部分析過,不是因為懶而跳過。
更多內容感知策略(key=value / env / .ini):重複十度驗證過的套路, 只是擴覆蓋率,沒有新的學習曲線,低值。
SSE buffer 攔截真閉環:在 2026-06-18 精讀解答本時已確認, 工業版刻意不在串流裡攔截——原因是架構抉擇,不是 bug。 送出去的 bytes 收不回;攔就得 buffer,buffer 就毀串流。 這個候選的方向本身錯了,做了也是錯的。
續讀解答本工業壓縮引擎:這是唯一殘留真正學習價值的候選, 但它屬於「讀」而非「建」,不影響整個專案的完整性。 四個 compressor 內部、cache_stabilization 型別矩陣、Magika ML 接線, 等未來想深入時可以單獨挑,不需要把整個專案維持在「開放」狀態等它。
結案不等於砍分支
分支 realign-rewrite-learn 保留,作學習存底。
main 從未動過,學習成果全在分支上(公開 fork、SSH)。
想繼續候選 3 的深讀時,git checkout realign-rewrite-learn 就能接續。
封存只是「我不再主動推進」,不是「刪掉」。
關鍵教訓
結案靠跑測試,不靠感覺:宣告「完成」之前先 pytest、cargo test、parity gate、git status——四個數字對了才算對,記憶不能當 ground truth。
北極星要有真流量證據,不是紙上完成:cache_read=63719、tokens 10516→1939、SSE 事件序列完整,這些才是「達成」的憑據。
邊際學習價值,不是「還能不能做」:建構面進入高原期是結案的正確判準。能做但學不到新東西,繼續做是消耗,不是進步。
方向錯的候選不做,理由要說清楚:SSE buffer 攔截不是技術難,是架構選擇錯;確認方向錯,直接跳過比強行實現更誠實。
封存不等於刪除:分支保留、main 不動,日後可接續的候選就留著,不必現在做完才算乾淨。