給 Agent 開發者的駕馭工程 (9): 自建 Agent 的框架選型: 全套 Deep Agent 還是從基礎構建?

AgentCoding

給 Agent 開發者的駕馭工程 (8): 收尾: 會過期的 Harness, Model-Harness-Fit 與 Bitter Lesson

AgentLLMEval

給 Agent 開發者的駕馭工程 (7): 進階: 自我改進 Harness, Meta-Harness 與爬坡

AgentEval

給 Agent 開發者的駕馭工程 (6): 回饋時機四: 外層 Loop, Ralph、Symphony 與 Cron

AgentWorkflow

給 Agent 開發者的駕馭工程 (5): 回饋時機三: 單輪結束的驗收, Goal 與 Outcomes

AgentEval

給 Agent 開發者的駕馭工程 (4): 回饋時機二: 兩次 model request 之間,把訊息注入執行中的 agent

AgentTool Use

給 Agent 開發者的駕馭工程 (3): 回饋時機一: 工具回傳值, 是寫給 agent 的回饋

AgentTool UseContext Engineering

給 Agent 開發者的駕馭工程 (2): 核心: Agent 要的是回饋迴路,不是完美提示

AgentContext EngineeringEval

給 Agent 開發者的駕馭工程 (1): 基礎: Deep Agent 的六項內建能力

AgentCoding

當模型表現取決於推論算力: 評測分數正在失去意義,LLM 能力上限也量不出來

EvalBenchmarkLLM

Microsoft AI: 從零練起的 MAI 模型和平台佈局

LLMIndustry

Codex App 那些 CLI 做不到的 GUI 特色

CodingTool UseAgent