Home | 愛好 AI 工程 Blog

你的 Prompt 通得過 The Mom Test 嗎? 如何避免 LLM 的迎合問題

2026-07-02 PromptLLM

Marc Andreessen: AI 是 80 年的一夜成功，而真正的阻力不是技術

2026-07-01 AgentIndustryCoding

給 Agent 開發者的駕馭工程 (9): 自建 Agent 的框架選型: 全套 Deep Agent 還是從基礎構建?

2026-06-26 AgentCoding

給 Agent 開發者的駕馭工程 (8): 收尾: 會過期的 Harness, Model-Harness-Fit 與 Bitter Lesson

2026-06-26 AgentLLMEval

給 Agent 開發者的駕馭工程 (7): 進階: 自我改進 Harness, Meta-Harness 與爬坡

2026-06-26 AgentEval

給 Agent 開發者的駕馭工程 (6): 回饋時機四: 外層 Loop, Ralph、Symphony 與 Cron

2026-06-26 AgentWorkflow

給 Agent 開發者的駕馭工程 (5): 回饋時機三: 單輪結束的驗收, Goal 與 Outcomes

2026-06-26 AgentEval

給 Agent 開發者的駕馭工程 (4): 回饋時機二: 兩次 model request 之間,把訊息注入執行中的 agent

2026-06-26 AgentTool Use

給 Agent 開發者的駕馭工程 (3): 回饋時機一: 工具回傳值, 是寫給 agent 的回饋

2026-06-26 AgentTool UseContext Engineering

給 Agent 開發者的駕馭工程 (2): 核心: Agent 要的是回饋迴路,不是完美提示

2026-06-26 AgentContext EngineeringEval

給 Agent 開發者的駕馭工程 (1): 基礎: Deep Agent 的六項內建能力

2026-06-26 AgentCoding

當模型表現取決於推論算力: 評測分數正在失去意義，LLM 能力上限也量不出來

2026-06-11 EvalBenchmarkLLM