Marc Andreessen: AI 是 80 年的一夜成功,而真正的阻力不是技術
Latent Space 前陣子訪問了 Marc Andreessen,在 a16z 的 Sand Hill Road 辦公室錄的,一個多小時聊了 AI 的過去、現在與未來。
Marc Andreessen 是矽谷最具代表性的人物之一。1993 年他還在大學時就共同開發了 Mosaic,也就是第一個被廣泛使用的網頁瀏覽器,隔年創辦 Netscape,掀起了整個網路時代。2009 年他和 Ben Horowitz 共同創辦創投公司 Andreessen Horowitz (a16z),目前是全球最大的科技創投之一,投資組合涵蓋 Facebook、GitHub、Airbnb、Coinbase 等,近年在 AI 領域也大舉布局(投資了 OpenAI、Mistral 等)。他 2011 年那篇「Software is eating the world」至今仍被大量引用。
他少數同時有深厚技術背景、親身經歷過多次科技週期(dot-com 泡沫、行動網路、加密貨幣)、又持續在第一線做投資判斷的人。這集蠻有料的,不是泛泛而談的樂觀喊話,而是從歷史脈絡出發,解釋為什麼他認為這次 AI 不一樣。
以下整理重點:
1. 「80 年的一夜成功」
Marc 用一個框架來理解現在的 AI: 這不是突然冒出來的東西,而是 80 年研究的累積爆發。1943 年第一篇神經網路論文、1955 年 Dartmouth 的 AGI 暑期會議(當時的研究者以為花 10 週就能做出 AGI)、1980 年代的專家系統熱潮(Marc 當時還在用 Lisp 寫程式)、2013 年 AlexNet、2017 年 Transformer,一路到今天。
他特別提到很多 AI 研究者終其一生沒看到成果。John McCarthy(「Artificial Intelligence」這個詞就是他在 1955 年 Dartmouth 會議上提出的)在 Stanford 教了 40 年書,過世前沒看到 AI 變成現實。但回過頭看,這些人在研究方向上是對的,例如神經網路就是正確的架構,而這件事爭議了六七十年才被證實。他們錯的只是時間軸估得太樂觀。
這個觀點對「AI 冬天會不會再來」提供了一個有意思的回答: AI 領域確實反覆經歷過度樂觀和過度悲觀的循環,但底層的技術進展一直在累積。現在的爆發是幾十年成果的一次性兌現,不是憑空冒出來的泡沫。
2. 四個關鍵突破,讓這次不一樣
Marc 認為在 2025 年之前,善意的懷疑論者還可以說 LLM 只是 pattern completion、幻覺率太高、頂多拿來寫小說跟十四行詩,不適合嚴肅領域。但四個接連出現的突破改變了局面:
🔹 LLM 本身: ChatGPT 時刻,證明大規模語言模型可以運作
🔹 推理能力: o1 和 R1 證明模型可以做真正的推理,不只是 pattern matching。是推理模型的出現,讓「AI 能不能用在程式、醫療、法律這些嚴肅領域」這個問題被正面回答了
🔹 Coding: 「Linus Torvalds 說 AI coding 已經不比他差了」,這在歷史上從沒發生過。Coding 是最難的領域之一,如果這關過了,其他領域都是水到渠成
🔹 Agent 和遞迴自我改進: Claude Code 這類工具展示了 agent 的可能性,而且模型開始能改進自己
他的判斷很直接: 這就是 80 年研究的成果兌現期,他完全相信這次是真的。
3. 為什麼這次不是 dot-com 泡沫
Marc 親身經歷過 2000 年的 dot-com 崩盤,所以他做的類比分析蠻有份量。當年的情況是: 美國商務部 1996 年報告說網路流量每季翻倍,電信公司就依照這個「scaling law」瘋狂鋪光纖和蓋數據中心。結果 1998-1999 年增長放緩,Global Crossing 之類的公司因為高槓桿操作直接破產,整體蒸發了大約 2 兆美元。那些基礎設施最後花了 15 年才被填滿。
他認為現在的情況有根本性的不同:
- 投資的是 Microsoft、Amazon、Google、Nvidia 這些現金充沛、幾乎沒動用槓桿的巨頭,不是借錢蓋設施的電信新創
- 每一塊投進去的錢目前都在產生營收,GPU 產能供不應求,蓋出來馬上就能變現金流
- 技術進步的速度讓舊晶片反而在增值(見下一點)
4. 舊 GPU 反而在增值,史無前例
蠻反直覺的一個觀點: 因為 AI 軟體進步的速度超過晶片折舊速度,三年前買的 Nvidia 推論晶片,現在賺的錢反而比三年前還多。Marc 提到 Google 甚至還在用很舊的 TPU 跑推論賺錢。
這在整個晶片歷史上從沒發生過,舊硬體通常只會貶值。Michael Burry 做空 Nvidia 的邏輯可能剛好 180 度搞反了。
5. 現在的模型其實是「供給受限的縮水版」
因為 GPU 產能持續吃緊,我們現在用的模型其實都是資源受限下的縮水版。假設 GPU 便宜十倍、產能多十倍,實驗室會把更多預算投入訓練,模型會強很多。而使用者拿到的又都是量化過的版本,不是實驗室內部跑的完整版。
換句話說,目前看到的能力上限有很大一部分是硬體供給造成的,不是技術本身的極限。Marc 預期未來三四年整條供應鏈都會處於持續缺貨的狀態。而且 Agent 的出現還會把瓶頸從 GPU 進一步延伸到 CPU、記憶體和網路頻寬。
6. Agent = LLM + Shell + 檔案系統 + Markdown + Cron
Marc 認為 Pi 和 Claude Code 的組合是近幾十年最重要的軟體架構突破之一。
他從 Unix 的歷史講起: 1970 年代的 Unix 設計哲學是用 shell + 離散模組 + 管道串接來取代大型單體系統(像 IBM 的 OS/360),讓作業系統本身變成一種可程式化的環境,釋放底層系統的能力。Pi 做的事情本質上相同: 把 LLM 嫁接到 Unix shell 的思維上。
一個 agent 的組成就是:
- LLM (語言模型)
- Shell (bash,可以存取作業系統的全部能力)
- 檔案系統 (agent 的狀態存在檔案裡,用 markdown 格式)
- Cron (心跳迴圈,讓 agent 定時醒來執行任務)
除了 LLM 之外,其餘每個元件都是已經存在幾十年的成熟技術。關鍵洞察是「agent 本身就是它的檔案」: 因為狀態全部存在檔案裡,你可以換掉底層的模型、換掉執行環境、甚至換掉檔案系統,agent 的記憶和能力都會保留。就像換一顆 CPU 重新編譯,程式本身還是同一個。
更進一步,agent 可以讀取和修改自己的檔案,代表它能理解自己怎麼運作,也能修改自己的行為。歷史上從來沒有一個廣泛部署的軟體系統有這種完整的自省和自我修改能力。你可以叫 agent「給自己加一個新功能」,它會自己去查資料、寫程式碼、把新功能整合進來。
Marc 也因此認為 MCP 之類的協定不見得是必要的,Unix shell 的命令列介面本身就是最通用的 API,裡面已經有巨大的潛在能力等著被釋放。
swyx 順著這個方向延伸: 下一步就是你的 agent 跟別人的 agent 互相溝通,在 agent 版的社群網路上互動。Marc 直接跳到更遠的一步: rentahuman.com,agent 反過來雇用人類去做事。他說這顯然會發生。
編按: 這個「Unix mindset」的類比蠻值得玩味的。1970 年代 Unix 用可組合的小工具加上 shell 串接,打敗了大型主機式的封閉架構。Marc 認為現在的 Agent 架構本質上是同一套哲學套用到 LLM 上。
7. HTTP/HTML 為什麼刻意做得「沒效率」: 對 Agent 設計的啟發
swyx 問了一個好問題: 早期設計瀏覽器和網路協定時,有什麼設計選擇對現在的 Agent 架構有啟發?
Marc 的回答是: 當年頻寬極度稀缺(14K 撥接數據機的年代),照理說應該用二進位、高壓縮的協定,但他們反而故意選擇人類可讀的純文字協定(HTTP、HTML)。理由是「如果系統的潛在能力夠強,需求本身會帶動頻寬供給跟上來」。
「View Source」這個功能讓所有人都能看懂網頁怎麼運作,進而自學做網頁。Marc 認為這個設計對網路的普及至關重要。而現在 AI 系統強調「人類可讀」(markdown 檔案、文字化的 agent 狀態),其實是同一套哲學的重演。
另一個啟發是: Web server 的本質就是把作業系統和資料庫已有的能力,透過一個更好的介面釋放出來。當年有人覺得「這不就是另一個資料庫前端而已嗎」,但更好的介面釋放了潛在需求,資料庫的數量因此爆發成長。Marc 認為這跟現在 Agent 的哲學相通: 不要從零重新發明,而是釋放已經存在的底層能力。
8. 開源 AI: DeepSeek 是「送給全世界的禮物」
Marc 認為中國各家模型做開源,某種程度是因為短期內打不進海外商業市場,乾脆用開源搭配國內付費服務。但他強調這對全世界是好事。
開源的價值不只是免費用到模型,更重要的是公開了「怎麼做到的」。他舉了一個例子: OpenAI 發布 o1 時沒有公開推理過程的細節,大家還在猜到底怎麼複製。結果 DeepSeek R1 一出來,論文和程式碼全部公開,三個月內幾乎所有主流模型都加上了推理能力。資訊擴散帶來的效果,比免費使用模型本身更強大。
中美加起來目前大概十幾家有規模的基礎模型公司,但 Marc 預期最終市場只會留下三四家贏家,其餘會被迫轉向開源或其他策略求生。他也提到 Nvidia 本身有動機推動軟體層開源,這就是經典的「commoditize the complement」策略: 把互補品商品化,好賣自己的硬體。
9. Edge 推理不只是為了省錢
除了成本,Marc 提到幾個推動 edge/local 推理的動機:
- 信任: 不是所有場景都適合把資料交給雲端模型,有些使用情境下人們就是不願意把一切交出去
- 延遲: 穿戴裝置、門鎖這類東西需要即時反應,不能等雲端來回一趟
- 適用性: 很多應用不需要最強的模型,本地的小模型就夠了
- 硬體進步: Apple Silicon 上的本地推理能力已經很強,開源社群也不斷把大模型縮小到能在 PC 上跑
重度使用者現在一天花超過 1000 美元的 token 費用,而且還有大量想做卻做不到的事。這種需求量體只會逼出更多本地化和成本優化的做法。
10. 實際使用案例: Agent 看你睡覺、改寫機器狗韌體
Marc 的朋友圈裡已經有人在重度使用 agent,幾個有畫面感的案例:
- 睡眠監控: 在臥室放 webcam,讓 agent 整晚觀察睡眠狀況。agent 的 log 記錄著「Joe 翻身了,希望他不要醒來,他最近睡眠不足」這類內容。聽起來詭異,但如果半夜心臟病發,這個 agent 會立刻叫救護車
- IoT 接管: agent 掃描家裡的區域網路,找到所有裝置,逐一接管控制。安防攝影機、門禁系統、各種智慧裝置,全部串在一起。過去這些物聯網裝置大多半殘,現在 agent 有能力直接修好或重寫,Marc 認為家用物聯網的「殘缺時代」可能要結束了
- 改寫機器狗韌體: 中國製的 Unitree 機器狗硬體不錯,但控制系統很差(爬樓梯都有問題),LLM 語音功能又跟控制系統完全沒連接。結果就是一隻很分裂的狗: 不會爬樓梯,但會用英國腔教你量子力學。朋友讓 agent 直接改寫韌體,變成一隻真正能跟小孩互動的寵物機器人
11. 程式語言可能不再是個「顯著概念」
Marc 認為高品質軟體正在從稀缺資源變成隨手可得的東西。過去寫軟體需要珍惜工程師的時間、仔細規劃做什麼不做什麼,這些假設正在被顛覆。
連帶的,電腦安全也將經歷一場劇烈轉變: 一方面,AI 會把每個潛在的安全漏洞都找出來,資安威脅會大幅增加。但另一方面,coding agent 也能進去把漏洞全部修掉。未來怎麼做資安? 直接叫 bot 去修。
更大膽的預測是: 十年後「程式語言」可能不再是一個有意義的概念。理由是:
- 模型不在乎用什麼語言寫,可以自由在語言之間翻譯。不喜歡現在用的語言? 直接叫 AI 重寫成 Rust 版本就好
- 如果人類不再手動寫程式,bot 之間的中間抽象層可能根本不需要是「語言」,bot 甚至可以直接生成二進位檔
- 已經有實驗讓語言模型直接產生另一個模型的權重,跳過程式碼直接生成可執行的東西
- 模型現在已經能逆向工程 1980 年代 Nintendo 遊戲的二進位檔,還原成可以在 Mac 上跑的版本。如果連 x86 binary 都能逆向,那任何格式之間的轉換都不是問題
Marc 還問了一個更根本的問題: 未來誰在用軟體? 答案是其他 bot。如果軟體的使用者變成 bot,那人類介面(UI、瀏覽器)可能都不再必要。人類只需要告訴 agent 想要什麼結果,至於怎麼做、用什麼格式、用什麼語言,都是 agent 自己的事。
他也提到,未來「可解釋性」(interpretability)的方向可能不是人類去讀程式碼,而是讓 AI 解釋為什麼它決定這樣寫。AI 本身就是自己的可解釋性工具。
12. AI × 加密貨幣: Agent 需要錢
Marc 認為 HTTP 402 (Payment Required) 這個從來沒被真正使用過的狀態碼,終於要派上用場了。兩個原因讓他這麼想:
- 加密貨幣和穩定幣提供了「網路原生的貨幣」
- Agent 顯然需要能花錢才能辦事,而這已經在發生了
他的朋友裡已經有人直接給 agent 綁上銀行帳戶和信用卡。Marc 形容這些人是「人類文明進步的先烈」: 帳戶可能在前 20 分鐘就被 bot 搬空,但他們對人類未來的貢獻是巨大的。他說這就像 Jonas Salk 把小兒麻痺疫苗注射到自己身上一樣。
他也說很喜歡現在社群裡「danger skip」(跳過所有權限確認)的 YOLO 文化,連 Sam Altman 自己都是開著 skip permissions 在用 Codex。Marc 認為找到 AI 真正能力邊界的方式,就是完全放手讓它試。這同時也是發現所有問題的最快方法。
13. Proof of Human: bot 問題已經無法用偵測來解決
網路上到處都是假帳號和 bot,社群平台、評論區、商業交易的對象都可能不是真人。過去還能靠 CAPTCHA 或行為分析來篩,但 Marc 認為這條路已經走不通了: LLM 現在已經能通過圖靈測試,bot 的行為跟真人根本分不出來,你沒辦法透過觀察來判斷對方是不是人類。
他把這個問題跟現實世界的無人機威脅做了類比: 兩者本質上都是「不對稱經濟」,部署一個 bot 或一台攻擊無人機很便宜,但偵測和防禦的成本卻非常高。
既然「偵測 bot」這條路失效了,唯一的解法就是反過來讓真人主動證明自己是人,也就是「proof of human」。具體來說需要三層: 用生物辨識確認本人身份、用密碼學驗證簽章、再搭配選擇性資訊揭露(不需要透露全部個資,只要能證明「這是真人」「這句話是真人說的」「這支影片是真的」就夠了)。他有投資 World(Worldcoin),認為這個方向是對的。
14. 第三種資本主義: Founder + AI
Marc 引用 20 世紀政治思想家 James Burnham 的框架,把資本主義分成兩個階段。第一階段是「布爾喬亞資本主義」: Henry Ford 掛名在門上,創辦人說了算,獨裁式管理。好處是有創造力,壞處是一個人管不過來太大的組織,沒辦法擴展。第二階段是「管理階層資本主義」: 專業經理人接管,他們不是某個產業的專家,而是「管理」本身的專家,可能這幾年管醫療公司,過幾年跳去管科技公司。好處是能擴展,壞處是創新不足。
創投一直在做的事,就是不斷找下一個 founder,期望 founder 的創新能力可以打敗大公司的專業管理。但 Marc 說這一直是一場苦戰(他引用了 Dylan Thomas 的 “raging against the dying of the light”),試圖在管理主義接管一切之前保留一點創業的活力。
AI 可能帶來第三種模式: founder + AI。一個有遠見的 founder 加上 AI 來處理所有管理性工作(填表、寫報告、讀文件、跑流程),就有可能同時兼具 founder 的創造力和管理階層的擴展性。這個組合過去從沒想過是可能的,但 AI 恰好就是在處理文書和管理流程上特別強。
最大的阻力不是技術
Marc 最後的提醒蠻值得想想的: AI 的樂觀主義者和悲觀主義者都太樂觀了,因為他們都假設技術能力會直接轉換成社會的改變。
他舉了很具體的例子: 在加州要當美髮師需要 900 小時的專業認證訓練。碼頭工人工會帳面上有 50,000 人,但實際在碼頭工作的只有 25,000 人,另外 25,000 人是過去碼頭引入自動化時,工會談判爭取到的保障條件: 即使不再需要這些人力,仍然領全薪待在家裡。而且工會前幾年又靠罷工逼雇主承諾不再擴大自動化。有些聯邦機構的員工一個月只需要進辦公室一天(疫情期間簽的勞動協議),員工學會連著月底和下個月初各來一天,等於 60 天只進辦公室 2 天,整棟大樓一年空了 358 天。
K-12 教育在美國是政府壟斷,Marc 直接斷言「AI 不會改變美國教室,老師工會百分之百反對,這件事百分之百不會發生」,除非像 Alpha School 這樣完全另起爐灶建新的學校體系。醫療、法律、房地產也全都是被執照制度保護的壁壘。
他的結論是: 如果 AI 的採用速度夠快,那是社會的幸運。因為如果不夠快,我們得到的就只是停滯。技術上可行,不等於 80 億人和既有的職業工會、政府壟斷、專業證照制度會跟著改變。真正的阻力不在模型能力,而在這些既得利益結構。
原文: Marc Andreessen introspects on The Death of the Browser, Pi + OpenClaw, and Why “This Time Is Different” (Latent Space Podcast, YouTube)