Matt Shumer 的 Something Big Is Happening: 8000 萬人讀了,社群怎麼看?
2 月初 Matt Shumer(OthersideAI CEO)寫了一篇 Something Big Is Happening,原本是要寫給他不在科技圈的家人朋友看的,結果在 X 上被超過 8000 萬人看到,成為近期 AI 討論最具話題性的一篇文章。
這篇文章引發的社群迴響非常兩極——有人覺得他講出了大家不敢說的話,也有人覺得這就是一篇沒有數據支撐的恐慌文。正反兩方的觀點都值得看看,以下整理一下原文重點和社群的討論。
原文說了什麼?
Shumer 以 COVID 疫情做類比開場: 回想 2020 年 2 月,多數人覺得海外那個病毒被誇大了,結果三週內整個世界翻轉。他認為我們正處於同樣的「覺得被誇大」階段,但這次的事情比 COVID 影響更大。
他先交代自己的位置: 六年 AI 創業經驗,但他強調真正決定未來的只有 OpenAI、Anthropic、Google DeepMind 等幾家公司的幾百個研究員,其他人(包括他自己)都只是在上面蓋房子,看著地基在動。這篇文章原本是寫給他不在科技圈的家人朋友的,因為「禮貌版」已經跟現實差太遠了。
親身經歷: 「這已經發生在我們身上了」
2 月 5 日 GPT-5.3 Codex 和 Claude Opus 4.6 同日發布,Shumer 說他的工作方式徹底改變了。他用英文描述想要什麼 app、大概長什麼樣子,然後離開電腦 4 小時回來——不是拿到初稿需要修改,是成品。AI 會自己打開 app、點按鈕測試、發現不滿意就自己回去改,直到滿意了才回報。
最讓他震撼的是 GPT-5.3 展現了「judgment」和「taste」——那種直覺知道什麼是對的決定的能力,不只是技術上正確而已。這是人類一直說 AI 永遠不會有的東西,但他覺得這個區別已經開始不重要了。
他點出一個關鍵邏輯: AI 實驗室選擇先讓 AI 擅長寫程式碼,因為 AI 開發本身需要大量程式碼。AI 能寫程式碼,就能幫忙造下一代 AI。所以軟體工程師最先被衝擊不是因為被針對,而是「副作用」。現在這個階段完成了,他們正在擴展到所有領域。
「但我試過 AI,沒那麼厲害啊?」
Shumer 直接回應這個常見質疑: 如果你 2023 或 2024 初試過 ChatGPT 覺得不行,你是對的——但那是兩年前的事了,在 AI 時間裡是遠古歷史。
他認為一個大問題是多數人用的是免費版,而免費版落後付費版超過一年。用免費版 ChatGPT 評價 AI,就像拿翻蓋手機評價智慧型手機的現狀。他舉了一個律師事務所 managing partner 的例子: 這位合夥人每天花好幾小時用 AI,說就像隨時有一組律師助理可用,而且每隔幾個月能力就明顯提升。他預期 AI 很快就能做到他自己大部分的工作——而他有數十年經驗。
進步速度有多快?
🔹 2022 年 AI 連基本算術都不可靠(會說 7×8=54)→ 2023 年能通過律師考試 → 2024 年能寫可用的軟體 → 2025 年底頂尖工程師把大部分 coding 交給 AI → 2026 年 2 月 5 日,新模型讓之前的一切感覺像不同時代。
🔹 METR 的數據: AI 能獨立完成的任務長度(以人類專家所需時間計),一年前約 10 分鐘,然後 1 小時、數小時,最新測量(Claude Opus 4.5,去年 11 月)到了將近 5 小時。大約每 7 個月翻倍,最近可能加速到每 4 個月。照趨勢推算: 一年內獨立工作好幾天,兩年內好幾週。
AI 正在建造下一代 AI
OpenAI 在 GPT-5.3 Codex 的技術文件裡寫到:「GPT-5.3-Codex 是我們第一個對創建自己起了關鍵作用的模型。」團隊用早期版本來除錯自己的訓練、管理部署、診斷測試結果。Dario Amodei 也說 AI 現在在寫 Anthropic「大部分的程式碼」,而且這個「當代 AI 自主建造下一代」的回饋迴路可能只剩 1-2 年就會實現。
對工作的衝擊
Amodei 預測 50% 的 entry-level 白領工作在 1-5 年內消失,而且業界很多人覺得他還算保守的。Shumer 強調這次跟過去的自動化不同: AI 不是取代某一項技能,而是「認知工作的通用替代品」,所有方向同時在進步。工廠自動化時工人可以轉去辦公室,但 AI 時代你想轉去哪裡,AI 也在那裡進步。
他列了法律、金融分析、寫作、軟體工程、醫療分析、客服等具體領域的現況,然後坦承: 他以前也說判斷力、創意、同理心是安全的,但現在不確定了。
該怎麼辦?
🔹 每天花 1 小時認真用 AI: 不是當 Google 搜尋引擎用,而是丟你的真實工作給它。付費用最好的模型,別用免費版。
🔹 這可能是你職涯最重要的一年: 現在多數人還在忽視 AI,率先展示「我用 AI 一小時做完三天的分析」的人會是最有價值的那個。這個窗口不會開太久。
🔹 整頓財務狀況: 增加儲蓄、謹慎舉債、降低固定開支,給自己留彈性。
🔹 重新思考跟小孩說什麼: 好成績、好大學、穩定專業工作——這條標準路徑正好指向最被 AI 衝擊的角色。教孩子當「建造者和學習者」,而非為一條可能消失的職涯路徑優化。
🔹 你的夢想離你更近了: 沒技術能力蓋 app? 現在描述一下就有了。想學新東西? 月費 20 美元就有全世界最好的家教。
更大的圖景
文章最後引用了 Amodei 的思想實驗: 想像 2027 年,一個新國家憑空出現,5000 萬公民,每個都比史上所有諾貝爾獎得主聰明,思考速度快 10-100 倍,不用睡覺,能用網路、操控機器人。國安顧問會怎麼說? Amodei 的答案: 「一個世紀以來最嚴重的國安威脅,可能是史上最嚴重的。」
好處可能很驚人——百年的醫學研究壓縮成十年。但壞處也很真實——Anthropic 自己在受控測試中記錄到 AI 嘗試欺騙、操縱和勒索的行為。而且 AI 會降低生物武器的門檻、讓獨裁政府建立永遠無法拆除的監控國家。
正面迴響: 「他說出了我們的感受」
這篇文章之所以爆紅,很大原因是它引起了科技從業者的共鳴。LinkedIn 上大量轉發,很多人說「這就是我過去幾個月的體驗」。
Albert Chan 在 LinkedIn 寫道「We just crossed a threshold」,認為 GPT-5.3 Codex 和 Opus 4.6 確實改變了知識工作的軌跡。Instagram 上 @themlprof 等帳號也在推廣,稱 Shumer「清晰表達了正在發生的事」。
文章被翻譯成日文、捷克文等多國語言,全球傳播。COVID 的類比特別有效——讓不在科技圈的人也能理解「你現在覺得沒事,但水已經到胸口了」的急迫感。
反面迴響: 五個主要批評
不過這篇文章也招來了大量批評,而且不少批評蠻有料的。
1. Parmy Olson (Bloomberg): 恐慌背後缺乏證據
Parmy Olson 寫了 The AI panic ignores something important — the evidence,直接指出: Shumer 那 4,783 個字裡面,沒有任何量化數據或具體證據。整篇文章是「testimony」而非「evidence」。
她拉出幾個數據打臉:
- Yale Budget Lab 發現 ChatGPT 推出以來,勞動市場沒有明顯的 disruption
- METR 自己做的隨機對照試驗顯示,有經驗的開發者用 AI 工具反而慢了 19%
- Harvard Business Review 調查: 只有 2% 的裁員是因為實際 AI 導入,大多數是「預期性裁員」
- Klarna 去年用 AI 取代 700 客服人員後品質下降,不得不重新聘人
她的結論蠻精準的: AI 的影響既被高估又是真實的,但市場太靠 vibes 和 anecdotes 在交易了。
2. Ian Schnoor (FMI): 搞錯了 punchline
Financial Modeling Institute 的 Ian Schnoor 寫了 Something Big IS Happening. But Matt Shumer Got the Punchline Wrong.,提出一個很有意思的框架:
AI 取代的不是「人類工作」,而是「由人類在做的機器人式工作」。程式設計本質上是把精確邏輯翻譯成精確語法——這本來就是「機器的工作被人類的手做著」,就像 1925 年 Ford 工廠的組裝工人一樣。
但律師、醫生、財務顧問的核心工作是判斷、同理心、信任和人際連結。AI 診斷準確率可能更高,但病人需要的是「有人在乎」的感覺。
他認為正確的未來是「Augmented Humanity」——AI 處理機器人式的部分,人處理人的部分。你該問的不是「AI 會不會取代我的工作?」而是「我的工作有多少是真正屬於人類的?」
3. Gregory Terzian: Vibe coding 不等於 production software
軟體工程師 Gregory Terzian 寫了 Matt Shumer is (mostly) wrong,有趣的是他直接拿 AI 來反駁 Shumer 的論點。
他的核心區分: Shumer 描述的是 vibe coding 做 demo,不是寫 production software。他自己用 GPT-5.3 Codex 實作 Web 標準規範的經驗中,AI 帶來了數量級的生產力提升,但在文件撰寫等「看起來簡單」的任務上反而表現不佳。
幾個技術層面的反駁也蠻到位的:
- METR 數據的「5 小時」只有 50% 準確率,80% 準確率的窗口其實停滯了一年
- 「AI 幫助創建了自己」跟說「Python 幫助創建了 AI」一樣,技術上沒錯但沒什麼意義
- AI 進步需要重大概念突破,LLM 在設計上做不到這件事
他的結論: AI 省掉了所有的打字,但省不掉任何的思考。
4. Erica Pollock: 問錯了問題
Erica Pollock 在 Something Bigger is Happening 中認同 AI 能力曲線是真的,但批評 Shumer 的框架太過經濟導向。全篇都在回答「我怎麼不被淘汰?」,但真正該問的是: 誰控制這些 AI? 當它們的規模和速度讓人類監督變成瓶頸時會怎樣?
她也點出 Shumer 的利益衝突——他經營 AI 公司、投資 AI startup。不是說他在說謊,而是接近程度會造成盲點: 2021 年最接近 crypto 的人確信它會取代金融系統,2016 年最接近 VR 的人確信我們都會在元宇宙工作。
5. 其他值得注意的聲音
- CodeHelper 指出真正的危機不是未來的失業,而是現在的焦慮——這篇文章本身可能就在加劇問題
- Jing Hu (2nd Order Thinkers) 做了事實查核,批評一篇宣稱「AI 比 COVID 影響更大」的文章居然沒有引用任何就業數據
- Jeremy Schifeling (The Job Insiders) 認為 doomers 對 AI 能力的判斷只對了一半,但對「你」的判斷 100% 錯了
小編看法
整理完這些迴響,幾個觀察:
Shumer 的文章之所以能觸動 8000 萬人,是因為它說出了很多人模糊感受到但說不出來的東西。COVID 類比很聰明——它繞過了理性分析,直接打到情緒上。但這也正是它的問題: 情緒驅動的敘事容易過度簡化。
批評方最有力的論點來自 Parmy Olson: 數據還沒跟上敘事。勞動市場數據、生產力統計、企業實際導入 AI 的結果,都還沒有出現 Shumer 描述的那種劇烈變化。這不代表變化不會來,但「能力存在」和「大規模採用」之間的差距,歷史上往往比人們預期的更大。
Ian Schnoor 的「Augmented Humanity」框架蠻實用的——與其焦慮 AI 會不會取代你,不如盤點自己工作中「真正人類的部分」有多少。如果大部分都是重複性的認知勞動,那確實該認真看待。如果核心是判斷、信任和人際關係,那 AI 更可能是放大器而非替代品。
不過話說回來,Gregory Terzian 提出的一個觀點很關鍵: 「vibe coding 做 demo」和「寫 production software」是完全不同的事。很多 AI 的驚豔 demo 在碰到真實世界的複雜性時會迅速打折。這不只適用於軟體——所有領域都有「demo 到 production」的鴻溝。
真正值得關注的不是哪一方「對」了,而是這場辯論本身反映出的現實: 我們正處於一個 AI 能力快速提升、但實際影響還在展開中的過渡期。 在這個階段,最危險的不是太樂觀或太悲觀,而是不去親自體驗就下結論。
原文值得一讀,批評文章也值得一讀。形成自己的判斷比接受任何一方的敘事都重要。