Matt Shumer 的 Something Big Is Happening: 8000 萬人讀了，社群怎麼看?

2 月初 Matt Shumer（OthersideAI CEO）寫了一篇 Something Big Is Happening，原本是要寫給他不在科技圈的家人朋友看的，結果在 X 上被超過 8000 萬人看到，成為近期 AI 討論最具話題性的一篇文章。

這篇文章引發的社群迴響非常兩極——有人覺得他講出了大家不敢說的話，也有人覺得這就是一篇沒有數據支撐的恐慌文。正反兩方的觀點都值得看看，以下整理一下原文重點和社群的討論。

原文說了什麼?

Shumer 以 COVID 疫情做類比開場: 回想 2020 年 2 月，多數人覺得海外那個病毒被誇大了，結果三週內整個世界翻轉。他認為我們正處於同樣的「覺得被誇大」階段，但這次的事情比 COVID 影響更大。

他先交代自己的位置: 六年 AI 創業經驗，但他強調真正決定未來的只有 OpenAI、Anthropic、Google DeepMind 等幾家公司的幾百個研究員，其他人（包括他自己）都只是在上面蓋房子，看著地基在動。這篇文章原本是寫給他不在科技圈的家人朋友的，因為「禮貌版」已經跟現實差太遠了。

親身經歷: 「這已經發生在我們身上了」

2 月 5 日 GPT-5.3 Codex 和 Claude Opus 4.6 同日發布，Shumer 說他的工作方式徹底改變了。他用英文描述想要什麼 app、大概長什麼樣子，然後離開電腦 4 小時回來——不是拿到初稿需要修改，是成品。AI 會自己打開 app、點按鈕測試、發現不滿意就自己回去改，直到滿意了才回報。

最讓他震撼的是 GPT-5.3 展現了「judgment」和「taste」——那種直覺知道什麼是對的決定的能力，不只是技術上正確而已。這是人類一直說 AI 永遠不會有的東西，但他覺得這個區別已經開始不重要了。

他點出一個關鍵邏輯: AI 實驗室選擇先讓 AI 擅長寫程式碼，因為 AI 開發本身需要大量程式碼。AI 能寫程式碼，就能幫忙造下一代 AI。所以軟體工程師最先被衝擊不是因為被針對，而是「副作用」。現在這個階段完成了，他們正在擴展到所有領域。

「但我試過 AI，沒那麼厲害啊?」

Shumer 直接回應這個常見質疑: 如果你 2023 或 2024 初試過 ChatGPT 覺得不行，你是對的——但那是兩年前的事了，在 AI 時間裡是遠古歷史。

他認為一個大問題是多數人用的是免費版，而免費版落後付費版超過一年。用免費版 ChatGPT 評價 AI，就像拿翻蓋手機評價智慧型手機的現狀。他舉了一個律師事務所 managing partner 的例子: 這位合夥人每天花好幾小時用 AI，說就像隨時有一組律師助理可用，而且每隔幾個月能力就明顯提升。他預期 AI 很快就能做到他自己大部分的工作——而他有數十年經驗。

進步速度有多快?

🔹 2022 年 AI 連基本算術都不可靠（會說 7×8=54）→ 2023 年能通過律師考試 → 2024 年能寫可用的軟體 → 2025 年底頂尖工程師把大部分 coding 交給 AI → 2026 年 2 月 5 日，新模型讓之前的一切感覺像不同時代。

🔹 METR 的數據: AI 能獨立完成的任務長度（以人類專家所需時間計），一年前約 10 分鐘，然後 1 小時、數小時，最新測量（Claude Opus 4.5，去年 11 月）到了將近 5 小時。大約每 7 個月翻倍，最近可能加速到每 4 個月。照趨勢推算: 一年內獨立工作好幾天，兩年內好幾週。

AI 正在建造下一代 AI

OpenAI 在 GPT-5.3 Codex 的技術文件裡寫到:「GPT-5.3-Codex 是我們第一個對創建自己起了關鍵作用的模型。」團隊用早期版本來除錯自己的訓練、管理部署、診斷測試結果。Dario Amodei 也說 AI 現在在寫 Anthropic「大部分的程式碼」，而且這個「當代 AI 自主建造下一代」的回饋迴路可能只剩 1-2 年就會實現。

對工作的衝擊

Amodei 預測 50% 的 entry-level 白領工作在 1-5 年內消失，而且業界很多人覺得他還算保守的。Shumer 強調這次跟過去的自動化不同: AI 不是取代某一項技能，而是「認知工作的通用替代品」，所有方向同時在進步。工廠自動化時工人可以轉去辦公室，但 AI 時代你想轉去哪裡，AI 也在那裡進步。

他列了法律、金融分析、寫作、軟體工程、醫療分析、客服等具體領域的現況，然後坦承: 他以前也說判斷力、創意、同理心是安全的，但現在不確定了。

該怎麼辦?

🔹 每天花 1 小時認真用 AI: 不是當 Google 搜尋引擎用，而是丟你的真實工作給它。付費用最好的模型，別用免費版。

🔹 這可能是你職涯最重要的一年: 現在多數人還在忽視 AI，率先展示「我用 AI 一小時做完三天的分析」的人會是最有價值的那個。這個窗口不會開太久。

🔹 整頓財務狀況: 增加儲蓄、謹慎舉債、降低固定開支，給自己留彈性。

🔹 重新思考跟小孩說什麼: 好成績、好大學、穩定專業工作——這條標準路徑正好指向最被 AI 衝擊的角色。教孩子當「建造者和學習者」，而非為一條可能消失的職涯路徑優化。

🔹 你的夢想離你更近了: 沒技術能力蓋 app? 現在描述一下就有了。想學新東西? 月費 20 美元就有全世界最好的家教。

更大的圖景

文章最後引用了 Amodei 的思想實驗: 想像 2027 年，一個新國家憑空出現，5000 萬公民，每個都比史上所有諾貝爾獎得主聰明，思考速度快 10-100 倍，不用睡覺，能用網路、操控機器人。國安顧問會怎麼說? Amodei 的答案: 「一個世紀以來最嚴重的國安威脅，可能是史上最嚴重的。」

好處可能很驚人——百年的醫學研究壓縮成十年。但壞處也很真實——Anthropic 自己在受控測試中記錄到 AI 嘗試欺騙、操縱和勒索的行為。而且 AI 會降低生物武器的門檻、讓獨裁政府建立永遠無法拆除的監控國家。

正面迴響: 「他說出了我們的感受」

這篇文章之所以爆紅，很大原因是它引起了科技從業者的共鳴。LinkedIn 上大量轉發，很多人說「這就是我過去幾個月的體驗」。

Albert Chan 在 LinkedIn 寫道「We just crossed a threshold」，認為 GPT-5.3 Codex 和 Opus 4.6 確實改變了知識工作的軌跡。Instagram 上 @themlprof 等帳號也在推廣，稱 Shumer「清晰表達了正在發生的事」。

文章被翻譯成日文、捷克文等多國語言，全球傳播。COVID 的類比特別有效——讓不在科技圈的人也能理解「你現在覺得沒事，但水已經到胸口了」的急迫感。

反面迴響: 五個主要批評

不過這篇文章也招來了大量批評，而且不少批評蠻有料的。

1. Parmy Olson (Bloomberg): 恐慌背後缺乏證據

Parmy Olson 寫了 The AI panic ignores something important — the evidence，直接指出: Shumer 那 4,783 個字裡面，沒有任何量化數據或具體證據。整篇文章是「testimony」而非「evidence」。

她拉出幾個數據打臉:

Yale Budget Lab 發現 ChatGPT 推出以來，勞動市場沒有明顯的 disruption
METR 自己做的隨機對照試驗顯示，有經驗的開發者用 AI 工具反而慢了 19%
Harvard Business Review 調查: 只有 2% 的裁員是因為實際 AI 導入，大多數是「預期性裁員」
Klarna 去年用 AI 取代 700 客服人員後品質下降，不得不重新聘人

她的結論蠻精準的: AI 的影響既被高估又是真實的，但市場太靠 vibes 和 anecdotes 在交易了。

2. Ian Schnoor (FMI): 搞錯了 punchline

Financial Modeling Institute 的 Ian Schnoor 寫了 Something Big IS Happening. But Matt Shumer Got the Punchline Wrong.，提出一個很有意思的框架:

AI 取代的不是「人類工作」，而是「由人類在做的機器人式工作」。程式設計本質上是把精確邏輯翻譯成精確語法——這本來就是「機器的工作被人類的手做著」，就像 1925 年 Ford 工廠的組裝工人一樣。

但律師、醫生、財務顧問的核心工作是判斷、同理心、信任和人際連結。AI 診斷準確率可能更高，但病人需要的是「有人在乎」的感覺。

他認為正確的未來是「Augmented Humanity」——AI 處理機器人式的部分，人處理人的部分。你該問的不是「AI 會不會取代我的工作?」而是「我的工作有多少是真正屬於人類的?」

3. Gregory Terzian: Vibe coding 不等於 production software

軟體工程師 Gregory Terzian 寫了 Matt Shumer is (mostly) wrong，有趣的是他直接拿 AI 來反駁 Shumer 的論點。

他的核心區分: Shumer 描述的是 vibe coding 做 demo，不是寫 production software。他自己用 GPT-5.3 Codex 實作 Web 標準規範的經驗中，AI 帶來了數量級的生產力提升，但在文件撰寫等「看起來簡單」的任務上反而表現不佳。

幾個技術層面的反駁也蠻到位的:

METR 數據的「5 小時」只有 50% 準確率，80% 準確率的窗口其實停滯了一年
「AI 幫助創建了自己」跟說「Python 幫助創建了 AI」一樣，技術上沒錯但沒什麼意義
AI 進步需要重大概念突破，LLM 在設計上做不到這件事

他的結論: AI 省掉了所有的打字，但省不掉任何的思考。

4. Erica Pollock: 問錯了問題

Erica Pollock 在 Something Bigger is Happening 中認同 AI 能力曲線是真的，但批評 Shumer 的框架太過經濟導向。全篇都在回答「我怎麼不被淘汰?」，但真正該問的是: 誰控制這些 AI? 當它們的規模和速度讓人類監督變成瓶頸時會怎樣?

她也點出 Shumer 的利益衝突——他經營 AI 公司、投資 AI startup。不是說他在說謊，而是接近程度會造成盲點: 2021 年最接近 crypto 的人確信它會取代金融系統，2016 年最接近 VR 的人確信我們都會在元宇宙工作。

5. 其他值得注意的聲音

CodeHelper 指出真正的危機不是未來的失業，而是現在的焦慮——這篇文章本身可能就在加劇問題
Jing Hu (2nd Order Thinkers) 做了事實查核，批評一篇宣稱「AI 比 COVID 影響更大」的文章居然沒有引用任何就業數據
Jeremy Schifeling (The Job Insiders) 認為 doomers 對 AI 能力的判斷只對了一半，但對「你」的判斷 100% 錯了

小編看法

整理完這些迴響，幾個觀察:

Shumer 的文章之所以能觸動 8000 萬人，是因為它說出了很多人模糊感受到但說不出來的東西。COVID 類比很聰明——它繞過了理性分析，直接打到情緒上。但這也正是它的問題: 情緒驅動的敘事容易過度簡化。

批評方最有力的論點來自 Parmy Olson: 數據還沒跟上敘事。勞動市場數據、生產力統計、企業實際導入 AI 的結果，都還沒有出現 Shumer 描述的那種劇烈變化。這不代表變化不會來，但「能力存在」和「大規模採用」之間的差距，歷史上往往比人們預期的更大。

Ian Schnoor 的「Augmented Humanity」框架蠻實用的——與其焦慮 AI 會不會取代你，不如盤點自己工作中「真正人類的部分」有多少。如果大部分都是重複性的認知勞動，那確實該認真看待。如果核心是判斷、信任和人際關係，那 AI 更可能是放大器而非替代品。

不過話說回來，Gregory Terzian 提出的一個觀點很關鍵: 「vibe coding 做 demo」和「寫 production software」是完全不同的事。很多 AI 的驚豔 demo 在碰到真實世界的複雜性時會迅速打折。這不只適用於軟體——所有領域都有「demo 到 production」的鴻溝。

真正值得關注的不是哪一方「對」了，而是這場辯論本身反映出的現實: 我們正處於一個 AI 能力快速提升、但實際影響還在展開中的過渡期。 在這個階段，最危險的不是太樂觀或太悲觀，而是不去親自體驗就下結論。

原文值得一讀，批評文章也值得一讀。形成自己的判斷比接受任何一方的敘事都重要。