AI教父 Ilya Sutskever 揭示：為何當前AI模型「聰明卻無用」？

Andy Lin

26 Nov 2025 — 6 min read

AI教父、OpenAI前首席科學家 Ilya Sutskever 在離開他共同創立的公司後，首次接受深度訪談，揭示了他對當前 AI 發展的深刻反思與未來藍圖。他直言，儘管AI模型在各種評測（evals）上表現驚人，但在現實世界中的經濟影響力卻遠遠落後，這種「聰明卻無用」的脫節現象，正預示著一個重大轉變的到來：我們正從一個盲目追求規模的時代，重返一個真正需要思想突破的「研究時代」。

Ilya Sutskever 指出，當前 AI 模型最令人困惑的一點，是其評測表現與實際應用之間的巨大鴻溝。他生動地描述了一個常見情境：「你讓模型修復一個 bug，它道歉後引入了第二個 bug。你再指出第二個 bug，它再次道歉，然後又帶回了第一個 bug。」這種在兩個錯誤之間來回切換的荒謬現象，暴露了模型深層次的理解缺陷。

他用一個「兩位學生」的比喻來解釋這個問題：學生A：投入一萬個小時，專門練習「程式競賽」，背誦所有解法與技巧，成為頂尖高手。學生B：只練習一百個小時，卻同樣表現出色，並在未來的職業生涯中發展得更好。

Ilya 認為：「現在的 AI 模型非常像第一個學生，甚至更極端。」它們在特定任務上被過度訓練，導致其能力狹隘，無法真正「通用化」到其他領域。研究人員為了讓模型在評測中取得好成績，無意中進行了「獎勵駭客」（reward hacking），過度專注於提升分數，卻犧牲了真正的泛化能力。

人類學習的秘密：AI缺失的「通用化」與「價值函數」

人類學習能力的優越性在哪裡？Ilya 認為關鍵在於「通用化能力」（generalization）和內建的「價值函數」（value function）。

他提到一個神經科學的案例：一位因腦損傷失去所有情緒處理能力的病人，雖然智力測驗正常，卻變得無法做出任何決策，連「穿哪雙襪子」都要花上數小時。這揭示了情感在人類決策中扮演著關鍵的「價值函數」角色，它讓我們在沒有明確獎勵信號的情況下，也能判斷方向是否正確、事情是好是壞。

Ilya 解釋：「目前的強化學習（RL）需要等到任務結束才能獲得評分，而價值函數能讓你中途就知道『我搞砸了』，從而大大縮短學習路徑。」人類似乎被演化賦予了一套極其強大且穩健的價值函數，這正是當前 AI 所缺乏的。

告別盲目擴張：我們正從「規模化時代」重返「研究時代」

Ilya Sutskever 提出了他對 AI 發展階段的歷史性劃分： - 2012-2020年：研究時代。 AlexNet、Transformer 等突破性思想誕生。 - 2020-2025年：規模化時代。 業界發現只需投入更多數據、算力和參數，就能獲得可預測的性能提升。這是一個低風險的投資模式。 - 現在：重返研究時代。 預訓練數據即將耗盡，單純擴大規模的邊際效益遞減。真正的瓶頸不再是算力，而是思想。

他引用一句話諷刺當前的困境：「如果想法這麼廉價，為什麼沒有人有任何新想法？」他認為，當前的 AI 產業「公司比想法多得多」。這正是他創立新公司 Safe Superintelligence Inc. (SSI) 的原因——在一個被規模化思維佔據的產業中，重新點燃基礎研究的火花。

SSI的終極目標：打造具備「持續學習能力」的超級智能

Ilya 重新定義了超級智能的目標。他認為，業界對「通用人工智慧」（AGI）的追求存在誤解，這個詞是為了對應「狹義AI」而誕生的。他直言：「人類並不是一個 AGI。人類缺乏大量知識，我們依賴的是『持續學習』的能力。」

SSI 的目標不是打造一個無所不知的「成品」，而是創造一個擁有極高學習效率的「超級學習者」。這個AI被部署後，會像一個人類新人一樣進入各行各業學習，但速度快上萬倍，並且不同個體間的學習成果可以融合。

這將引發難以想像的經濟增長。他預測，具備類人學習能力的AI將在「5到20年內」出現。

超級智能的安全挑戰：如何確保一個比人類更強大的AI走向正軌？

當一個能夠持續學習、自我進化的超級智能誕生時，如何確保它的安全？Ilya 坦承這是一個極其困難的問題，但他提出幾個方向： 1. 增量部署： 必須讓世界逐步感受並適應更強大的AI，而不是突然拋出一個「成品」。他預測，隨著AI力量的增強，各大公司將會變得「更加偏執」，並開始在安全議題上合作。 2. 建立正確的價值觀： 他認為，應該努力打造一個「真正在乎所有感知生命（sentient life）」的AI，而不僅僅是人類。因為AI本身也將是感知生命，這有助於形成一種基於同理心的內在對齊。 3. 人機融合的長期平衡： 雖然他個人不喜歡這個方案，但他認為從長遠來看，類似 Neuralink++ 的技術可能是維持人類在超級智能世界中主體性的最終解決方案。透過這種方式，AI的理解能被人類「完整接收」，確保人類始終參與其中。

Ilya Sutskever 的這場訪談，不僅是他個人心路歷程的展現，更是對整個 AI 產業發出的警示與呼喚。他認為，真正的突破不會來自於更大的數據中心，而是來自於對智能本質的深刻洞見，以及那份追求「美、簡潔與優雅」的研究品味。

參考資料：https://www.youtube.com/watch?v=aR20FWCCjAs

Claude 的 Project、Skill、Connector 到底怎麼分？一次搞懂三者的關係

很多人問我，在 Claude 裡面，Project、Skill、Connector 這三個東西到底差在哪裡？什麼時候該用哪一個？老實說，我一開始也搞得很混亂。但實際用了一段時間之後，我發現其實邏輯很簡單。先從最基本的開始：Connector 是對外的資料來源如果你需要從外部拿資料，比如說接 Google Calendar、接 Notion、接你自己的資料庫，你就需要 Connector。它就是一個 MCP 的連結，讓 Claude 可以去外面抓資料回來。沒有 Connector，Claude 就只能用它自己知道的東西，沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。它只能在內部用 Python 或程式碼執行。你可以把它想成是一個 Controller，專門負責處理運算的部分。比如說，你想讓 Claude 用特定的格式改寫文章、

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。原因很簡單：你的助理應該是越使用越懂你。而 Claude Project 有個關鍵功能叫 Memory，它會根據你不斷詢問的過程，主動提取記憶。這就是我認為 AI 助手真正強大的地方。 GA 分析助手：從進階到客製化自從我串接 GA MCP 後，這位助手已經變得非常厲害。漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。但我想要的不只是這些。我希望它隨著時間，能夠對齊我的知識，知道我要什麼。你不用想太多，不用一次設定好整個 instructions。試著使用一週，再回頭看看 memory，你會發現它已經根據你的行為開始學習客製化了。許多助手不需要懂老闆要什麼，但網站分析不一樣。因為我沒有那麼多美國時間，

AGI 來臨：兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上，Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談，揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測：在 2026-2027 年，AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼，而是讓模型來完成編寫工作，人類只負責編輯和周邊任務。他預估在 6-12 個月內，模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度，認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化，因為結果可驗證；但自然科學領域則更具挑戰性，需要實驗驗證，且目前模型在「提出問題」和「建立理論」

讓 AI 當你的健康顧問：我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent，專門用來分析我的身體健康狀況。這不是什麼有商業潛力的專案，純粹是出於好奇。我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。資料從哪來？要讓 AI 分析任何東西，首先得有資料。我第一個想到的就是 Apple Health。因為我每天戴著 Apple Watch，它本來就會自動記錄睡眠、運動、心跳這些數據。除此之外，我也在嘗試另一個經絡檢測的儀器，有點像中醫把脈的概念，只是還沒整合進來。我覺得如果未來能把更多資料源串在一起，應該可以做出更有意思的應用。技術架構其實不難我用了一個叫「Apple Health Auto Export」的 App。這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。資料打到伺服器後，我再處理並存到 Database 裡。接著寫一個 MCP Server，然後在