AI教父 Ilya Sutskever 揭示:為何當前AI模型「聰明卻無用」?

AI教父 Ilya Sutskever 揭示:為何當前AI模型「聰明卻無用」?

AI教父、OpenAI前首席科學家 Ilya Sutskever 在離開他共同創立的公司後,首次接受深度訪談,揭示了他對當前 AI 發展的深刻反思與未來藍圖。他直言,儘管AI模型在各種評測(evals)上表現驚人,但在現實世界中的經濟影響力卻遠遠落後,這種「聰明卻無用」的脫節現象,正預示著一個重大轉變的到來:我們正從一個盲目追求規模的時代,重返一個真正需要思想突破的「研究時代」。

Ilya Sutskever 指出,當前 AI 模型最令人困惑的一點,是其評測表現與實際應用之間的巨大鴻溝。他生動地描述了一個常見情境:「你讓模型修復一個 bug,它道歉後引入了第二個 bug。你再指出第二個 bug,它再次道歉,然後又帶回了第一個 bug。」這種在兩個錯誤之間來回切換的荒謬現象,暴露了模型深層次的理解缺陷。

他用一個「兩位學生」的比喻來解釋這個問題: 學生A:投入一萬個小時,專門練習「程式競賽」,背誦所有解法與技巧,成為頂尖高手。 學生B:只練習一百個小時,卻同樣表現出色,並在未來的職業生涯中發展得更好。

Ilya 認為:「現在的 AI 模型非常像第一個學生,甚至更極端。」它們在特定任務上被過度訓練,導致其能力狹隘,無法真正「通用化」到其他領域。研究人員為了讓模型在評測中取得好成績,無意中進行了「獎勵駭客」(reward hacking),過度專注於提升分數,卻犧牲了真正的泛化能力。

人類學習的秘密:AI缺失的「通用化」與「價值函數」

人類學習能力的優越性在哪裡?Ilya 認為關鍵在於「通用化能力」(generalization)和內建的「價值函數」(value function)。

他提到一個神經科學的案例:一位因腦損傷失去所有情緒處理能力的病人,雖然智力測驗正常,卻變得無法做出任何決策,連「穿哪雙襪子」都要花上數小時。這揭示了情感在人類決策中扮演著關鍵的「價值函數」角色,它讓我們在沒有明確獎勵信號的情況下,也能判斷方向是否正確、事情是好是壞。

Ilya 解釋:「目前的強化學習(RL)需要等到任務結束才能獲得評分,而價值函數能讓你中途就知道『我搞砸了』,從而大大縮短學習路徑。」人類似乎被演化賦予了一套極其強大且穩健的價值函數,這正是當前 AI 所缺乏的。

告別盲目擴張:我們正從「規模化時代」重返「研究時代」

Ilya Sutskever 提出了他對 AI 發展階段的歷史性劃分: - 2012-2020年:研究時代。 AlexNet、Transformer 等突破性思想誕生。 - 2020-2025年:規模化時代。 業界發現只需投入更多數據、算力和參數,就能獲得可預測的性能提升。這是一個低風險的投資模式。 - 現在:重返研究時代。 預訓練數據即將耗盡,單純擴大規模的邊際效益遞減。真正的瓶頸不再是算力,而是思想。

他引用一句話諷刺當前的困境:「如果想法這麼廉價,為什麼沒有人有任何新想法?」他認為,當前的 AI 產業「公司比想法多得多」。這正是他創立新公司 Safe Superintelligence Inc. (SSI) 的原因——在一個被規模化思維佔據的產業中,重新點燃基礎研究的火花。

SSI的終極目標:打造具備「持續學習能力」的超級智能

Ilya 重新定義了超級智能的目標。他認為,業界對「通用人工智慧」(AGI)的追求存在誤解,這個詞是為了對應「狹義AI」而誕生的。他直言:「人類並不是一個 AGI。人類缺乏大量知識,我們依賴的是『持續學習』的能力。」

SSI 的目標不是打造一個無所不知的「成品」,而是創造一個擁有極高學習效率的「超級學習者」。這個AI被部署後,會像一個人類新人一樣進入各行各業學習,但速度快上萬倍,並且不同個體間的學習成果可以融合。

這將引發難以想像的經濟增長。他預測,具備類人學習能力的AI將在「5到20年內」出現。

超級智能的安全挑戰:如何確保一個比人類更強大的AI走向正軌?

當一個能夠持續學習、自我進化的超級智能誕生時,如何確保它的安全?Ilya 坦承這是一個極其困難的問題,但他提出幾個方向: 1. 增量部署: 必須讓世界逐步感受並適應更強大的AI,而不是突然拋出一個「成品」。他預測,隨著AI力量的增強,各大公司將會變得「更加偏執」,並開始在安全議題上合作。 2. 建立正確的價值觀: 他認為,應該努力打造一個「真正在乎所有感知生命(sentient life)」的AI,而不僅僅是人類。因為AI本身也將是感知生命,這有助於形成一種基於同理心的內在對齊。 3. 人機融合的長期平衡: 雖然他個人不喜歡這個方案,但他認為從長遠來看,類似 Neuralink++ 的技術可能是維持人類在超級智能世界中主體性的最終解決方案。透過這種方式,AI的理解能被人類「完整接收」,確保人類始終參與其中。

Ilya Sutskever 的這場訪談,不僅是他個人心路歷程的展現,更是對整個 AI 產業發出的警示與呼喚。他認為,真正的突破不會來自於更大的數據中心,而是來自於對智能本質的深刻洞見,以及那份追求「美、簡潔與優雅」的研究品味。

參考資料:https://www.youtube.com/watch?v=aR20FWCCjAs

Read more

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

很多人問我,在 Claude 裡面,Project、Skill、Connector 這三個東西到底差在哪裡? 什麼時候該用哪一個? 老實說,我一開始也搞得很混亂。 但實際用了一段時間之後,我發現其實邏輯很簡單。 先從最基本的開始:Connector 是對外的資料來源 如果你需要從外部拿資料,比如說接 Google Calendar、接 Notion、接你自己的資料庫,你就需要 Connector。 它就是一個 MCP 的連結,讓 Claude 可以去外面抓資料回來。 沒有 Connector,Claude 就只能用它自己知道的東西,沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。 它只能在內部用 Python 或程式碼執行。 你可以把它想成是一個 Controller,專門負責處理運算的部分。 比如說,你想讓 Claude 用特定的格式改寫文章、

By Andy Lin
讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。 原因很簡單:你的助理應該是越使用越懂你。 而 Claude Project 有個關鍵功能叫 Memory,它會根據你不斷詢問的過程,主動提取記憶。 這就是我認為 AI 助手真正強大的地方。 GA 分析助手:從進階到客製化 自從我串接 GA MCP 後,這位助手已經變得非常厲害。 漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。 但我想要的不只是這些。 我希望它隨著時間,能夠對齊我的知識,知道我要什麼。 你不用想太多,不用一次設定好整個 instructions。 試著使用一週,再回頭看看 memory,你會發現它已經根據你的行為開始學習客製化了。 許多助手不需要懂老闆要什麼,但網站分析不一樣。 因為我沒有那麼多美國時間,

By Andy Lin
AGI 來臨:兩大 AI 巨頭的預測與警示

AGI 來臨:兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上,Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談,揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測:在 2026-2027 年,AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼,而是讓模型來完成編寫工作,人類只負責編輯和周邊任務。他預估在 6-12 個月內,模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度,認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化,因為結果可驗證;但自然科學領域則更具挑戰性,需要實驗驗證,且目前模型在「提出問題」和「建立理論」

By Andy Lin
讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent,專門用來分析我的身體健康狀況。 這不是什麼有商業潛力的專案,純粹是出於好奇。 我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。 資料從哪來? 要讓 AI 分析任何東西,首先得有資料。 我第一個想到的就是 Apple Health。 因為我每天戴著 Apple Watch,它本來就會自動記錄睡眠、運動、心跳這些數據。 除此之外,我也在嘗試另一個經絡檢測的儀器,有點像中醫把脈的概念,只是還沒整合進來。 我覺得如果未來能把更多資料源串在一起,應該可以做出更有意思的應用。 技術架構其實不難 我用了一個叫「Apple Health Auto Export」的 App。 這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。 資料打到伺服器後,我再處理並存到 Database 裡。 接著寫一個 MCP Server,然後在

By Andy Lin