AI模型進化太慢?測試Grok FAST後,我發現:智力提升20%,但短期還不夠用

最近,我沉迷於測試各種AI模型來改寫文章, 試圖找出最適合內容創作的工具。

核心議題是AI在處理複雜任務時的表現, 尤其是像Grok FAST這樣價格僅為一般模型四分之一的「迷你級」選擇。

雖然它聽起來划算,但實際測試卻充滿挑戰, 讓我重新思考AI成長的速度與潛力。

在測試改寫文章時, 我發現Grok FAST經常產生「幻覺連結」—— 那些不存在的、虛構的參考來源。

這讓我原本的期待落空: 它雖然便宜25%, 但在生成可靠內容上, 仍遠遠落後於更昂貴的模型。

背景來說, 「幻覺」是AI常見問題, 指模型編造事實, 尤其在低成本版本中更明顯。

我的測試顯示, 簡單改寫還可, 但一涉及事實查證, 就容易出錯。

複雜任務的挑戰

過去,我多次嘗試讓AI處理高難度工作, 例如從一篇文章中提取六個關鍵重點, 並為每個重點梳理大標、主標和小標。

結果很清楚: 只有「越聰明」的模型才能勝任。

例如,頂級模型如GPT-4能精準結構化內容, 而Grok FAST等低階版往往混亂無章。

這讓我反思: 每年AI模型都在進化, 理論上便宜模型應能逐步接手這些任務。

但實際速度不如預期樂觀—— 短期內,你可能會沮喪地想:「怎麼還沒發生?」

個人觀察:短期失望,長期驚人

我的思考過程是這樣的: 一開始,我以為AI成長像摩爾定律般指數上升, 用更便宜的工具就能搞定一切。

但測試後, 我看到現實的落差。

好消息來自網路社群: 其他用戶反映, 相同模型的「智力」感覺提升了約20%。

例如,過去的任務成功率50%, 現在可能升到70%, 但仍不穩定。

這就像一場馬拉松: 短期看,進展緩慢得讓人洩氣; 長期來,潛力卻恐怖到能超越人類判斷。

我甚至每天提醒自己: 「AI的大腦很快就會比你平常的任何決策都更好。」

這份信念, 激勵我不斷優化流程。

引入AI的實踐小故事

分享一個我的小實驗: 我試著將內容生成流程全AI化—— 從原始想法, 快速轉成HTML網頁結構, 再轉圖片,或改寫成適合不同平台的文章。

例如,用AI將一篇草稿變成社群貼文, 強調「如何將表達轉換成最適媒介」。

起初,輸出雜亂, 但經過迭代, 效率提升了至少三倍。

關鍵是: 任務不會變, 但模型和流程會改善。

如果你生活中有不完善環節, 不妨試試引入AI—— 從簡單改寫開始, 逐步建構自動化。

總結與啟發

總之,AI模型如Grok FAST雖有幻覺問題, 但整體智力正以20%的速度成長, 長期將帶來革命性改變。

我的觀點: 別被短期挫折嚇倒, 堅定相信並行動, 將AI融入日常,就能看到轉變。

這不僅是工具升級, 更是思維轉變—— 從等待完美模型, 到主動優化流程。

你呢? 有沒有類似AI測試經驗? 或許你的生活流程,也能藉AI改善?

歡迎留言分享想法, 一起討論AI的未來!

Read more

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

很多人問我,在 Claude 裡面,Project、Skill、Connector 這三個東西到底差在哪裡? 什麼時候該用哪一個? 老實說,我一開始也搞得很混亂。 但實際用了一段時間之後,我發現其實邏輯很簡單。 先從最基本的開始:Connector 是對外的資料來源 如果你需要從外部拿資料,比如說接 Google Calendar、接 Notion、接你自己的資料庫,你就需要 Connector。 它就是一個 MCP 的連結,讓 Claude 可以去外面抓資料回來。 沒有 Connector,Claude 就只能用它自己知道的東西,沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。 它只能在內部用 Python 或程式碼執行。 你可以把它想成是一個 Controller,專門負責處理運算的部分。 比如說,你想讓 Claude 用特定的格式改寫文章、

By Andy Lin
讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。 原因很簡單:你的助理應該是越使用越懂你。 而 Claude Project 有個關鍵功能叫 Memory,它會根據你不斷詢問的過程,主動提取記憶。 這就是我認為 AI 助手真正強大的地方。 GA 分析助手:從進階到客製化 自從我串接 GA MCP 後,這位助手已經變得非常厲害。 漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。 但我想要的不只是這些。 我希望它隨著時間,能夠對齊我的知識,知道我要什麼。 你不用想太多,不用一次設定好整個 instructions。 試著使用一週,再回頭看看 memory,你會發現它已經根據你的行為開始學習客製化了。 許多助手不需要懂老闆要什麼,但網站分析不一樣。 因為我沒有那麼多美國時間,

By Andy Lin
AGI 來臨:兩大 AI 巨頭的預測與警示

AGI 來臨:兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上,Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談,揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測:在 2026-2027 年,AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼,而是讓模型來完成編寫工作,人類只負責編輯和周邊任務。他預估在 6-12 個月內,模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度,認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化,因為結果可驗證;但自然科學領域則更具挑戰性,需要實驗驗證,且目前模型在「提出問題」和「建立理論」

By Andy Lin
讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent,專門用來分析我的身體健康狀況。 這不是什麼有商業潛力的專案,純粹是出於好奇。 我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。 資料從哪來? 要讓 AI 分析任何東西,首先得有資料。 我第一個想到的就是 Apple Health。 因為我每天戴著 Apple Watch,它本來就會自動記錄睡眠、運動、心跳這些數據。 除此之外,我也在嘗試另一個經絡檢測的儀器,有點像中醫把脈的概念,只是還沒整合進來。 我覺得如果未來能把更多資料源串在一起,應該可以做出更有意思的應用。 技術架構其實不難 我用了一個叫「Apple Health Auto Export」的 App。 這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。 資料打到伺服器後,我再處理並存到 Database 裡。 接著寫一個 MCP Server,然後在

By Andy Lin