AI 重塑軟體開發:McKinsey 揭示從 Agile 到 AI-Native 的典範轉移

AI 重塑軟體開發:McKinsey 揭示從 Agile 到 AI-Native 的典範轉移
AI 重塑軟體開發影片縮圖

McKinsey 的 Software X 團隊分享了一項針對 300 家企業的研究,揭示了 AI 工具在軟體開發領域的真實影響。

儘管個人開發者使用 AI 工具能將原本需要數小時甚至數天的工作縮短至幾分鐘,但企業整體的生產力提升卻僅有 5-15%。

這中間存在著巨大的落差。

問題的核心在於,當開發速度加快後,卻出現了新的瓶頸。

團隊協作方式沒有改變,程式碼審查仍然採用人工方式,而 AI 產生的大量程式碼也帶來了更多技術債和複雜度。

卡內基梅隆大學的研究報告證實了這一點。

McKinsey 指出,企業仍在用 Agile 時代的約束條件運作:8-10 人團隊、兩週衝刺週期、以 story 為單位的工作分配。

但 AI 的影響是不均勻的,某些任務效果顯著,某些則不然;某些開發者經驗豐富,某些還在學習。

這讓工程主管很難有效分配工作和資源,造成大量效率損失。

頂尖企業的做法完全不同。

研究發現,他們採用 AI-native 工作流程的可能性高出 7 倍,並在整個軟體開發生命週期中實施 4 個以上的 AI 用例,而非僅限於程式碼審查或編碼輔助。

他們也更可能建立 AI-native 角色,機率高出 6 倍,採用更小的團隊(3-5 人的「一片披薩」團隊,取代傳統的「兩片披薩」團隊),並創造新的職位。

這帶來了 5-6 倍的上市速度提升和交付速度,同時提高了產出品質和一致性。

具體的轉變包括:從季度規劃轉向持續規劃,從 story 驅動轉向 spec 驅動開發,PM 與 AI 代理一起迭代規格而非撰寫冗長的 PRD。

在人才方面,產品開發者不再只負責前端或後端,而是具備全端能力,管理和編排 AI 代理。

PM 開始直接在程式碼中創建原型,而非反覆修改 PRD。

McKinsey 以 Cursor 這家 AI-native 新創公司為例,說明了這些轉變如何在實務中運作。

在一家國際銀行的案例研究中,McKinsey 測試了幾項團隊層級的干預措施。

團隊領導使用 AI 代理根據團隊速度和交付歷史來分配工作,與 AI 共同創建多個原型並迭代驗收標準,確保安全性和可觀察性需求一致。

這防止了下游的返工。

團隊依據工作流程重組,一組專注於小型錯誤修復,另一組專注於綠地開發。

AI 代理在背景中檢查潛在的跨儲存庫影響,減少開發者的除錯時間。

PM 直接觀察即時客戶反饋來重新排定功能優先順序,而非等待數據科學家的輸入,加速了待辦事項的處理。

結果顯示,AI 代理使用量增加了 60 倍以上,程式碼合併量增加了 51%,同時提高了效率。

另一家科技公司的案例則展示了角色轉變的重要性。

儘管約 70% 的企業尚未改變職位定義,頂尖企業卻已經在重新定義角色。

McKinsey 幫助一家客戶從傳統的兩片披薩團隊模式轉向更小的團隊,整合了原本由不同角色執行的任務。

在維持相同人數的情況下,創造了更多團隊,每個團隊的表現與之前相當甚至更好,程式碼品質有所提升,輸出速度顯著加快。

然而,McKinsey 強調,擴展到整個組織才是關鍵挑戰。

許多企業有數百個團隊和數千甚至數萬名員工。

頂尖企業與停滯在 10% 改進幅度的企業之間,最大差異在於變革管理的執行方式。

成功的變革管理需要同時做對 20-30 件小事:溝通方式、激勵機制、培訓方法等都必須到位。

McKinsey 舉例說明,某科技公司在推出 AI 工具後,使用率起伏不定且效果不彰。

他們必須重新設定期望、提供手把手的培訓(包括「帶著你的程式碼來」工作坊和教練支援),並建立測量系統。

特別是在開發者剛開始養成新習慣的前幾個衝刺週期,這些支援至關重要。

另一個客戶的成功因素包括:設立程式碼實驗室、引入新的認證制度來激勵員工改變日常工作方式。

這些看似微小的介入措施累積起來,創造了他們所需的改變。

McKinsey 也強調,健全的測量系統不僅要追蹤採用率,更要優先考量成果。

調查發現,表現最差的企業甚至不衡量速度,只有 10% 衡量生產力。

頂尖企業則建立了全面的測量系統,涵蓋從投入到影響的所有層面:投資金額、培訓資源、工具採用的廣度和深度、開發者滿意度、程式碼品質和韌性(如優先錯誤的平均解決時間)、收入達成時間、成本降低等經濟成果。

McKinsey 提出的願景是:即使 AI 代理的智慧不斷提升、人類對 AI 的運用更加熟練,這個新的軟體開發模型依然適用。

更短的衝刺週期、更小但數量更多的團隊,將為企業帶來長期成功。

McKinsey 的建議很明確:現在就開始。

這是一場人的變革,需要時間,是一段旅程。

每個組織都需要找到適合自己的模式,設定大膽的目標。


📺 影片來源: AI 重塑軟體開發:McKinsey 揭示從 Agile 到 AI-Native 的典範轉移

Read more

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

很多人問我,在 Claude 裡面,Project、Skill、Connector 這三個東西到底差在哪裡? 什麼時候該用哪一個? 老實說,我一開始也搞得很混亂。 但實際用了一段時間之後,我發現其實邏輯很簡單。 先從最基本的開始:Connector 是對外的資料來源 如果你需要從外部拿資料,比如說接 Google Calendar、接 Notion、接你自己的資料庫,你就需要 Connector。 它就是一個 MCP 的連結,讓 Claude 可以去外面抓資料回來。 沒有 Connector,Claude 就只能用它自己知道的東西,沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。 它只能在內部用 Python 或程式碼執行。 你可以把它想成是一個 Controller,專門負責處理運算的部分。 比如說,你想讓 Claude 用特定的格式改寫文章、

By Andy Lin
讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。 原因很簡單:你的助理應該是越使用越懂你。 而 Claude Project 有個關鍵功能叫 Memory,它會根據你不斷詢問的過程,主動提取記憶。 這就是我認為 AI 助手真正強大的地方。 GA 分析助手:從進階到客製化 自從我串接 GA MCP 後,這位助手已經變得非常厲害。 漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。 但我想要的不只是這些。 我希望它隨著時間,能夠對齊我的知識,知道我要什麼。 你不用想太多,不用一次設定好整個 instructions。 試著使用一週,再回頭看看 memory,你會發現它已經根據你的行為開始學習客製化了。 許多助手不需要懂老闆要什麼,但網站分析不一樣。 因為我沒有那麼多美國時間,

By Andy Lin
AGI 來臨:兩大 AI 巨頭的預測與警示

AGI 來臨:兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上,Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談,揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測:在 2026-2027 年,AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼,而是讓模型來完成編寫工作,人類只負責編輯和周邊任務。他預估在 6-12 個月內,模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度,認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化,因為結果可驗證;但自然科學領域則更具挑戰性,需要實驗驗證,且目前模型在「提出問題」和「建立理論」

By Andy Lin
讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent,專門用來分析我的身體健康狀況。 這不是什麼有商業潛力的專案,純粹是出於好奇。 我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。 資料從哪來? 要讓 AI 分析任何東西,首先得有資料。 我第一個想到的就是 Apple Health。 因為我每天戴著 Apple Watch,它本來就會自動記錄睡眠、運動、心跳這些數據。 除此之外,我也在嘗試另一個經絡檢測的儀器,有點像中醫把脈的概念,只是還沒整合進來。 我覺得如果未來能把更多資料源串在一起,應該可以做出更有意思的應用。 技術架構其實不難 我用了一個叫「Apple Health Auto Export」的 App。 這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。 資料打到伺服器後,我再處理並存到 Database 裡。 接著寫一個 MCP Server,然後在

By Andy Lin