Google 最新 AI 模型 Nano Banana Pro 實測:9 大神級功能顛覆影像編輯,Midjourney 地位不保?

Google 最新 AI 模型 Nano Banana Pro 實測:9 大神級功能顛覆影像編輯,Midjourney 地位不保?

繼 Gemini 3 推出後,Google 再次無預警投下震撼彈,發布了全新的 AI 影像模型「Nano Banana Pro」。知名科技 YouTuber Matt Wolfe 獲得了為期一週的獨家早期測試權,並深入剖析了這款模型的驚人能力。這不只是一款單純的圖像生成工具,而是一個整合了設計、編輯、風格轉換於一身的「全能創意引擎」,其強大的編輯功能,可能將徹底改變 AI 影像領域的遊戲規則。

「Nano Banana Pro」實際上是建立在 Google 最頂尖的 Gemini 3 Pro 影像模型之上,旨在將 AI 影像創作的品質、可控性與易用性提升到全新層次。Google 正以前所未有的規模將其部署到旗下所有平台:

  • 一般使用者: Gemini App 中將直接內建 Nano Banana Pro。
  • 專業用戶與企業: Google Slides、Google Ads、Gemini API、AI Studio、Vertex AI 等專業工具都將獲得升級。
  • 開發者: 可透過 Gemini API 和全新的 IDE「Anti-gravity」使用其強大功能。

此外,Google 還推出一項關鍵技術「SynthID」,這是一種隱形浮水印。使用者可以上傳任何圖片到 Gemini App,詢問「這張圖是 Google AI 生成的嗎?」,系統能立即辨識。對於 Google AI Ultra 付費使用者,可見的浮水印將被移除,只留下隱形的 SynthID,確保了圖片的真實性與可追溯性,同時保持畫面的乾淨。

不只是畫圖!9 大實測功能展現驚人實力

Matt Wolfe 透過一系列實測,展示了 Nano Banana Pro 的九大核心能力,證明了它遠超「畫一張漂亮圖片」的範疇。

1. 精準的多語言文字渲染 過去 AI 算圖最弱的環節就是文字,但 Nano Banana Pro 徹底解決了這個痛點。在測試中,它不僅能生成包含金屬、毛皮、玻璃等超擬真材質的「WOLF」多國語言 Logo,更能製作出排版精美、日英雙語並存的咖啡館菜單。Matt Wolfe 驚訝地表示:「即使是描述成分的極小字體,也完全清晰可讀,沒有任何拼寫錯誤。」

2. 資訊圖表與圖像標註 使用者只需上傳一張照片,例如聖地牙哥教士隊主場 Petco Park 的空拍圖,並下達指令:「將這張照片變成一張詳細的教育海報,解釋這個地點的歷史、地質和有趣的事實。」模型便能自動研究並生成一張包含精確文字標註的資訊圖表。雖然偶爾箭頭指向會有些許誤差,但其整合圖像理解與資訊檢索的能力已相當驚人。

3. 塗鴉即指令的直觀編輯 這項功能讓影像編輯變得像在畫布上塗鴉一樣簡單。使用者可以直接在圖片上圈選區域、畫出草圖,並用文字指令要求 AI 進行修改。例如,在照片背景畫一個火柴人,AI 就能生成一個逼真的綠髮巨人;或是在 Apple Vision Pro 的產品圖上畫出犄角,AI 就能生成一張看起來像官方出品的「惡魔角」版行銷圖。

4. 高達 6 張圖片的無縫融合 模型能將最多 6 張風格迥異的圖片融合成一張具有單一主題的全新創作。測試中,Matt Wolfe 結合了狗、衝浪板、城市夜景、霓虹燈招牌和沙漠公路等五張圖片,成功創造出一張充滿科幻公路電影風格的電影海報,所有元素都自然地融合在一起。

5. 從草圖到擬真產品的快速原型 AI 能先根據指令生成一張未來科技產品的鉛筆素描,例如一款名為「Agus」的健康環境監測器。接著,使用者能將這張草圖回傳給 AI,並要求:「將這張草圖轉換為一張照片般逼真的 3D 渲染圖。」AI 隨即生成了一張包含材質、光影都極為真實的產品圖,大幅縮短了概念設計的流程。

6. 一鍵生成完整品牌指南 對於行銷人員和設計師來說,這項功能極具價值。只要給予一個虛構的公司名稱,例如「SkySip」,AI 就能在幾秒內生成一套完整的迷你品牌指南,包含:Logo 設計、主色調色票、推薦字體,以及多款瓶身包裝的樣品模型。

7. 保持構圖一致的任意長寬比 Nano Banana Pro 在處理不同長寬比的圖片時,能完美保持主體構圖的一致性。無論是生成 16:9、9:16 還是 1:1 的風景照,或是將現有照片從 9:16 拓展為 16:9,AI 都能智慧補完畫面,且主體不會變形。

8. 驚豔的藝術風格轉移 使用者可以上傳一張風格獨特的圖片(如水彩畫)和一張普通照片,指令 AI 將前者的藝術風格應用於後者。實測中,AI 成功將水彩畫的筆觸、紋理甚至色調(藍色與橘色)完美複製到一張科技會議的照片上,同時保持了人物臉部細節的清晰可辨。

9. 跨時空的照片風格重塑 這項功能可以將一張普通的團體照,重塑成特定時代或風格的樣貌。Matt Wolfe 將一張與朋友們的合照,成功轉換成一張「80 年代復古合成器流行樂團」的專輯封面,從服裝、髮型到霓虹燈光,都充滿了時代感。

編輯之王:Nano Banana Pro 的真正優勢與挑戰

經過全面測試,Matt Wolfe 得出結論:「這絕對是我見過市場上最強大的『影像編輯』模型。」他認為,雖然在純粹的圖像生成方面,市面上或許還有其他強大的競爭者,但在整合文字、塗鴉、多圖像融合等複雜編輯任務上,Nano Banana Pro 目前無人能及。

然而,模型也並非完美無缺。在處理人數過多的團體照進行風格重塑時,AI 會隨機選擇幾個人進行改造,無法兼顧到所有人。但瑕不掩瑜,Google 這次的發布,顯然是將 AI 影像的戰場從「生成」推向了更具實用價值的「編輯與整合」層次,這將對 Adobe Photoshop 等傳統編輯軟體和 Midjourney 等生成工具構成巨大挑戰。

參考資料: https://www.youtube.com/watch?v=2jkpEGk6hDE

Read more

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

很多人問我,在 Claude 裡面,Project、Skill、Connector 這三個東西到底差在哪裡? 什麼時候該用哪一個? 老實說,我一開始也搞得很混亂。 但實際用了一段時間之後,我發現其實邏輯很簡單。 先從最基本的開始:Connector 是對外的資料來源 如果你需要從外部拿資料,比如說接 Google Calendar、接 Notion、接你自己的資料庫,你就需要 Connector。 它就是一個 MCP 的連結,讓 Claude 可以去外面抓資料回來。 沒有 Connector,Claude 就只能用它自己知道的東西,沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。 它只能在內部用 Python 或程式碼執行。 你可以把它想成是一個 Controller,專門負責處理運算的部分。 比如說,你想讓 Claude 用特定的格式改寫文章、

By Andy Lin
讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。 原因很簡單:你的助理應該是越使用越懂你。 而 Claude Project 有個關鍵功能叫 Memory,它會根據你不斷詢問的過程,主動提取記憶。 這就是我認為 AI 助手真正強大的地方。 GA 分析助手:從進階到客製化 自從我串接 GA MCP 後,這位助手已經變得非常厲害。 漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。 但我想要的不只是這些。 我希望它隨著時間,能夠對齊我的知識,知道我要什麼。 你不用想太多,不用一次設定好整個 instructions。 試著使用一週,再回頭看看 memory,你會發現它已經根據你的行為開始學習客製化了。 許多助手不需要懂老闆要什麼,但網站分析不一樣。 因為我沒有那麼多美國時間,

By Andy Lin
AGI 來臨:兩大 AI 巨頭的預測與警示

AGI 來臨:兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上,Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談,揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測:在 2026-2027 年,AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼,而是讓模型來完成編寫工作,人類只負責編輯和周邊任務。他預估在 6-12 個月內,模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度,認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化,因為結果可驗證;但自然科學領域則更具挑戰性,需要實驗驗證,且目前模型在「提出問題」和「建立理論」

By Andy Lin
讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent,專門用來分析我的身體健康狀況。 這不是什麼有商業潛力的專案,純粹是出於好奇。 我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。 資料從哪來? 要讓 AI 分析任何東西,首先得有資料。 我第一個想到的就是 Apple Health。 因為我每天戴著 Apple Watch,它本來就會自動記錄睡眠、運動、心跳這些數據。 除此之外,我也在嘗試另一個經絡檢測的儀器,有點像中醫把脈的概念,只是還沒整合進來。 我覺得如果未來能把更多資料源串在一起,應該可以做出更有意思的應用。 技術架構其實不難 我用了一個叫「Apple Health Auto Export」的 App。 這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。 資料打到伺服器後,我再處理並存到 Database 裡。 接著寫一個 MCP Server,然後在

By Andy Lin