Google 發表史上最狂 AI 繪圖模型:實測 6 張照片融合、塗鴉變傑作,Photoshop 要緊張了?

Google 發表史上最狂 AI 繪圖模型:實測 6 張照片融合、塗鴉變傑作,Photoshop 要緊張了?

Google 再次震撼了 AI 領域,在 Gemini 3 剛推出不久,又無預警地發表了一款全新的 AI 圖像模型,內部代號為「Nano Banana Pro」(基於 Gemini 3 Pro image 技術打造)。這款模型不僅僅是生成漂亮圖片的工具,更像是一個全能的創意引擎,旨在讓 AI 圖像的生成、編輯與控制能力提升到前所未有的高度。從海報設計、產品原型到風格轉移,Google 的野心是將這項技術全面融入其生態系統的每一個角落。

Google 正計畫將這款強大的新模型部署到旗下幾乎所有平台,這是一次史無前例的全面升級。

對於一般消費者和學生,它將內建於 Gemini App 中,免費用戶可享有限額的 Pro 級生成次數。 對於美國的 Google AI Pro 和 Ultra 訂閱者,它將直接強化搜尋功能的 AI 模式。 對於 Workspace 客戶,它將直接整合進 Google Slides,大幅提升簡報製作效率。 對於廣告商,Google Ads 內的圖像生成工具也將全面升級,讓廣告素材製作更即時、更具創意。 對於開發者和企業,新模型將透過 Gemini API、AI Studio 及全新的 IDE「Anti-gravity」提供,讓大型組織能建立大規模的自動化創意工作流程。

精準文字與圖表生成:不只是裝飾,更是資訊的載體

過去 AI 生成圖像中的文字經常出現拼寫錯誤或胡言亂語,但新模型徹底解決了這個痛點。在實測中,它能完美生成多語言的 Logo 設計,例如將「狼」這個詞以俄文、日文漢字和義大利文,並分別用金屬、狼毛和玻璃等超現實材質呈現。

更驚人的是,在生成一張英日雙語的咖啡館菜單時,它不僅排版極簡優美,連最細微的成分說明文字都拼寫得一字不差。測試者表示:「過去在 AI 圖片中,這麼小的文字通常只是亂碼,但這次,即使是描述成分的微小文字也都非常連貫清晰。」

此外,它還能將現有照片轉化為資訊圖表。測試者上傳一張聖地牙哥教士隊主場 Petco Park 的照片,要求 AI 將其轉變為一張解釋其歷史、地質和趣聞的教育海報。AI 不僅準確標示了建築、地標,還自行研究並添加了相關的歷史和地質資訊,雖然部分箭頭指向稍有偏差,但其資訊整合與生成能力已令人讚嘆。

從塗鴉到現實:直接在圖片上實現你的瘋狂點子

新模型最有趣的突破之一,是允許用戶直接在圖片上塗鴉,並將這些潦草的筆跡轉化為逼真的圖像元素。測試者在一張活動照片的背景隨手畫了一個巨大的火柴人,並下指令「讓這個巨人看起來更逼真」。AI 隨即生成了一個有著綠色頭髮、表情生動的巨大人物,完美融入背景,效果令人捧腹又印象深刻。

這項功能在產品設計上同樣強大。測試者在一張 Apple Vision Pro 的照片上畫了犄角和更突出的眼睛,並要求 AI「根據我的塗鴉重新設計這款產品,讓它看起來像一張精美的行銷圖」,結果 AI 完美實現了這個天馬行空的設計。

革命性的圖像融合:一次混合六張圖片,創造全新世界

新模型的圖像融合能力達到了新的高度,最多可以一次性混合六張不同的圖片,創造出一個全新的、風格統一的場景。測試者將狗、衝浪板、聖地牙哥天際線、霓虹燈招牌和一條荒涼公路共五張照片丟給 AI,指令是「將這五張照片融合成一張具有科幻公路電影感的電影海報」。

結果令人驚豔,AI 產出了一張極具故事感的海報,不僅完美融合了所有元素——狗坐在致敬《回到未來》的車上,車頂綁著衝浪板,背景是城市天際線和公路——甚至還自動生成了電影標題《The Long Ride Home》和上映年份「Summer 2050」。

風格無縫轉移:一鍵複製藝術風格與電影色調

風格轉移是另一個重大升級。用戶可以上傳一張具有特定藝術風格的圖片(如水彩畫),再上傳一張自己的照片,要求 AI 將前者的風格應用於後者。實測中,AI 成功地將水彩畫的筆觸、紋理甚至色調(如藍色和橘色)完美複製到一張科技會議的照片上,同時保持了人物臉部特徵的清晰可辨。

測試者評價道:「這真的太令人印象深刻了。它不僅複製了風格,甚至連色調都一併轉移,效果好得驚人。」同樣的技術也適用於電影色調,AI 能夠提取《駭客任務》經典的綠色濾鏡風格,並將其應用於一張城市風景照,使其看起來就像電影中的一個場景。

結論:AI 圖像「編輯」的王者誕生

總結來說,Google 這款由 Gemini 驅動的新圖像模型,雖然在純粹的圖像「生成」品質上或許還有其他競爭者,但在「編輯」與「整合創意」方面,它無疑是目前市場上最強大的工具。它將圖像生成的門檻從「詠唱咒語(Prompt)」降低到了「直覺操作(塗鴉、融合)」。

隨著這項技術逐步部署到 Google 的各大平台,從學生做報告、行銷人員做廣告,到設計師發想創意,都將迎來一場效率革命。可以預見,不久的將來,這項技術也將被整合到 Adobe Photoshop、Canva 等主流創意軟體中,屆時,不懂複雜軟體操作的普通人,也能僅靠文字和簡單的塗鴉,完成專業級的圖像編輯工作。

參考資料:https://www.youtube.com/watch?v=2jkpEGk6hDE

Read more

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

Claude 的 Project、Skill、Connector 到底怎麼分?一次搞懂三者的關係

很多人問我,在 Claude 裡面,Project、Skill、Connector 這三個東西到底差在哪裡? 什麼時候該用哪一個? 老實說,我一開始也搞得很混亂。 但實際用了一段時間之後,我發現其實邏輯很簡單。 先從最基本的開始:Connector 是對外的資料來源 如果你需要從外部拿資料,比如說接 Google Calendar、接 Notion、接你自己的資料庫,你就需要 Connector。 它就是一個 MCP 的連結,讓 Claude 可以去外面抓資料回來。 沒有 Connector,Claude 就只能用它自己知道的東西,沒辦法碰到你的資料。 Skill 則是內部的運算邏輯 Skill 沒有辦法對外連接。 它只能在內部用 Python 或程式碼執行。 你可以把它想成是一個 Controller,專門負責處理運算的部分。 比如說,你想讓 Claude 用特定的格式改寫文章、

By Andy Lin
讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need

讓 AI 認識你 — Memory is All You Need 最近我在 Claude 上快速搭建了七大 Agent。 原因很簡單:你的助理應該是越使用越懂你。 而 Claude Project 有個關鍵功能叫 Memory,它會根據你不斷詢問的過程,主動提取記憶。 這就是我認為 AI 助手真正強大的地方。 GA 分析助手:從進階到客製化 自從我串接 GA MCP 後,這位助手已經變得非常厲害。 漏斗分析、訪客來源、異常事件追蹤、站上任何問題都難不倒它。 但我想要的不只是這些。 我希望它隨著時間,能夠對齊我的知識,知道我要什麼。 你不用想太多,不用一次設定好整個 instructions。 試著使用一週,再回頭看看 memory,你會發現它已經根據你的行為開始學習客製化了。 許多助手不需要懂老闆要什麼,但網站分析不一樣。 因為我沒有那麼多美國時間,

By Andy Lin
AGI 來臨:兩大 AI 巨頭的預測與警示

AGI 來臨:兩大 AI 巨頭的預測與警示

在近期的達沃斯論壇上,Anthropic 執行長 Dario Amodei 與 Google DeepMind 執行長 Demis Hassabis 進行了一場關於「AGI 之後的世界」的深度對談,揭示了 AI 發展的最新進展與未來展望。 AGI 時間線預測 Dario 重申了他去年的預測:在 2026-2027 年,AI 模型將能夠在諸多領域達到諾貝爾獎得主的水準。他表示目前 Anthropic 的工程師已經不再親自寫程式碼,而是讓模型來完成編寫工作,人類只負責編輯和周邊任務。他預估在 6-12 個月內,模型將能端到端完成大部分工程師的工作。 Demis 則持稍微保守的態度,認為在十年內有 50% 的機會實現 AGI。他指出編程和數學領域較容易自動化,因為結果可驗證;但自然科學領域則更具挑戰性,需要實驗驗證,且目前模型在「提出問題」和「建立理論」

By Andy Lin
讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

讓 AI 當你的健康顧問:我用 Apple Watch 數據打造個人健康分析 Agent

最近我嘗試做了一個 Agent,專門用來分析我的身體健康狀況。 這不是什麼有商業潛力的專案,純粹是出於好奇。 我想知道現在的 AI 到底能幫我們把健康分析做到什麼程度。 資料從哪來? 要讓 AI 分析任何東西,首先得有資料。 我第一個想到的就是 Apple Health。 因為我每天戴著 Apple Watch,它本來就會自動記錄睡眠、運動、心跳這些數據。 除此之外,我也在嘗試另一個經絡檢測的儀器,有點像中醫把脈的概念,只是還沒整合進來。 我覺得如果未來能把更多資料源串在一起,應該可以做出更有意思的應用。 技術架構其實不難 我用了一個叫「Apple Health Auto Export」的 App。 這個 App 可以把健康資料透過 REST API 自動傳送到你指定的伺服器。 資料打到伺服器後,我再處理並存到 Database 裡。 接著寫一個 MCP Server,然後在

By Andy Lin