Google 近日正式在 Gemini 應用程式中整合由 DeepMind 團隊打造的圖片生成與編輯模型。這款模型先前已在預覽版本中開放,獲得全球使用者的廣大關注與高度評價,如今全面上線,讓使用者能更直覺地創造心中理想的圖像。
這項技術主打「樣貌一致」,即便變換背景或服裝,人物的外貌與神韻依然保留。舉例來說,無論想將親友照片改造成 1960 年代復古造型,或是替自家寵物換上舞台服裝,都不必擔心產出結果「像又不太像」,這項功能能大幅降低使用者對細節失真的疑慮。
使用者只需提供一張原始照片,並描述想要的變化,Gemini 就能生成符合想像的圖像。不只可以進行單張照片的創意改造,也支援將多張圖片融合,例如將自己與寵物的照片結合,製作出一張共處同一場景的圖像。使用者也能更換背景,模擬置身世界各地的畫面,同時保留本人的真實樣貌。若有需要,完成後的圖片還能再上傳到 Gemini 中,轉化成一段短影片,進一步擴展創作的表現方式。
除了基本的變換功能,Gemini 也具備進階的圖片處理能力。例如,使用者可以進行「多輪對話式編輯」,逐步調整畫面內容,從空房開始佈置傢俱或變換顏色;或是混合不同設計風格,例如將花瓣的紋理套用到衣物上,或者讓蝴蝶翅膀的圖案變成洋裝的元素,進一步延伸創作的可能性。
針對圖片的真實性與透明度,所有透過 Gemini 建立或修改的圖片都會加入可見浮水印,同時附帶以 SynthID 技術生成的數位浮水印,以標示該圖片為 AI 生成內容。這也代表,即使創作自由度提高,依然維持對生成圖片來源的標示與使用規範。
這次的更新不僅提供更多圖片創作的工具,也進一步展示 Google 在 AI 圖像處理技術上的發展方向,讓使用者在裝置端也能快速實現更多個人化的視覺想像。







