Google I/O 2025 發表會的最大亮點,莫過於 Google 宣布智慧助理 Gemini 不再侷限於手機與網頁,而是正式進軍「現實世界」。從智慧眼鏡到影像生成、再到影片與音樂創作,Google 展現了 AI 在 XR 與創作領域的完整佈局。
在 XR 領域,Google 首度公開與 Samsung 合作開發的頭戴裝置 Project Moohan,這款裝置運行於 Android XR 平台,使用者可在虛擬空間中與 Gemini 對話、查詢地圖或即時進行資料搜尋與影片播放。這讓 XR 不再只是娛樂裝置,也開始具備實用工具的角色。
更令人驚喜的是 Android XR 智慧眼鏡的亮相。這款原型眼鏡具備鏡頭、麥克風與微型顯示螢幕,能即時透過語音與 Gemini 溝通。Google 展示了工作人員戴著眼鏡在後台走動,Gemini 協助確認咖啡杯上的店名、查詢音樂、搜尋場景照片,甚至直接幫忙安排行程並發送邀請通知。這段展示讓人看見語音 + 視覺 AI 在日常生活中的真實潛力。
Google 也宣布,這款智慧眼鏡未來將與 Gentle Monster 與 Warby Parker 等知名眼鏡品牌合作推出市售版本,設計將更時尚且支援配鏡,鎖定的是全天候配戴與實用導向的穿戴市場。
在創作領域方面,Google 推出多款針對創作者的生成式媒體工具。首先是 Imagen 4 圖像生成模型,強化了視覺細節、陰影、材質與字體處理能力,能自動產出設計完整、排版優美的海報與圖卡。Google 表示,這次 Imagen 終於能「正確拼出文字」,並具備基本的美學設計邏輯。
Veo 3 則是目前業界最強大的影片生成模型,首次具備原生聲音生成功能,包含環境音、對話與音效等。Google 在發表中展示了一段動畫短片,由 AI 自行生成畫面與劇情角色對話,音效自然,甚至可指定語調與角色風格,適合用於影片原創、短片創作與教學內容製作。
為了讓創作者更直覺地使用這些模型,Google 推出全新創作平台 Flow。使用者只要輸入描述、上傳圖片,就能生成動畫分鏡、場景安排與角色互動。Flow 支援文字指令生成鏡頭設計與場景延伸,也能進行多段剪輯編排,目前開放給 Google AI Ultra 訂閱用戶優先使用。
音樂領域方面,Lyria 2 音樂生成模型也同步推出,支援高品質人聲、和聲、旋律線與節奏編排。Google 與音樂人合作開發 Music AI Sandbox 工具,協助創作者從零開始產生音樂段落,甚至製作整首完整歌曲。發表會中展示了印度音樂人 Shankar Mahadevan 的合作範例,證明這不只是技術展示,而是專業級音樂製作工具的雛形。
從裝置、平台到內容工具,Google 展現出未來 AI 不再只是「使用者查資料的工具」,而是「現實世界中陪你互動、創作、學習、生活」的智慧夥伴。這波 XR 與創作革命,預告了 AI 真正成為你身邊的一份子,不再只是存在螢幕中的一行字。