AI語音助手終於要兌現10年前的承諾了?
Google和Samsung展示全新Gemini語音助手,能真正完成第三方App任務。這次會是真的嗎?還是又一次空頭支票?
當Sameer Samat對著手機說「幫我叫Uber到機場」時,螢幕上的Gemini真的開始操作Uber App——設定目的地、選擇車型、確認訂單。就像有雙看不見的手在替你完成這一切。
這個場景讓人想起10年前Apple和Google曾經許下的承諾。當時Siri號稱能叫Uber,結果只是打開App而已;Google Assistant說能在星巴克「點老樣子」,體驗卻糟糕到最後功能被移除。
如今,在大語言模型和自然語言理解技術成熟的時代,這些承諾又重新擺上檯面。
這次真的不一樣嗎?
在Samsung的Galaxy Unpacked發表會上,Google和Samsung展示了全新的Gemini語音助手功能。從3月11日Galaxy S26上市開始提供,稍後也會透過軟體更新支援Google Pixel 10系列。
關鍵差異在於,Gemini真的會「看」螢幕並進行操作。它不是依照預設的「地圖」執行任務,而是像人類一樣識別螢幕上的按鈕、文字框和選單,即時做出判斷。
Google Android生態系統總裁的Samat把這些任務比作「數位洗衣服」——「你知道必須完成,但不會特別興奮的事情」。
複雜任務的挑戰
在實際示範中,Gemini能讀取群組聊天中朋友們討論披薩訂購的內容,理解對話脈絡,整理每個人的需求,然後在Grubhub上實際進行訂購流程。
如果資訊不足,Gemini會主動詢問。在紐約三州地區說「到機場」時,它會確認是哪個機場;如果餐廳限制大披薩的訂購數量,它會提出替代方案。
重要的是,最終決定權始終在使用者手中。Gemini會整理選項、將商品加入購物車,但實際的購買按鈕必須由使用者親自按下。
對華人市場的意義
這項技術如果普及,對華人地區的數位生活可能帶來深遠影響。在台灣,像是momo購物網、foodpanda這類服務平台,可能需要重新思考語音操作的使用者介面設計。
對於香港和新加坡等多語言環境,Gemini是否能處理粵語、英語混合的指令,將是一大考驗。而在東南亞華人社群中,這種技術可能有助於克服語言障礙,讓年長者更容易使用數位服務。
值得注意的是,目前功能僅在美國和韓國推出,亞洲其他市場的時程尚未確定。考慮到各國不同的隱私法規和消費者保護標準,在地化調整將是必要的。
隱私與信任的挑戰
Gemini「看」螢幕操作的能力,意味著它能獲取使用者行為和偏好的詳細資訊。Google承諾不將這些資料用於廣告,並允許使用者刪除相關數據,但建立信任仍是長期挑戰。
特別是在華人社會重視隱私保護的背景下,如何確保AI助手不會過度窺探個人生活,將是技術普及的關鍵因素。
未來的想像空間
Samat描繪了一個更廣闊的願景:未來你可以透過智慧眼鏡、AI吊墜,甚至在車內啟動這些任務,而不必拿出手機。今年將有多款Android XR智慧眼鏡推出,這個願景可能比想像中更快實現。
相关文章
YouTube推出AI自訂動態消息功能,用戶輸入文字描述即可生成個人化影片清單。這項改變對內容創作者、廣告主與亞洲市場意味著什麼?
Meta宣布在全球推出Instagram、Facebook、WhatsApp付費訂閱方案,並測試Meta AI訂閱服務。這對亞洲用戶、華人社群與數位廣告產業意味著什麼?
IBM與法拉利車隊攜手以AI重塑F1球迷應用程式,賽事周末互動率提升62%。這場科技巨頭與頂級賽車品牌的合作,揭示了數據驅動粉絲經濟的新邏輯。
表面上,美中AI競爭每天升溫。但深入矽谷與深圳的研究現場,你會發現兩個生態系統深度交織——共享人才、論文、演算法,甚至同樣的偶像。對立敘事之外,現實更複雜。
观点
分享你对这篇文章的看法
登录加入讨论