AI語音助手終於要兌現10年前的承諾了?
Google和Samsung展示全新Gemini語音助手,能真正完成第三方App任務。這次會是真的嗎?還是又一次空頭支票?
當Sameer Samat對著手機說「幫我叫Uber到機場」時,螢幕上的Gemini真的開始操作Uber App——設定目的地、選擇車型、確認訂單。就像有雙看不見的手在替你完成這一切。
這個場景讓人想起10年前Apple和Google曾經許下的承諾。當時Siri號稱能叫Uber,結果只是打開App而已;Google Assistant說能在星巴克「點老樣子」,體驗卻糟糕到最後功能被移除。
如今,在大語言模型和自然語言理解技術成熟的時代,這些承諾又重新擺上檯面。
這次真的不一樣嗎?
在Samsung的Galaxy Unpacked發表會上,Google和Samsung展示了全新的Gemini語音助手功能。從3月11日Galaxy S26上市開始提供,稍後也會透過軟體更新支援Google Pixel 10系列。
關鍵差異在於,Gemini真的會「看」螢幕並進行操作。它不是依照預設的「地圖」執行任務,而是像人類一樣識別螢幕上的按鈕、文字框和選單,即時做出判斷。
Google Android生態系統總裁的Samat把這些任務比作「數位洗衣服」——「你知道必須完成,但不會特別興奮的事情」。
複雜任務的挑戰
在實際示範中,Gemini能讀取群組聊天中朋友們討論披薩訂購的內容,理解對話脈絡,整理每個人的需求,然後在Grubhub上實際進行訂購流程。
如果資訊不足,Gemini會主動詢問。在紐約三州地區說「到機場」時,它會確認是哪個機場;如果餐廳限制大披薩的訂購數量,它會提出替代方案。
重要的是,最終決定權始終在使用者手中。Gemini會整理選項、將商品加入購物車,但實際的購買按鈕必須由使用者親自按下。
對華人市場的意義
這項技術如果普及,對華人地區的數位生活可能帶來深遠影響。在台灣,像是momo購物網、foodpanda這類服務平台,可能需要重新思考語音操作的使用者介面設計。
對於香港和新加坡等多語言環境,Gemini是否能處理粵語、英語混合的指令,將是一大考驗。而在東南亞華人社群中,這種技術可能有助於克服語言障礙,讓年長者更容易使用數位服務。
值得注意的是,目前功能僅在美國和韓國推出,亞洲其他市場的時程尚未確定。考慮到各國不同的隱私法規和消費者保護標準,在地化調整將是必要的。
隱私與信任的挑戰
Gemini「看」螢幕操作的能力,意味著它能獲取使用者行為和偏好的詳細資訊。Google承諾不將這些資料用於廣告,並允許使用者刪除相關數據,但建立信任仍是長期挑戰。
特別是在華人社會重視隱私保護的背景下,如何確保AI助手不會過度窺探個人生活,將是技術普及的關鍵因素。
未來的想像空間
Samat描繪了一個更廣闊的願景:未來你可以透過智慧眼鏡、AI吊墜,甚至在車內啟動這些任務,而不必拿出手機。今年將有多款Android XR智慧眼鏡推出,這個願景可能比想像中更快實現。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
加密貨幣讓犯罪更隱蔽,AI讓網路詐騙更容易,但同樣的技術也賦予執法部門前所未有的追蹤能力。隱私與安全的界線在哪裡?
三星發布Galaxy S26系列,主打「Agentic AI」功能,但硬體升級有限。AI時代零件成本上升導致入門機型漲價100美元,反映智慧手機產業新趨勢。
三星Galaxy S26系列發布,AI拍照編輯、通話篩選等功能亮相。分析對亞洲智慧手機市場的衝擊與意義。
美國AI數據中心導致電價上漲6%,微軟、OpenAI等科技巨頭承諾自負電力成本。分析對亞洲市場和華人科技企業的影響
观点
分享你对这篇文章的看法
登录加入讨论