AI語音助手終於要兌現10年前的承諾了?
Google和Samsung展示全新Gemini語音助手,能真正完成第三方App任務。這次會是真的嗎?還是又一次空頭支票?
當Sameer Samat對著手機說「幫我叫Uber到機場」時,螢幕上的Gemini真的開始操作Uber App——設定目的地、選擇車型、確認訂單。就像有雙看不見的手在替你完成這一切。
這個場景讓人想起10年前Apple和Google曾經許下的承諾。當時Siri號稱能叫Uber,結果只是打開App而已;Google Assistant說能在星巴克「點老樣子」,體驗卻糟糕到最後功能被移除。
如今,在大語言模型和自然語言理解技術成熟的時代,這些承諾又重新擺上檯面。
這次真的不一樣嗎?
在Samsung的Galaxy Unpacked發表會上,Google和Samsung展示了全新的Gemini語音助手功能。從3月11日Galaxy S26上市開始提供,稍後也會透過軟體更新支援Google Pixel 10系列。
關鍵差異在於,Gemini真的會「看」螢幕並進行操作。它不是依照預設的「地圖」執行任務,而是像人類一樣識別螢幕上的按鈕、文字框和選單,即時做出判斷。
Google Android生態系統總裁的Samat把這些任務比作「數位洗衣服」——「你知道必須完成,但不會特別興奮的事情」。
複雜任務的挑戰
在實際示範中,Gemini能讀取群組聊天中朋友們討論披薩訂購的內容,理解對話脈絡,整理每個人的需求,然後在Grubhub上實際進行訂購流程。
如果資訊不足,Gemini會主動詢問。在紐約三州地區說「到機場」時,它會確認是哪個機場;如果餐廳限制大披薩的訂購數量,它會提出替代方案。
重要的是,最終決定權始終在使用者手中。Gemini會整理選項、將商品加入購物車,但實際的購買按鈕必須由使用者親自按下。
對華人市場的意義
這項技術如果普及,對華人地區的數位生活可能帶來深遠影響。在台灣,像是momo購物網、foodpanda這類服務平台,可能需要重新思考語音操作的使用者介面設計。
對於香港和新加坡等多語言環境,Gemini是否能處理粵語、英語混合的指令,將是一大考驗。而在東南亞華人社群中,這種技術可能有助於克服語言障礙,讓年長者更容易使用數位服務。
值得注意的是,目前功能僅在美國和韓國推出,亞洲其他市場的時程尚未確定。考慮到各國不同的隱私法規和消費者保護標準,在地化調整將是必要的。
隱私與信任的挑戰
Gemini「看」螢幕操作的能力,意味著它能獲取使用者行為和偏好的詳細資訊。Google承諾不將這些資料用於廣告,並允許使用者刪除相關數據,但建立信任仍是長期挑戰。
特別是在華人社會重視隱私保護的背景下,如何確保AI助手不會過度窺探個人生活,將是技術普及的關鍵因素。
未來的想像空間
Samat描繪了一個更廣闊的願景:未來你可以透過智慧眼鏡、AI吊墜,甚至在車內啟動這些任務,而不必拿出手機。今年將有多款Android XR智慧眼鏡推出,這個願景可能比想像中更快實現。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
史丹佛大學2026年AI指數揭示:AI性能持續突破、美中差距急速縮小、就業市場開始震盪。這場科技競賽對華人世界意味著什麼?
史丹佛2026年AI指數揭示:73%的AI專家對就業前景持樂觀態度,但一般民眾只有23%認同。這道鴻溝背後,藏著兩個平行存在的AI現實。
一名男子從德州跨州前往加州,試圖殺害OpenAI執行長Sam Altman並縱火燒毀總部。這起事件不只是個人犯罪,更折射出AI時代深層的社會裂痕。
伊隆·馬斯克承諾Neuralink將帶來超人能力,但現實是什麼?從動物實驗爭議到人體試驗,腦機接口技術的真實進展與華人世界的意義深度解析。
观点
分享你对这篇文章的看法
登录加入讨论