Google悄悄推出離線語音輸入App,這場戰爭比你想的更深
Google發布AI Edge Eloquent,主打離線優先的語音轉文字功能。這不只是一款生產力工具,更是裝置端AI競賽的縮影——而這場競賽的結果,將影響每個人的數據主權。
當你對著手機說話,你的聲音去了哪裡?
2026年4月,Google 低調在iOS上架了一款名為「Google AI Edge Eloquent」的語音輸入應用程式。這款免費App以 Gemma 為基礎,下載語音辨識模型後,即可在不連網的情況下進行即時語音轉文字。它會自動過濾「嗯」、「啊」等填充詞,並提供「重點摘要」、「正式語調」、「精簡版」、「完整版」等文字轉換選項。
更值得注意的是,用戶可以關閉雲端模式,讓所有處理完全在本機完成。若開啟雲端模式,則會使用 Gemini 的雲端模型進行文字潤飾。此外,App還能從 Gmail 帳戶匯入專業術語與人名,或手動新增自訂詞彙。目前僅限iOS,但App Store描述已預告Android版本即將推出,包含類似 Wispr Flow 的浮動按鈕功能。
不只是工具,是一場關於「誰來處理你的聲音」的競賽
表面上,這款App是 Google 對 Wispr Flow、SuperWhisper 等語音輸入工具的直接回應。但放在更大的脈絡下,它代表的是AI運算架構的一次重要轉向。
過去幾年,AI的強大能力幾乎都仰賴雲端——龐大的伺服器、高速的網路連線、以及隨之而來的數據傳輸。但「離線優先(offline-first)」的設計理念正在改變這個邏輯。當AI模型小到可以在手機晶片上運行,雲端就不再是必要條件,而是一種選擇。
這對華人世界的用戶意味著什麼?在台灣、香港、新加坡等地,企業對數據隱私的敏感度正在上升,尤其是涉及法律、醫療、金融等領域的語音記錄。能夠在本機完成處理,意味著敏感對話不需要經過任何外部伺服器——這在合規要求日益嚴格的環境下,具有實質意義。
中國大陸的對照:本土玩家早已布局
值得對比的是,中國大陸市場在語音AI領域早有深厚積累。科大訊飛(iFlytek)長期深耕中文語音辨識,百度、阿里巴巴 也各自推出語音輸入解決方案,且針對中文的語義理解和方言辨識有更多本地化優化。
Google 的服務在中國大陸無法使用,因此 AI Edge Eloquent 的直接影響範圍主要集中在台灣、香港、東南亞華人社群,以及使用境外服務的用戶群體。但這款App的出現,可能會加速整個語音AI市場對「本機處理」能力的重視——包括中國大陸的競爭者。
當 Gemma 這樣的小型語言模型能在手機上流暢運行,代表著AI的「去中心化」趨勢正在加速。這對任何依賴雲端訂閱模式的AI服務商來說,都是一個需要正視的挑戰。
語音輸入的下一步:鍵盤會消失嗎?
從更長遠的視角來看,語音輸入的普及速度,很大程度上取決於準確率和使用情境的匹配。目前的AI語音辨識在英語環境下表現出色,但對於繁體中文、粵語、台語混用的使用情境,仍有明顯落差。Gemma 模型的中文能力如何,目前尚無公開的詳細評測。
此外,語音輸入在公共場合的使用仍受限於社會習慣——在擁擠的捷運車廂或開放式辦公室裡,對著手機說話依然是一種「突兀」的行為。這個文化障礙,可能比技術本身更難突破。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
Google將Gemini整合進Maps,AI可依情境規劃一日行程。這對亞洲用戶、觀光產業與個人選擇自主權意味著什麼?多角度深度解析。
Grammarly收購Superhuman Mail並更名為「Superhuman」,從文字校正工具轉型為AI企業。這場品牌重塑背後,揭示了生產力工具市場的深層變局。
AI筆記應用程式Granola被揭露,儘管聲稱「預設私密」,但只要有連結任何人都能瀏覽用戶筆記,且預設將筆記用於AI訓練。這一事件引發對AI生產力工具數據隱私的廣泛討論。
Google投資的德州資料中心計畫使用天然氣發電,年排放量逾450萬噸溫室氣體,相當於97萬輛汽車上路。AI軍備競賽下,科技巨頭的綠色承諾正面臨嚴峻考驗。
观点
分享你对这篇文章的看法
登录加入讨论