Liabooks Home|PRISM News
Google悄悄推出離線語音輸入App,這場戰爭比你想的更深
科技AI分析

Google悄悄推出離線語音輸入App,這場戰爭比你想的更深

3分钟阅读Source

Google發布AI Edge Eloquent,主打離線優先的語音轉文字功能。這不只是一款生產力工具,更是裝置端AI競賽的縮影——而這場競賽的結果,將影響每個人的數據主權。

當你對著手機說話,你的聲音去了哪裡?

2026年4月Google 低調在iOS上架了一款名為「Google AI Edge Eloquent」的語音輸入應用程式。這款免費App以 Gemma 為基礎,下載語音辨識模型後,即可在不連網的情況下進行即時語音轉文字。它會自動過濾「嗯」、「啊」等填充詞,並提供「重點摘要」、「正式語調」、「精簡版」、「完整版」等文字轉換選項。

更值得注意的是,用戶可以關閉雲端模式,讓所有處理完全在本機完成。若開啟雲端模式,則會使用 Gemini 的雲端模型進行文字潤飾。此外,App還能從 Gmail 帳戶匯入專業術語與人名,或手動新增自訂詞彙。目前僅限iOS,但App Store描述已預告Android版本即將推出,包含類似 Wispr Flow 的浮動按鈕功能。

不只是工具,是一場關於「誰來處理你的聲音」的競賽

表面上,這款App是 GoogleWispr FlowSuperWhisper 等語音輸入工具的直接回應。但放在更大的脈絡下,它代表的是AI運算架構的一次重要轉向。

過去幾年,AI的強大能力幾乎都仰賴雲端——龐大的伺服器、高速的網路連線、以及隨之而來的數據傳輸。但「離線優先(offline-first)」的設計理念正在改變這個邏輯。當AI模型小到可以在手機晶片上運行,雲端就不再是必要條件,而是一種選擇。

這對華人世界的用戶意味著什麼?在台灣、香港、新加坡等地,企業對數據隱私的敏感度正在上升,尤其是涉及法律、醫療、金融等領域的語音記錄。能夠在本機完成處理,意味著敏感對話不需要經過任何外部伺服器——這在合規要求日益嚴格的環境下,具有實質意義。

PRISM

廣告合作

[email protected]

中國大陸的對照:本土玩家早已布局

值得對比的是,中國大陸市場在語音AI領域早有深厚積累。科大訊飛(iFlytek)長期深耕中文語音辨識,百度阿里巴巴 也各自推出語音輸入解決方案,且針對中文的語義理解和方言辨識有更多本地化優化。

Google 的服務在中國大陸無法使用,因此 AI Edge Eloquent 的直接影響範圍主要集中在台灣、香港、東南亞華人社群,以及使用境外服務的用戶群體。但這款App的出現,可能會加速整個語音AI市場對「本機處理」能力的重視——包括中國大陸的競爭者。

Gemma 這樣的小型語言模型能在手機上流暢運行,代表著AI的「去中心化」趨勢正在加速。這對任何依賴雲端訂閱模式的AI服務商來說,都是一個需要正視的挑戰。

語音輸入的下一步:鍵盤會消失嗎?

從更長遠的視角來看,語音輸入的普及速度,很大程度上取決於準確率和使用情境的匹配。目前的AI語音辨識在英語環境下表現出色,但對於繁體中文、粵語、台語混用的使用情境,仍有明顯落差。Gemma 模型的中文能力如何,目前尚無公開的詳細評測。

此外,語音輸入在公共場合的使用仍受限於社會習慣——在擁擠的捷運車廂或開放式辦公室裡,對著手機說話依然是一種「突兀」的行為。這個文化障礙,可能比技術本身更難突破。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]