Liabooks Home|PRISM News
AI只為說英語的人服務嗎?
科技AI分析

AI只為說英語的人服務嗎?

4分钟阅读Source

印度新創公司Sarvam AI與Krutrim正在打造專為22種官方語言設計的輕量AI,以低成本、母語介面服務8億智慧型手機用戶。這套「主權AI」模式對亞洲新興市場意味著什麼?

同樣一個問題,用印地語問,比用英語問貴5倍。這不是翻譯費用,而是AI處理語言的底層結構問題——而這個問題,正在深刻影響誰能真正使用AI、誰又被排除在外。

語言不平等,是AI世界的隱形門檻

Sarvam AI共同創辦人Vivek Raghavan在開發印度語言模型時發現:印地語的同一句話,需要比英語多3至4倍的token(AI處理語言的基本單位)。這意味著每一次用印度語言與AI互動,成本都遠高於英語使用者。

這個技術細節背後,是一個更大的結構性問題。印度擁有超過1,600種方言22種官方語言,能流利使用英語的人口只佔少數。如果AI系統繼續以英語為中心,技術紅利將只流向城市菁英,而非真正需要幫助的農村居民、基層醫療工作者與學生。

Sarvam AI的回應是從根本解決問題:重新設計印度語言的token處理機制,大幅降低成本,並開發出旗艦模型「SarvamM」——一個擁有240億參數、支援10種印度語言、可在低階智慧型手機與低速網路上運行的大型語言模型(LLM)。

「精實AI」:用最少資源,解決最大問題

Sarvam AI的設計哲學源自印度理工學院馬德拉斯分校(IIT Madras)在2020年啟動的AI4Bharat計畫,核心概念是「LeanSpark」:在成本、頻寬與基礎設施三重限制下,解決大規模社會問題。這與印度Aadhaar生物識別身分系統和UPI統一支付介面的設計邏輯一脈相承。

PRISM

廣告合作

[email protected]

在醫療領域,Sarvam AI部署了支援多語言的語音對話代理,讓農村病患能透過WhatsApp以母語諮詢醫師、預約掛號,無需高階設備或穩定網路。系統可整理病患症狀、提供診斷建議、協助分流,成為醫療資源匱乏地區的低成本AI助理。

在教育領域,旗艦模型能理解「code-mixed」查詢(即混合使用多種語言的表達方式),以學生母語提供個人化教學,並將數學與程式課程適配至各地區的教育脈絡。Raghavan的願景是:「讓每個印度孩子口袋裡都有一位家教,每個印度成年人手中都有一位私人醫師。」

開源專案「OpenHathi」則採取更務實的路徑:不從零建構模型,而是將MetaLLaMA與法國的Mistral等現有模型「嫁接」印度語言能力,大幅降低開發門檻,讓本地開發者能在此基礎上建立醫療、金融等垂直領域的專用模型。

競爭對手KrutrimOla共同創辦人Bhavish Aggarwal於2023年4月創立,以2兆token訓練,支援22種印度語言,同樣以不需超級電腦的高效架構為設計核心,目標市場涵蓋學校、新創公司與政府服務。

為什麼這對亞洲市場至關重要?

印度的「主權AI」浪潮發生在一個關鍵時刻:OpenAIGoogleMeta等美國科技巨頭主導全球生成AI發展,各國開始意識到在語言、數據與文化上對外依賴的風險。「主權AI」不再是政治口號,而是實際的技術戰略選擇。

對於華語世界而言,這個趨勢有其特殊的參照意義。中國大陸已有百度阿里騰訊等企業投入中文大模型開發,但在東南亞的越南語、泰語、馬來語,乃至台灣的繁體中文、台語混用場景,是否也存在類似的語言token不平等問題?這些市場的本地AI生態系統是否足夠成熟?

更值得思考的是商業模式。Sarvam AI選擇了營利模式,相信唯有市場競爭與資本投入,才能真正實現規模化影響。這與部分「公益科技」的邏輯形成對比——在資源有限的新興市場,哪種模式更能持續?

印度的「精實AI」路徑,或許正在為整個全球南方——包括東南亞、非洲、中東——提供一套可複製的藍圖。對於在這些市場布局的投資者與企業而言,這不只是一個技術故事,更是一個市場機會的訊號。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]