印度AI新星Sarvam:小而美能否撼動巨頭壟斷?
印度AI公司Sarvam發布105B參數大模型,以開源策略挑戰美中科技巨頭。這場「效率vs規模」的較量將如何重塑全球AI格局?
16兆個token的訓練數據,105B參數的模型規模。當印度AI公司Sarvam在週二發布這些數字時,它正在向一個由美中科技巨頭主導的市場發起挑戰。這家成立僅三年的新創公司相信,「小而精」的開源AI模型能夠從昂貴的封閉系統中搶奪市場份額。
印度的AI自主化布局
Sarvam選擇在新德里的India AI Impact Summit上發布新產品,時機耐人尋味。這與印度政府推動減少對外國AI平台依賴、開發本土語言模型的政策完全吻合。在中美科技競爭加劇的背景下,印度正試圖開闢第三條道路。
新產品線包括30B和105B參數的大語言模型、文字轉語音模型、語音轉文字模型,以及文檔解析視覺模型。相比2024年10月發布的2B參數Sarvam 1,這次的升級幅度達到50倍以上。
技術亮點在於「專家混合」架構。這種設計只啟動部分參數,大幅降低運算成本。30B模型支援32,000 token的上下文視窗,專攻即時對話;105B模型則提供128,000 token視窗,處理複雜的多步推理任務。
從零開始的技術野心
Sarvam強調,這些模型並非基於現有開源系統的微調,而是「從零開始」訓練。30B模型使用約16兆 token進行預訓練,105B模型則涵蓋多種印度語言的數兆token數據。
值得注意的是,這項訓練依靠印度政府支持的IndiaAI Mission計算資源、數據中心營運商Yotta的基礎設施,以及NVIDIA的技術支援。這種政府、民間企業與外國技術公司的合作模式,反映了印度在AI發展上的務實策略。
聯合創辦人Pratyush Kumar在發布會上表示:「我們希望在擴展方面採取謹慎態度。我們不想盲目擴展,而是要理解真正重要的任務,然後針對性地構建。」這番話似乎在暗示,參數競賽並非AI發展的唯一路徑。
華人世界的觀察視角
對於華人科技圈而言,Sarvam的策略具有特殊意義。在美國對中國AI技術實施限制的當下,印度模式提供了另一種思路:通過開源策略與國際合作,繞過技術封鎖。
Sarvam計劃推出的「Sarvam for Work」企業工具和「Samvaad」對話AI平台,與中國大陸的釘釘、飛書等企業服務有相似定位。但不同的是,Sarvam選擇開源路線,這可能為台灣、香港等地的企業提供更多選擇空間。
從資金角度看,Sarvam已從Lightspeed Venture Partners、Khosla Ventures、Peak XV Partners等知名投資機構籌集超過5000萬美元。雖然與OpenAI的數十億美元融資相比仍有差距,但這筆資金在印度AI新創中已屬大手筆。
開源策略的雙面刃
Sarvam承諾將開源30B和105B模型,但未明確是否包括訓練數據和完整訓練代碼。這種「有限開源」策略在業界並不罕見,但也引發了關於真正開放程度的討論。
對於亞洲市場而言,Sarvam的成功與否將成為重要指標。如果印度能夠通過相對較小的投資實現AI技術突破,這將證明「效率優先」策略的可行性,也可能激勵更多亞洲國家投入AI自主研發。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
印度Sarvam發布Indus聊天應用,搭載1050億參數模型,在ChatGPT擁有1億用戶的印度市場展開在地化AI競爭
OpenAI公布印度用戶數據:18-24歲佔ChatGPT訊息量50%,程式開發使用率為全球3倍。這對亞洲AI市場意味著什麼?
微軟員工博文建議使用哈利波特書籍訓練AI模型引發爭議後被刪除,凸顯AI訓練數據版權問題的複雜性。
輝達與印度早期投資基金Activate合作,從公司成立前就開始培養AI新創關係。這場「上游戰略」對亞洲科技生態意味著什麼?
观点
分享你对这篇文章的看法
登录加入讨论