印度AI新星Sarvam：小而美能否撼動巨頭壟斷？

印度AI公司Sarvam發布105B參數大模型，以開源策略挑戰美中科技巨頭。這場「效率vs規模」的較量將如何重塑全球AI格局？

16兆個token的訓練數據，105B參數的模型規模。當印度AI公司Sarvam在週二發布這些數字時，它正在向一個由美中科技巨頭主導的市場發起挑戰。這家成立僅三年的新創公司相信，「小而精」的開源AI模型能夠從昂貴的封閉系統中搶奪市場份額。

印度的AI自主化布局

Sarvam選擇在新德里的India AI Impact Summit上發布新產品，時機耐人尋味。這與印度政府推動減少對外國AI平台依賴、開發本土語言模型的政策完全吻合。在中美科技競爭加劇的背景下，印度正試圖開闢第三條道路。

新產品線包括30B和105B參數的大語言模型、文字轉語音模型、語音轉文字模型，以及文檔解析視覺模型。相比2024年10月發布的2B參數Sarvam 1，這次的升級幅度達到50倍以上。

技術亮點在於「專家混合」架構。這種設計只啟動部分參數，大幅降低運算成本。30B模型支援32,000 token的上下文視窗，專攻即時對話；105B模型則提供128,000 token視窗，處理複雜的多步推理任務。

從零開始的技術野心

Sarvam強調，這些模型並非基於現有開源系統的微調，而是「從零開始」訓練。30B模型使用約16兆 token進行預訓練，105B模型則涵蓋多種印度語言的數兆token數據。

廣告合作

[email protected]

值得注意的是，這項訓練依靠印度政府支持的IndiaAI Mission計算資源、數據中心營運商Yotta的基礎設施，以及NVIDIA的技術支援。這種政府、民間企業與外國技術公司的合作模式，反映了印度在AI發展上的務實策略。

聯合創辦人Pratyush Kumar在發布會上表示：「我們希望在擴展方面採取謹慎態度。我們不想盲目擴展，而是要理解真正重要的任務，然後針對性地構建。」這番話似乎在暗示，參數競賽並非AI發展的唯一路徑。

華人世界的觀察視角

對於華人科技圈而言，Sarvam的策略具有特殊意義。在美國對中國AI技術實施限制的當下，印度模式提供了另一種思路：通過開源策略與國際合作，繞過技術封鎖。

Sarvam計劃推出的「Sarvam for Work」企業工具和「Samvaad」對話AI平台，與中國大陸的釘釘、飛書等企業服務有相似定位。但不同的是，Sarvam選擇開源路線，這可能為台灣、香港等地的企業提供更多選擇空間。

從資金角度看，Sarvam已從Lightspeed Venture Partners、Khosla Ventures、Peak XV Partners等知名投資機構籌集超過5000萬美元。雖然與OpenAI的數十億美元融資相比仍有差距，但這筆資金在印度AI新創中已屬大手筆。

開源策略的雙面刃

Sarvam承諾將開源30B和105B模型，但未明確是否包括訓練數據和完整訓練代碼。這種「有限開源」策略在業界並不罕見，但也引發了關於真正開放程度的討論。

對於亞洲市場而言，Sarvam的成功與否將成為重要指標。如果印度能夠通過相對較小的投資實現AI技術突破，這將證明「效率優先」策略的可行性，也可能激勵更多亞洲國家投入AI自主研發。

印度的AI自主化布局

從零開始的技術野心

華人世界的觀察視角

開源策略的雙面刃

观点

記者

相关文章