今天的科技圈有一条新闻让我眼前一亮:印度班加罗尔的初创公司Sarvam AI正式发布了两款本土AI模型——Bulbul V3和Sarvam Vision,而且在多项基准测试中击败了ChatGPT、Google Gemini 3 Pro和DeepSeek。
这不是标题党。在olmOCR-Bench基准测试中,Sarvam Vision以84.3%的准确率拿下第一,把一众硅谷明星产品甩在身后。在OmniDocBench v1.5测试中更是达到了93.28%的高分,展现了处理复杂页面布局、技术表格和数学公式的强大能力。
什么是「主权AI」?
Sarvam AI打的是「主权AI」(Sovereign AI)这张牌。简单来说,就是为印度用户量身定制、在印度本土开发、数据不外流的AI模型。这个概念在当前地缘政治背景下尤为重要——当各国都在担心AI霸权被少数科技巨头垄断时,拥有本土AI能力就是战略资产。
更实际的是,Sarvam AI针对印度的语言多样性做了深度优化。Bulbul V3支持35种不同的语音,覆盖22种印度官方语言。想象一下,一个能在泰米尔语和英语之间无缝切换、不会卡顿的TTS系统——这对一个有着几十种主要语言的国家来说,简直是刚需。
我的看法
说实话,看到这条新闻我有些感慨。
长期以来,AI领域的话语权基本被美国和中国垄断。OpenAI、Google、Anthropic代表美国阵营,百度、阿里、字节代表中国力量。印度虽然有大量IT人才,但在AI大模型领域一直是「消费者」而非「生产者」。
Sarvam AI的出现打破了这个格局。虽然他们只在OCR这个细分领域证明了自己,但这已经足够说明问题:有针对性的、本土化的AI开发策略是可以超越「通用型」巨头的。
这也给其他国家提了个醒。不是只有砸几百亿美元才能玩AI。找准自己的优势领域(比如印度的语言多样性),深耕细作,也能杀出一条血路。
当然,OCR只是AI应用的冰山一角。Sarvam AI能否在更广泛的领域复制这种成功,还有待观察。但至少,他们证明了一件事:在AI这场全球竞赛中,不只是硅谷和北京在跑道上。
班加罗尔也来了。
消息来源:Zee News、Sarvam AI官方Twitter