تابعنا

نموذج هندي ناشئ "Sarvam AI" يتفوق محلياً على ChatGPT وGemini في مهام متخصصة

نموذج هندي ناشئ "Sarvam AI" يتفوق محلياً على ChatGPT وGemini في مهام متخصصة

أحدثت شركة "Sarvam AI" الهندية الناشئة ضجة كبيرة في عالم الذكاء الاصطناعي بعد إعلانها أن أدواتها الجديدة حققت أداءً متفوقاً على نماذج عالمية مثل ChatGPT وGemini وClaude، تحديداً في المهام التي تتطلب فهماً عميقاً للسياق الهندي، مثل التعامل مع النصوص والوثائق متعددة اللغات.

أطلقت Sarvam AI أداتين ركزتا على مجالات دقيقة هما Sarvam Vision وBulbul V3. هذا التخصص مكنها من سحق المنافسين في اختبارات ومعايير محددة. ورغم هذا التفوق، يجب التأكيد على أن هذه النماذج ليست بديلاً شاملاً للنماذج العامة العملاقة مثل ChatGPT أو Gemini.

نموذج Sarvam Vision أظهر تفوقاً لافتاً في مجال التعرف الضوئي على النصوص (OCR). ففي 5 فبراير، أعلن الشريك المؤسس براتيوش كومار أن النموذج سجل دقة غير مسبوقة بلغت 84.3% في اختبار olmOCR-Bench العالمي، متجاوزاً بذلك ChatGPT وGemini 3 Pro. كما حقق 93.28% في اختبار OmniDocBench v1.5، خاصة في التعامل مع التخطيطات المعقدة والجداول التقنية والصيغ الرياضية.

السر وراء هذا النجاح يكمن في التدريب المخصص؛ حيث تم تدريب Sarvam Vision خصيصاً على أنماط الكتابة الهندية المعقدة واللغات الإقليمية المختلفة. بينما تمتلك النماذج العالمية قدرات قوية في OCR، إلا أنها ليست مُحسّنة بنفس الكفاءة للتعامل مع خصوصية النصوص الهندية، مما منح Sarvam AI ميزة واضحة في خدمة المؤسسات الحكومية والشركات التي تتعامل مع مستندات مكتوبة بخط اليد أو وثائق رسمية متعددة اللغات.

أما الأداة الثانية، Bulbul V3، المتخصصة في تحويل النص إلى صوت (Text-to-Speech)، فقد تفوقت على نموذج ElevenLabs الشهير عالمياً، ولكن ضمن السياق الهندي تحديداً. ويعود ذلك إلى تدريبها المكثف على اللهجات الهندية وفهم نطق اللغات المحلية، مما ينتج أصواتاً تبدو أكثر طبيعية وواقعية للمستخدم الهندي.

لماذا لا تستبدل Sarvam AI النماذج الكبرى؟ ببساطة، نماذج Sarvam AI مصممة لوظائف متخصصة بدقة فائقة، ولا تدعم المحادثات المفتوحة أو إنتاج المحتوى الإبداعي المتنوع الذي تتفوق فيه نماذج مثل Gemini القادرة على تحليل صور طبية أو إعداد امتحانات معقدة خطوة بخطوة.

الفروق الهيكلية واضحة؛ فبينما يضم Sarvam Vision حوالي 3 مليارات باراميتر فقط، يُشاع أن Gemini 3 يقترب من 2 تريليون باراميتر. هذا الحجم الهائل يتطلب بنية تحتية وموارد حاسوبية ضخمة غير متوفرة حالياً بهذا النطاق في الهند. ومع ذلك، يمثل إنجاز Sarvam AI دليلاً قوياً على أن التركيز الذكي والمحدد يمكن أن يحقق تفوقاً على العمالقة العالميين في مجالاتهم المتخصصة.