دراسة جديدة تشكك في فعالية تقنية DeepSeek-OCR لمعالجة النصوص الطويلة
أثارت تقنية DeepSeek-OCR، التي طورتها شركة الذكاء الاصطناعي الصينية الناشئة DeepSeek، جدلاً علمياً كبيراً بعد أن شككت دراسة بحثية حديثة في قدرتها المعلنة على مساعدة نماذج الذكاء الاصطناعي في التعامل مع النصوص الطويلة بكفاءة. هذه الحالة تُعد من النادر أن تواجه أبحاث الشركة انتقادات علنية بهذا الشكل.
الدراسة، التي قام بإعدادها باحثون من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، ركزت على تقنية DeepSeek-OCR التي تعتمد على تمثيل النصوص بصرياً لضغطها، بهدف تجاوز ما يُعرف بـ "عنق زجاجة السياق الطويل" في نماذج الذكاء الاصطناعي. كشفت DeepSeek عن هذه التقنية في أكتوبر الماضي، مدعية أنها تحدث نقلة نوعية في معالجة المستندات المعقدة، حيث يمكنها تقليل عدد الرموز النصية (Tokens) بمعدل يتراوح بين 7 إلى 20 مرة باستخدام الإدراك البصري كوسيط للضغط.
لكن النتائج المستقلة للدراسة الجديدة، التي حملت عنوان "قيمة بصرية أم عكاز لغوي؟ نظرة متعمقة على DeepSeek-OCR"، جاءت مقلقة. فقد خلص الباحثون إلى أن أداء التقنية كان غير متسق، وأنها تعتمد بشكل كبير على "الأسبقيات اللغوية" (الأنماط التي تعلمتها النماذج سابقاً) بدلاً من الفهم البصري الحقيقي الذي ادعت التقنية تقديمه. ووصف الباحثون مؤشرات الأداء التي أعلنتها DeepSeek بأنها "مضللة"، مشيرين إلى أن دقة الإجابة عن الأسئلة البصرية انخفضت إلى حوالي 20% عند إضافة نصوص إضافية مؤثرة على الاستدلال، مقارنة بأكثر من 90% في نماذج الذكاء الاصطناعي التقليدية.
أوضح الباحثون أن أزمة السياق الطويل لا تزال قائمة، وأن نماذج الذكاء الاصطناعي لا تزال تواجه قيوداً جوهرية في معالجة المستندات والحوارات الطويلة. نتائج الدراسة تثير تساؤلات حول مدى فعالية تقنيات الضغط البصري الحالية كحل عملي لتجاوز هذه القيود.
في حين لم ترد شركة DeepSeek على الفور لطلب التعليق، رأى بعض خبراء علوم الحاسوب أن التقنية ليست فشلاً كلياً بل سلاح ذو حدين. وأشار لي بوجييه، الحاصل على دكتوراه في علوم الحاسوب، إلى أن الاعتماد على المعرفة المكتسبة قد يكون مفيداً في التعامل مع المخطوطات غير الواضحة، لكنه قد يصبح نقطة ضعف عند التعامل مع نصوص مطبوعة بوضوح، مؤكداً أن للطريقة "مزاياها وعيوبها في الوقت نفسه".
تُظهر هذه الدراسة أن السباق لتحسين قدرة الذكاء الاصطناعي على فهم النصوص الطويلة لا يزال محتدماً، وأنه لا يوجد حتى الآن "حل سحري" يناسب كل السيناريوهات، مما يدفع الباحثين نحو استراتيجيات بديلة وأكثر موثوقية.

