
أثارت تقنية طورتها شركة “DeepSeek” الصينية الناشئة في مجال الذكاء الاصطناعي نقاشًا علميًا حادًا، وذلك بعد أن ألقت دراسة بحثية جديدة بظلال من الشك على قدرتها المعلنة في تحسين تعامل نماذج الذكاء الاصطناعي مع النصوص المطولة، في حادثة نادرة تتعرض فيها أبحاث الشركة لانتقاد علني.
الدراسة، التي أشرف عليها باحثون من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، ركزت على تقنية “DeepSeek-OCR”، وهي آلية تعتمد على تمثيل النصوص بصريًا بهدف تقليل حجمها، وهو ما يفترض أن يساعد نماذج الذكاء الاصطناعي على تخطي ما يعرف بـ “عنق زجاجة السياق الطويل”.
ما هي تقنية “DeepSeek-OCR”؟
كشفت “DeepSeek” عن هذه التقنية في أكتوبر الماضي، واصفة إياها بأنها قادرة على إحداث ثورة في معالجة الوثائق الكبيرة والمعقدة، وذلك عن طريق استخدام الإدراك البصري كطريقة لضغط النصوص. ووفقًا لتصريحات الشركة، فإن هذه الطريقة قادرة على تقليل عدد الرموز النصية (“Tokens”) بنسبة تتراوح بين 7 و20 مرة.
إلا أن الدراسة الحديثة، التي حملت عنوان “قيمة بصرية أم عكاز لغوي؟ نظرة متعمقة على DeepSeek-OCR”، خلصت إلى أن أداء التقنية كان متذبذبًا، وأنها تعتمد بشكل كبير على ما يُعرف بـ “الأسبقيات اللغوية”، أي الأساليب التي استقاها النموذج من كميات هائلة من النصوص، عوضًا عن الفهم البصري الحقيقي الذي زعمت التقنية تقديمه.
ووصف الباحثون مقاييس الأداء التي أعلنتها “DeepSeek” بأنها “مضللة”، مشيرين إلى أن دقة الإجابة على الأسئلة البصرية تراجعت إلى حوالي 20% عند إضافة نص إضافي يمكن أن يؤثر على الاستنتاج، مقارنة بأكثر من 90% لدى نماذج الذكاء الاصطناعي التقليدية.
أوضح الباحثون أن نماذج الذكاء الاصطناعي لا تزال تواجه صعوبات أساسية في التعامل مع المستندات الطويلة أو الحوارات الممتدة، وهي مشكلة تسعى شركات ومراكز أبحاث حول العالم إلى حلها، غير أن نتائج الدراسة تثير تساؤلات جوهرية حول ما إذا كانت تقنيات الضغط البصري الحالية تمثل حقًا سبيلًا عمليًا لتجاوز هذه الصعوبات.
لم تستجب شركة “DeepSeek” على الفور لطلب التعليق، إلا أن بعض خبراء علوم الحاسوب رأوا أن التقنية ليست بالضرورة فاشلة، بل هي سلاح ذو حدين. وقال لي بوجييه، الحاصل على دكتوراه في علوم الحاسوب من جامعة العلوم والتكنولوجيا الصينية، والذي يدير حاليًا شركة ناشئة في بكين، إن الاعتماد على المعرفة المكتسبة قد يكون مفيدًا عند التعامل مع مخطوطات غير واضحة، ولكنه قد يتحول إلى نقطة ضعف عند قراءة نصوص مطبوعة بوضوح، وأضاف: “يمكن القول إن لهذه الطريقة مزاياها وعيوبها في الوقت نفسه”.
توضح هذه الدراسة أن المنافسة لتحسين قدرات الذكاء الاصطناعي في فهم النصوص الطويلة لا تزال مستمرة، وأنه لا توجد حتى الآن “حلول سحرية” تصلح لجميع الحالات، وهو ما يدفع الباحثين إلى استكشاف استراتيجيات بديلة وأكثر فعالية. (اليوم السابع)