تنبيه مثير للسخرية: تم العثور على استشهادات هلوسة في الأوراق البحثية الصادرة عن NeurIPS، مؤتمر الذكاء الاصطناعي المرموق

0 1 2 دقائق

تنبيه مثير للسخرية: تم العثور على استشهادات هلوسة في الأوراق البحثية الصادرة عن NeurIPS، مؤتمر الذكاء الاصطناعي المرموق

قامت شركة GPTZero الناشئة للكشف عن الذكاء الاصطناعي بمسح جميع الأوراق البحثية البالغ عددها 4841 والتي تم قبولها في المؤتمر المرموق لأنظمة معالجة المعلومات العصبية (NeurIPS)، الذي انعقد الشهر الماضي في سان دييغو. عثرت الشركة على 100 استشهاد مهلوس في 51 ورقة بحثية أكدت أنها مزورة، حسبما أخبرت الشركة موقع TechCrunch.

يعد الحصول على ورقة بحثية مقبولة من قبل NeurIPS إنجازًا يستحق السيرة الذاتية في عالم الذكاء الاصطناعي. وبالنظر إلى أن هؤلاء هم العقول الرائدة في أبحاث الذكاء الاصطناعي، فقد يفترض المرء أنهم سيستخدمون ماجستير إدارة الأعمال في المهمة المملة الكارثية المتمثلة في كتابة الاستشهادات.

لذا فإن التحذيرات كثيرة بشأن هذه النتيجة: 100 استشهاد هلوسة مؤكد عبر 51 ورقة بحثية ليست ذات دلالة إحصائية. تحتوي كل ورقة على عشرات الاستشهادات. ومن بين عشرات الآلاف من الاستشهادات، هذا إحصائيًا صفر.

من المهم أيضًا ملاحظة أن الاستشهاد غير الدقيق لا ينفي بحث الورقة. وكما قالت شركة NeurIPS لمجلة Fortune، التي كانت أول من نشر تقريرًا عن بحث GPTZero، “حتى لو كان 1.1% من الأوراق البحثية تحتوي على مرجع واحد أو أكثر غير صحيح بسبب استخدام ماجستير إدارة الأعمال، فإن محتوى الأوراق نفسها [is] لا يبطل بالضرورة.”

ولكن بعد أن قلت كل ذلك، فإن الاقتباس المزيف ليس لا شيء أيضًا. وتفتخر شركة NeurIPS “بنشرها العلمي الدقيق في مجال التعلم الآلي والذكاء الاصطناعي”، كما تقول. وتخضع كل ورقة لمراجعة النظراء من قبل العديد من الأشخاص الذين تم توجيههم للإبلاغ عن الهلوسة.

الاستشهادات هي أيضًا نوع من العملة للباحثين. يتم استخدامها كمقياس وظيفي لإظهار مدى تأثير عمل الباحث بين أقرانه. وعندما يصنعها الذكاء الاصطناعي، فإنه يقلل من قيمتها.

لا يمكن لأحد أن يلوم المراجعين النظراء لعدم تمكنهم من التقاط عدد قليل من الاستشهادات الملفقة بواسطة الذكاء الاصطناعي، نظرًا للحجم الهائل المعني. GPTZero سريع أيضًا في الإشارة إلى ذلك. كان الهدف من التمرين هو تقديم بيانات محددة حول كيفية تسلل الذكاء الاصطناعي عبر “تسونامي التقديم” الذي “أجهد خطوط مراجعة هذه المؤتمرات إلى نقطة الانهيار”، كما تقول الشركة الناشئة في تقريرها. وتشير GPTZero أيضًا إلى ورقة بحثية صدرت في مايو 2025 بعنوان “أزمة مراجعة النظراء في مؤتمر الذكاء الاصطناعي” والتي ناقشت المشكلة في المؤتمرات الأولى، بما في ذلك NeurIPS.

حدث تك كرانش

سان فرانسيسكو
|
13-15 أكتوبر 2026

ومع ذلك، لماذا لم يتمكن الباحثون أنفسهم من التحقق من صحة عمل LLM للتأكد من دقته؟ من المؤكد أنهم يجب أن يعرفوا القائمة الفعلية للأوراق التي استخدموها في عملهم.

ما يشير إليه الأمر برمته هو حقيقة واحدة كبيرة ومثيرة للسخرية: إذا كان خبراء الذكاء الاصطناعي الرائدون في العالم، وسمعتهم على المحك، لا يمكنهم ضمان دقة استخدامهم لماجستير إدارة الأعمال في التفاصيل، فماذا يعني ذلك بالنسبة لبقيتنا؟

Source link