أصدر مركز سلامة الذكاء الاصطناعي (CAIS) غير الربحي وشركة Scale AI، وهي شركة تقدم عددًا من خدمات تصنيف البيانات وتطوير الذكاء الاصطناعي، معيارًا جديدًا صعبًا لأنظمة الذكاء الاصطناعي الحدودية.

ويتضمن المعيار، الذي يطلق عليه “الاختبار الأخير للإنسانية”، آلاف الأسئلة الجماعية التي تتناول موضوعات مثل الرياضيات والعلوم الإنسانية والعلوم الطبيعية. ولجعل التقييم أكثر صرامة، تكون الأسئلة بتنسيقات متعددة، بما في ذلك التنسيقات التي تتضمن الرسوم البيانية والصور.

في دراسة أولية، لم ينجح أي نظام ذكاء اصطناعي رئيسي متاح للعامة في الحصول على نتيجة أفضل من 10% في الاختبار الأخير للبشرية.

يقول CAIS وScale AI إنهما يخططان لفتح المعيار أمام مجتمع البحث حتى يتمكن الباحثون من “التعمق أكثر في الاختلافات” وتقييم نماذج الذكاء الاصطناعي الجديدة.



Source link


اكتشاف المزيد من في بي دبليو الشامل

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

شاركها.
اترك تعليقاً

اكتشاف المزيد من في بي دبليو الشامل

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading

عاجل