حتى بعض أفضل الذكاء الاصطناعي لا يمكنه التغلب على هذا المعيار الجديد

أصدر مركز سلامة الذكاء الاصطناعي (CAIS) غير الربحي وشركة Scale AI، وهي شركة تقدم عددًا من خدمات تصنيف البيانات وتطوير الذكاء الاصطناعي، معيارًا جديدًا صعبًا لأنظمة الذكاء الاصطناعي الحدودية.

ويتضمن المعيار، الذي يطلق عليه “الاختبار الأخير للإنسانية”، آلاف الأسئلة الجماعية التي تتناول موضوعات مثل الرياضيات والعلوم الإنسانية والعلوم الطبيعية. ولجعل التقييم أكثر صرامة، تكون الأسئلة بتنسيقات متعددة، بما في ذلك التنسيقات التي تتضمن الرسوم البيانية والصور.

في دراسة أولية، لم ينجح أي نظام ذكاء اصطناعي رئيسي متاح للعامة في الحصول على نتيجة أفضل من 10% في الاختبار الأخير للبشرية.

يقول CAIS وScale AI إنهما يخططان لفتح المعيار أمام مجتمع البحث حتى يتمكن الباحثون من “التعمق أكثر في الاختلافات” وتقييم نماذج الذكاء الاصطناعي الجديدة.

Source link

اكتشاف المزيد من في بي دبليو الشامل

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

حتى بعض أفضل الذكاء الاصطناعي لا يمكنه التغلب على هذا المعيار الجديد

كشمير: الحملة على الكتب “غير المرغوب فيها” في المدارس تثير الجدل

Whatnot يكتسب Shaped لدعم توصيات التسوق المباشر في الوقت الفعلي

تدعم شركة Lululemon شركة Syntetica الناشئة لإعادة تدوير النايلون في سلسلة A بقيمة 30 مليون دولار

حتى بعض أفضل الذكاء الاصطناعي لا يمكنه التغلب على هذا المعيار الجديد

شارك هذا الموضوع:

معجب بهذه:

اكتشاف المزيد من في بي دبليو الشامل

المقالات ذات الصلة

كشمير: الحملة على الكتب “غير المرغوب فيها” في المدارس تثير الجدل

Whatnot يكتسب Shaped لدعم توصيات التسوق المباشر في الوقت الفعلي

تدعم شركة Lululemon شركة Syntetica الناشئة لإعادة تدوير النايلون في سلسلة A بقيمة 30 مليون دولار

اكتشاف المزيد من في بي دبليو الشامل