تقنية

ربما يمكن لعملاء الذكاء الاصطناعي أن يصبحوا محامين بعد كل شيء


كتبت الشهر الماضي عن معيار ميركور الجديد لقياس قدرات وكلاء الذكاء الاصطناعي في المهام المهنية مثل القانون وتحليل الشركات. في ذلك الوقت، كانت النتائج سيئة للغاية، حيث سجلت كل مختبرات كبرى أقل من 25%، لذلك خلصنا إلى أن المحامين في مأمن من إزاحة الذكاء الاصطناعي، على الأقل في الوقت الحالي.

لكن قدرات الذكاء الاصطناعي يمكن أن تتغير كثيرًا في غضون أسبوعين.

أحدث إصدار Anthropic’s Opus 4.6 هذا الأسبوع هزًا في قوائم المتصدرين، حيث سجل نموذج Anthropic الجديد ما يقرب من 30% في تجارب اللقطة الواحدة، ومتوسط ​​45% عند إعطائه المزيد من التحسينات في المشكلة. ومن الجدير بالذكر أن الإصدار تضمن مجموعة من ميزات الوكيل الجديدة، بما في ذلك “أسراب العملاء”، والتي ربما ساعدت في هذا النوع من حل المشكلات متعدد الخطوات.

بغض النظر، فإن النتيجة تمثل قفزة هائلة من الحالة الفنية السابقة، وعلامة على أن التقدم في نماذج الأساس لا يتباطأ. وقال بريندان فودي، الرئيس التنفيذي لشركة ميركور، الذي أبدى إعجابه بشكل خاص، “إن القفز من 18.4% إلى 29.8% في غضون أشهر قليلة هو أمر جنوني”.

لوحة المتصدرين APEX-Agents.اعتمادات الصورة:ميركور (لقطة شاشة)

لا يزال هناك طريق طويل للوصول إلى نسبة 30%، لذا لا يبدو أن المحامين بحاجة إلى القلق بشأن استبدالهم بالآلات في الأسبوع المقبل. لكن يجب أن يكونوا أقل ثقة بكثير مما كانوا عليه في الشهر الماضي!



Source link

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى