في دراسة بجامعة هارفارد، قدم الذكاء الاصطناعي تشخيصات أكثر دقة من أطباء غرفة الطوارئ

0 2 2 دقائق

في دراسة بجامعة هارفارد، قدم الذكاء الاصطناعي تشخيصات أكثر دقة من أطباء غرفة الطوارئ

تبحث دراسة جديدة في كيفية أداء النماذج اللغوية الكبيرة في مجموعة متنوعة من السياقات الطبية، بما في ذلك حالات غرف الطوارئ الحقيقية – حيث يبدو نموذج واحد على الأقل أكثر دقة من الأطباء البشريين.

نُشرت الدراسة هذا الأسبوع في مجلة Science وتأتي من فريق بحث بقيادة أطباء وعلماء كمبيوتر في كلية الطب بجامعة هارفارد ومركز Beth Israel Deaconess الطبي. وقال الباحثون إنهم أجروا مجموعة متنوعة من التجارب لقياس كيفية مقارنة نماذج OpenAI بالأطباء البشريين.

في إحدى التجارب، ركز الباحثون على 76 مريضًا جاءوا إلى غرفة الطوارئ في بيث إسرائيل، وقارنوا التشخيصات التي قدمها طبيبان معالجان بتلك التي تم إنشاؤها بواسطة نماذج OpenAI o1 و4o. تم تقييم هذه التشخيصات من قبل طبيبين آخرين، لم يعرفا أي منها جاء من البشر وأيها جاء من الذكاء الاصطناعي.

وقالت الدراسة: “في كل نقطة اتصال تشخيصية، كان أداء o1 أفضل اسميًا من الطبيبين المعالجين و4o أو على قدم المساواة معه”، مضيفة أن الاختلافات “كانت واضحة بشكل خاص عند نقطة الاتصال التشخيصية الأولى (الفرز الأولي للطوارئ)، حيث تتوفر أقل المعلومات حول المريض والأكثر إلحاحًا لاتخاذ القرار الصحيح”.

في البيان الصحفي الصادر عن كلية الطب بجامعة هارفارد حول الدراسة، أكد الباحثون أنهم لم “يعالجوا البيانات مسبقًا على الإطلاق” – فقد تم تقديم نماذج الذكاء الاصطناعي بنفس المعلومات التي كانت متوفرة في السجلات الطبية الإلكترونية في وقت كل تشخيص.

باستخدام هذه المعلومات، تمكن نموذج o1 من تقديم “التشخيص الدقيق أو القريب جدًا” في 67% من حالات الفرز، مقارنة بطبيب واحد حصل على التشخيص الدقيق أو القريب في 55% من الحالات، والطبيب الآخر الذي وصل إلى العلامة في 50% من الحالات.

وقال أرجون مانراي، الذي يرأس مختبر الذكاء الاصطناعي في كلية الطب بجامعة هارفارد وأحد المؤلفين الرئيسيين للدراسة، في البيان الصحفي: “لقد اختبرنا نموذج الذكاء الاصطناعي مقابل كل المعايير تقريبًا، وقد تفوق على النماذج السابقة وخطوط الأساس الطبية لدينا”.

حدث تك كرانش

سان فرانسيسكو، كاليفورنيا
|
13-15 أكتوبر 2026

للتوضيح، لم تزعم الدراسة أن الذكاء الاصطناعي جاهز لاتخاذ قرارات حقيقية تتعلق بالحياة أو الموت في غرفة الطوارئ. وبدلاً من ذلك، قالت إن النتائج تظهر “حاجة ملحة لإجراء تجارب مستقبلية لتقييم هذه التقنيات في أماكن رعاية المرضى في العالم الحقيقي”.

وأشار الباحثون أيضًا إلى أنهم درسوا فقط كيفية أداء النماذج عند تزويدها بمعلومات مستندة إلى النص، وأن “الدراسات الحالية تشير إلى أن النماذج الأساسية الحالية محدودة أكثر في التفكير في المدخلات غير النصية”.

قال آدم رودمان، طبيب بيت إسرائيل وهو أيضًا أحد المؤلفين الرئيسيين للدراسة، لصحيفة الغارديان إنه “لا يوجد إطار رسمي في الوقت الحالي للمساءلة” حول تشخيصات الذكاء الاصطناعي، وأن المرضى ما زالوا “يريدون أن يرشدهم البشر خلال قرارات الحياة أو الموت”. [and] لإرشادهم خلال قرارات العلاج الصعبة”.

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.

Source link