اخر الاخبار

لماذا تهلوس النماذج اللغوية؟ ورقة OpenAI تقترح تغييرات في طرق التقييم

 

لماذا تهلوس النماذج اللغوية؟ ورقة OpenAI تقترح تغييرات في طرق التقييم


بحث جديد من OpenAI يتناول سؤالًا أساسيًا: لماذا لا تزال النماذج اللغوية الكبيرة مثل GPT-5 والدردشة الآلية (ChatGPT) تُنتج «هلوسات»؟ وهل ثمة طرق فعّالة لتقليلها؟


تعرّف OpenAI في مدوّنة تلخّص الدراسة «الهلوسات» بأنها عبارات تبدو مُقنعة لكنها خاطئة، وتقرّ بأن هذه الظاهرة لا تزال تحديًا جوهريًا لكل النماذج الكبيرة ولن تختفي تمامًا مع التقدّم. كمثال توضيحي، يذكر الباحثون أنه عند سؤال «شات بوت» شائع عن عنوان رسالة الدكتوراه للباحث آدم تاومان كالاي—الذي يشارك في إعداد الورقة—تلقّوا ثلاث إجابات مختلفة، كلها خاطئة. وحتى عن تاريخ ميلاده أعطاهم ثلاث تواريخ مختلفة، وكلها غير صحيحة.


لماذا تبدو الإجابات خاطئة وبثقة؟ يقترح الباحثون أن جزءًا من السبب يعود إلى طريقة التدريب الأولية التي تضع التركيز على توقع الكلمة التالية بدقة، من دون توفير تسميات صريحة للصواب أو الخطأ في العبارات التدريبية. بعبارة أخرى، النموذج يتعلّم على أمثلة إيجابية فقط من اللغة السلسة، ويُحاول تقريب التوزيع الكلي للغة. النماذج تتخلص من أخطاء الأنماط المستقرة مثل الإملاء واستخدام الأقواس مع زيادة السعة، لكن الحقائق النادرة أو العشوائية (مثل تاريخ ميلاد حيوان أليف) لا يمكن استنتاجها من أنماط اللغة وحدها، فتولد هلوسات.


تقترح الورقة اعتماد آلية تقييم تُقدّم عقابًا أكبر على الأخطاء الواثقة ومنح درجات جزئية للتعبير المناسب عن عدم اليقين، على غرار اختباراتٍ تطرح خصمًا على الإجابات الخاطئة أو تمنح نقاطًا جزئية لمن يترك السؤال بلا إجابة ليقلّل التخمين الأعمى. ولا يكفي إضافة اختبارات قليلة تراعي عدم اليقين على الهامش؛ بل يجب تحديث معايير التقييم الشائعة المعتمدة على الدقّة بحيث تُثني عن التخمين وتُكافئ الأمانة المعرفية.


الخلاصة: طالما كانت لوحات النتائج الأساسية تكافئ التخمين المحظوظ، ستظل النماذج تتعلّم التخمين—وعليه فإن تعديل قواعد التقييم لإعطاء الأفضلية للتعبير الصحيح عن الشك والحد من الأخطاء الواثقة قد يخفض نسبة الهلوسات، لكن القضاء التام عليها يبدو غير ممكن.


  تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على منصة إكس (تويتر سابقاً) ، للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية.

ليست هناك تعليقات:

إرسال تعليق