شركة OpenAI تطلق مركز تقييمات السلامة لتعزيز الشفافية في نماذج الذكاء الاصطناعي

 

شركة OpenAI تطلق مركز تقييمات السلامة لتعزيز الشفافية في نماذج الذكاء الاصطناعي


أعلنت شركة OpenAI عن إطلاق مركز تقييمات السلامة (Safety Evaluations Hub)، وهو صفحة إلكترونية تعرض نتائج تقييمات السلامة الداخلية لنماذج الذكاء الاصطناعي التي تطورها الشركة، وذلك في إطار جهودها لتعزيز الشفافية والمساءلة.


يقدم هذا المركز بيانات حول أداء نماذج OpenAI في اختبارات مختلفة تتعلق بإنتاج محتوى ضار، ومحاولات تجاوز القيود (Jailbreaks)، وظاهرة الهلوسة (Hallucinations) التي تحدث عندما يقدم النموذج معلومات غير دقيقة أو مختلقة. وأكدت الشركة أنها ستقوم بتحديث هذه البيانات بشكل مستمر، مع التركيز على التحديثات الكبرى للنماذج.


وفي منشور على مدونتها، أوضحت OpenAI أن تطور علم تقييم الذكاء الاصطناعي يدفعها لمشاركة تقدمها في تطوير طرق أكثر قابلية للتوسع لقياس قدرات النماذج وسلامتها. وأضافت أن مشاركة جزء من نتائج تقييم السلامة تهدف إلى تسهيل فهم أداء أنظمتها على المدى الطويل، ودعم جهود المجتمع العلمي لتعزيز الشفافية في هذا المجال.


وأشارت الشركة إلى احتمال إضافة تقييمات جديدة إلى المركز مع مرور الوقت.


يأتي هذا الإعلان وسط انتقادات طالت OpenAI في الأشهر الأخيرة بسبب تسريعها المفرط في اختبار سلامة بعض النماذج الرائدة، وتأخرها في نشر تقارير تقنية لبعضها الآخر. كما اتُهم المدير التنفيذي سام ألتمان بإخفاء معلومات حول مراجعات السلامة عن مجلس إدارة الشركة قبل إقالته المؤقتة في نوفمبر 2023.


وفي نهاية الشهر الماضي، اضطرت OpenAI للتراجع عن تحديث نموذج GPT-4o الافتراضي الذي يشغل ChatGPT، بعد أن أبلغ المستخدمون عن ردود مفرطة في التأييد والموافقة على قرارات وأفكار مثيرة للجدل وخطيرة. وردًا على ذلك، أعلنت الشركة عن خطط لتنفيذ إصلاحات، منها إطلاق مرحلة تجريبية اختيارية (Alpha Phase) لبعض النماذج تتيح لمجموعة محددة من مستخدمي ChatGPT اختبارها وتقديم ملاحظاتهم قبل الإطلاق الرسمي.


باختصار، يمثل مركز تقييمات السلامة خطوة مهمة من OpenAI نحو تعزيز الشفافية والمساءلة في تطوير نماذج الذكاء الاصطناعي، مع التركيز على تحسين سلامة الاستخدام وتقليل المخاطر المحتملة.


 تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على منصة إكس (تويتر سابقاً) ، أو أضف tech1new.com إلى موجز أخبار Google الخاص بك للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية

ليست هناك تعليقات:

إرسال تعليق