إدمان المنصات علامة للنرجسية    ميزات جديدة لحواسب Apple    كواكب تزين السماء الشهر المقبل    8654 طلبا جديدا للنفقة المستقبلية باستقطاع شهري    النوم المتقطع يمرض القلب    مكمل غذائي يبطئ الشيخوخة    6 إرشادات لصحة نفسية جيدة    الأمير عبدالعزيز بن تركي رئيسًا فخريًا للاتحاد الدولي لرفع الأثقال    الجرام ب 49 تريليون إسترليني.. أغلى «مادة» في الكون    قصف متواصل وإعاقة جهود الإنقاذ.. 79 شهيداً فلسطينياً خلال 24 ساعة    "الأسفلت المطاطي" .. ابتكار هندسي لراحة الحجيج    جولة الحسم في ال "بريميرليغ".. صراع أوروبا يشعل اليوم الأخير    تتويج أبطال المملكة في الجولة الماسية للمبارزة    بتواجد ميديا عالمية.. وتيفو تاريخي.. حضور جماهيري قياسي في ليلة تتويج العميد    مبادرة من تقني مكة لصيانة وسائل نقل الحجاج    دعم المنصات بأحدث الأجهزة التقنية .. الجوازات: وصول 890,883 حاجاً عبر المنافذ الدولية إلى السعودية    طائرات "درون" لتعقب مخالفي أنظمة الحج    1140 حالة ضبط في المنافذ الجمركية خلال أسبوع    التوازن بين الطموح والنجاح    رابح صقر يشدو بجلسات "ثنايا في العُلا"    الثقافة تطلق 6 منح لتعزيز الإبداع السعودي    أرامكو: أول بطارية تخزين ب "ميغاواط "    50 موقعًا بالمدينة لإثراء تجارب ضيوف الرحمن    معرض لتوثيق تطور وسائل نقل الحجاج    مدينة الحجاج ب "حالة عمار ".. خدمات جليلة ومتنوعة لضيوف الرحمن    الأمير محمد بن عبدالعزيز يستقبل أهالي جازان المهنئين بتعيينه أميرًا للمنطقة    اجتماع تحضيري برئاسة مشتركة مع فرنسا لتنفيذ حل الدولتين.. السعودية: إنهاء الاحتلال وتأسيس دولة فلسطينية السبيل الوحيد لاستقرار المنطقة    "بيئة مكة" ترفع الجاهزية التشغيلية لحج 1446ه    المخرج يسد فراغ غياب ممثل بمسرحية الأحساء    ختام مهرجان بطولة العالم لخيل الجزيرة في الرياض..    تتويج نادي القادسية ببطولة دوري الدرجة الأولى تحت 18 عاماً    خادم الحرمين يستضيف 1300 حاج وحاجة من 100 دولة    «رابطة» : الموسم المقبل ينطلق في 28 أغسطس    الريادة السعودية    أمير الرياض يرعى حفل الذكرى ال 44 لتأسيس مجلس التعاون    "الجوازات": قدوم 890,883 حاجّاً من خارج المملكة    5 قوى في ديناميكيات سوق تصنيع الأحساء    3 مليارات ريال قيمة القروض التنموية والاستثمارية    1.3 مليون برميل يوميا زيادة الطلب على النفط خلال 2025    دمشق ترحب بتخفيف العقوبات والأولوية لإعادة الإعمار    مجسمات فنية تفتتح معرض "داون تاون ديزاين الرياض"    157 صنفا من المواد المخدرة ضبطت بالمنافذ خلال أسبوع    "القصيم الصحي" يدرب مرافقي "الرعاية المنزلية" على الحالات الطارئة    اللجنة الوزارية العربية تبحث في باريس إنهاء حرب غزة    "الإسلامية" تستقبل حجاج البحرين عبر جسر الملك فهد    الأمير محمد بن عبدالعزيز يصل إلى جازان بعد تعيينه أميرًا للمنطقة    فيصل بن مشعل يرعى تكريم الفائزين بجائزة القصيم للتميز والإبداع    نائب أمير الرياض يعزّي في وفاة محمد أبو نيان    عيادات متنقلة لخدمة ضيوف الرحمن بالجوف    تهنئة إريتريا بذكرى الاستقلال    محمد بن عبدالرحمن.. قيادة هادئة ووقار حاضر    الأحساء تسجل أعلى درجة حرارة في المملكة اليوم ب 49 درجة مئوية    الداخلية: تأشيرات الزيارة باستثناء "تأشيرة الحج" لا تخوّل حاملها أداء فريضة الحج    من آيسف إلى العالم: أنا سعودي، إذًا أنا موجود بفكر لا يُستنسخ    سوريا ترحب بقرار الحكومة الأمريكية القاضي برفع العقوبات عنها    76 ألف وفاة سنويًا بسبب "تسمم الحمل" حول العالم    أمير الرياض يطلع على الأعمال الميدانية والرقابية ل" الأمانة"    القيادة تعزي عضو المجلس الأعلى حاكم عجمان في وفاة حمد النعيمي    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



نماذج OpenAI بهلوسة غير مسبوقة
نشر في الوطن يوم 20 - 04 - 2025

أطلقت شركة OpenAI مؤخرًا نماذجها الجديدة المسماة o3 وo4-mini، ضمن ما يعرف بنماذج الاستدلال، والتي وُصفت بأنها تمثل تطورًا كبيرًا في قدراتها الحسابية، خصوصًا في مجالات البرمجة والرياضيات. لكن المفارقة أن هذه النماذج تعاني من مشكلة قديمة تتفاقم: الهلوسة.
الهلوسة في الذكاء الاصطناعي تعني أن يُنتج النموذج معلومات خاطئة تبدو مقنعة، وقد كانت مشكلة مستمرة في جميع النماذج السابقة، إلا أن المقلق في النماذج الجديدة أنها تُظهر معدلات أعلى من الهلوسة مقارنة بنماذج OpenAI الأقدم مثل o1 وGPT-4o.
في اختبارات داخلية، تبين أن نموذج o3 يهلوس في نحو 33 % من إجابات اختبار PersonQA، وهو معيار داخلي لقياس دقة النموذج في المعلومات المتعلقة بالأشخاص، وهي نسبة تقارب ضعف ما سجله o1 وo3-mini. أما o4-mini فكانت نتائجه أسوأ، حيث بلغت نسبة الهلوسة 48 %.
ولعل الأمر الأكثر إثارة للقلق هو أن OpenAI نفسها لا تعرف حتى الآن السبب الدقيق لزيادة هذه المشكلة، وصرحت في تقاريرها بأن الأمر يحتاج إلى مزيد من البحث لفهم العلاقة بين توسيع نطاق النماذج وزيادة معدلات الهلوسة، وفقًا ل«تك كرانش».
مؤسسة الأبحاث Transluce لاحظت أيضًا أن نموذج o3 لا يكتفي بالمعلومات الخاطئة، بل قد «يختلق سيناريوهات»، كادعائه تشغيل كود برمجي على جهاز MacBook Pro رغم عدم امتلاكه القدرة على ذلك، مما يثير تساؤلات حول حدود مصداقية النموذج.
ورغم هذه المشكلات، فإن بعض الخبراء، مثل كيان كاتانفوروش من جامعة ستانفورد، يرون أن الأداء البرمجي العالي لo3 يجعله منافسًا قويًا، لكنه لا يزال يقع في أخطاء مثل تقديم روابط وهمية أو غير فعالة.
وفي ظل تزايد اعتماد الشركات على نماذج الذكاء الاصطناعي، تصبح دقة المخرجات أمرًا أساسيًا لا يمكن التهاون فيه، خاصة في مجالات حساسة مثل القانون أو الطب. من هنا، يُطرح أحد الحلول المحتملة: دمج النماذج مع إمكانيات البحث الحي عبر الإنترنت، كما هو الحال في نموذج GPT-4o، الذي أظهر دقة بلغت 90 % في اختبار SimpleQA.
في النهاية، يبقى الاستدلال أداة واعدة، لكنه يحمل في طياته تحديات حقيقية، وعلى رأسها الهلوسة. ويبدو أن OpenAI، ومعها المجتمع البحثي، أمام مفترق طرق: إما السيطرة على هذه الظاهرة، أو مواجهة تباطؤ في اعتماد هذه النماذج في تطبيقات الحياة الواقعية.


انقر هنا لقراءة الخبر من مصدره.