سعورس : نماذج OpenAI بهلوسة غير مسبوقة

النائب الأول لرئيس مجلس إدارة غرفة جدة يدشن النسخة الرابعة عشرة من معرض جدة الدولي للسفر والسياحة الأسهم الأمريكية تغلق على انخفاض الجنيه الإسترليني ينخفض مقابل الدولار الأمريكي ويرتفع مقابل اليورو نيوم يتغلّب على ضمك بثلاثية في دوري روشن للمحترفين الأمير عبدالعزيز بن سعد يزور مقر الفعاليات المصاحبة لرالي باها حائل الدولي 2026 وزارة الداخلية تشارك في المعرض الأمني المصاحب للتمرين التعبوي "أمن الخليج العربي 4" بدولة قطر فليك : برشلونة سيقاتل للفوز بكل الألقاب النصر يتجاوز الخلود بثلاثية إمام عاشور يعتذر للأهلي المصري وجماهيره المملكة توزّع (200) حقيبة إيوائية على الأسر النازحة في حلب القبض على شخص في عسير لترويجه (7) كجم "قات" النصر يتغلب على الخلود بثلاثية في دوري روشن للمحترفين بحضور محمد العبار.. "جوائز دبي مول العالمية للموضة" تتوج أيقونات العالم ورواد الإبداع عندما تأتأ الثبيتي وهو يتهجى النصر يستغل تعثرات الهلال بثلاثية أمام الخلود الذهب يخسر 12% والفضة تهوي 30% جدة تحتضن المؤتمر السعودي الأول لأمراض النساء والخصوبة (GFS) قائد القوات الجوية السعودية يزور جمهورية كوريا بالصور مدير مستشفى بيش العام يرعى الحفل الختامي لعام 2025م ويكرّم المتميزين في الجودة وتجربة المريض منسوبو مستشفى السليل يقيمون حفل تكريم للمدير السابق آل شريدة المملكة ترحب باتفاق وقف إطلاق النار بين الحكومة السورية و«قسد» الشيخ بندر بليلة: علاج القلوب في كتاب الله وسنة رسوله الشيخ عبدالباري الثبيتي: الوظيفة أمانة وعبادة بالإتقان والصدق رد الاتحاد على رغبة انتر ميلان في ضم موسى ديابي من ذاكرة جازان: د. علي عواجي العريشي قسم الإعلام بجامعة الملك سعود يشارك في المنتدى السعودي للإعلام ومعرض فومكس 2026 افتتاح بينالي الدرعية للفن المعاصر 2026 جامعة حائل تقدم منظومة معرفية ومجتمعية متكاملة وصيفة العروس تقليد غربي يقتحم أعراسنا وزير الدفاع يلتقي وزيري الخارجية والحرب لدى الولايات المتحدة الأمريكية والمبعوث الأمريكي الخاص للشرق الأوسط نائب أمير جازان يلتقي مشايخ وأهالي محافظة العيدابي نائب أمير جازان يشهد حفل أهالي العيدابي بمناسبة إطلاق "معرض عسل جازان 2026" وكيل وزارة الداخلية يرأس اجتماع وكلاء إمارات المناطق ال(60) أضخم عملية تطهير عرقي في الضفة الأمن العام يتيح خدمات البنادق الهوائية إلكترونيًا عبر «أبشر» الراكة.. مدينة تحت الرمل هدية الشتاء لجسمك إنطلاق الدورة العلمية الثانية لأئمة الحرمين الشريفين تزامنًا مع الخطة التشغيلية لشهر رمضان ١٤٤٧ه نائب أمير تبوك يستقبل قائد حرس الحدود بالمنطقة «التعليم» تمنع منسوبيها من استخدام صفاتهم الوظيفية في المنصات الرقمية وتُلغي مسمّى «المتحدث الرسمي» في إدارات التعليم "هداية" تحتفي بإنجازاتها لعام 2025 وتوقّع شراكات مجتمعية جمعية "نبأ" تُكرم "73" حافظة للقرآن الكريم خلال عام 2025 في خميس مشيط وزير البيئة الأوزبكي يزور المركز الوطني للأرصاد ويطّلع على تجارب المملكة في مجالات الأرصاد "تعليم جازان" يحصد 22 جائزة في معرض إبداع للعلوم والهندسة الوعي والإدراك نفتقد قلم الإبينفرين زيلينسكي يبدي استعداده للقاء بوتين.. الأراضي وزابوروجيا تعرقلان مسار السلام لا تزال قيد الدراسة.. 3 خيارات للجيش الإسرائيلي لإخضاع حماس بحثا مستقبل القوات الروسية بسوريا.. بوتين للشرع: وحدة سوريا أولوية ومستعدون لدعم دمشق دوريات الأفواج الأمنية بمنطقة جازان تُحبط تهريب (268) كيلو جرامًا من نبات القات المخدر ما هو مضيق هرمز ولماذا هو مهم جداً للنفط؟ سمو وزير الدفاع يلتقي وزير الدفاع بدولة الكويت المبرور إنفاذاً لتوجيهات خادم الحرمين وولي العهد.. وصول ثلاثة توائم ملتصقة إلى الرياض نحن شعب طويق متقاعدو قوز الجعافرة ينظّمون أمسية ثقافية ورياضية على كورنيش جازان

شكرا على الإبلاغ!

سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.

نماذج OpenAI بهلوسة غير مسبوقة

الوطن نشر في الوطن يوم 20 - 04 - 2025

أطلقت شركة OpenAI مؤخرًا نماذجها الجديدة المسماة o3 وo4-mini، ضمن ما يعرف بنماذج الاستدلال، والتي وُصفت بأنها تمثل تطورًا كبيرًا في قدراتها الحسابية، خصوصًا في مجالات البرمجة والرياضيات. لكن المفارقة أن هذه النماذج تعاني من مشكلة قديمة تتفاقم: الهلوسة.
الهلوسة في الذكاء الاصطناعي تعني أن يُنتج النموذج معلومات خاطئة تبدو مقنعة، وقد كانت مشكلة مستمرة في جميع النماذج السابقة، إلا أن المقلق في النماذج الجديدة أنها تُظهر معدلات أعلى من الهلوسة مقارنة بنماذج OpenAI الأقدم مثل o1 وGPT-4o.
في اختبارات داخلية، تبين أن نموذج o3 يهلوس في نحو 33 % من إجابات اختبار PersonQA، وهو معيار داخلي لقياس دقة النموذج في المعلومات المتعلقة بالأشخاص، وهي نسبة تقارب ضعف ما سجله o1 وo3-mini. أما o4-mini فكانت نتائجه أسوأ، حيث بلغت نسبة الهلوسة 48 %.
ولعل الأمر الأكثر إثارة للقلق هو أن OpenAI نفسها لا تعرف حتى الآن السبب الدقيق لزيادة هذه المشكلة، وصرحت في تقاريرها بأن الأمر يحتاج إلى مزيد من البحث لفهم العلاقة بين توسيع نطاق النماذج وزيادة معدلات الهلوسة، وفقًا ل«تك كرانش».
مؤسسة الأبحاث Transluce لاحظت أيضًا أن نموذج o3 لا يكتفي بالمعلومات الخاطئة، بل قد «يختلق سيناريوهات»، كادعائه تشغيل كود برمجي على جهاز MacBook Pro رغم عدم امتلاكه القدرة على ذلك، مما يثير تساؤلات حول حدود مصداقية النموذج.
ورغم هذه المشكلات، فإن بعض الخبراء، مثل كيان كاتانفوروش من جامعة ستانفورد، يرون أن الأداء البرمجي العالي لo3 يجعله منافسًا قويًا، لكنه لا يزال يقع في أخطاء مثل تقديم روابط وهمية أو غير فعالة.
وفي ظل تزايد اعتماد الشركات على نماذج الذكاء الاصطناعي، تصبح دقة المخرجات أمرًا أساسيًا لا يمكن التهاون فيه، خاصة في مجالات حساسة مثل القانون أو الطب. من هنا، يُطرح أحد الحلول المحتملة: دمج النماذج مع إمكانيات البحث الحي عبر الإنترنت، كما هو الحال في نموذج GPT-4o، الذي أظهر دقة بلغت 90 % في اختبار SimpleQA.
في النهاية، يبقى الاستدلال أداة واعدة، لكنه يحمل في طياته تحديات حقيقية، وعلى رأسها الهلوسة. ويبدو أن OpenAI، ومعها المجتمع البحثي، أمام مفترق طرق: إما السيطرة على هذه الظاهرة، أو مواجهة تباطؤ في اعتماد هذه النماذج في تطبيقات الحياة الواقعية.

انقر هنا لقراءة الخبر من مصدره.