إنقاذ 18 عاملًا في منجم ذهب بكولومبيا    "حامد الغامدي"اتحادياً حتى 2030    الأسهم الأمريكية تغلق على تباين    مقتل ثلاثة أشخاص في انفجار بمركز تدريب للشرطة في لوس أنجلوس    حرائق الغابات في كندا أتت هذا العام على مساحة بحجم كرواتيا    تراجع أسعار النفط    البرازيلي "شاموسكا" مدرباً للتعاون مجدداً    أمير الشرقية يدشّن المخطط العام لمطار الملك فهد الدولي... الأحد    إدارة "النصر"تعيّن البرتغالي"خوسيه سيميدو"رئسياً تنفيذياً    النصر: تعيين البرتغالي سيميدو رئيسًا تنفيذيًا مكلّفًا    القبض على (3) أشخاص في القصيم لترويجهم مواد مخدرة    أرقام رائعة تُميز ديفيد هانكو مدافع النصر المُنتظر    الهلال يدخل سباق التعاقد مع مهاجم نيوكاسل    للمسؤول … طريق لزمة – الوهابة في انتظار كاميرات ساهر والإنارة    توزيع (3.255) سلة غذائية في عدة مناطق بباكستان    "وِرث" و"السودة للتطوير" تطلقان برنامجًا تدريبيًّا لفن القط العسيري    2000 ريال تكلفة كتابة السيرة الذاتية للباحثين عن عمل    1.9 مليون مصلٍ بالروضة الشريفة وأكثر من 3.4 مليون زائر للنبي صلى الله عليه وسلم    المعيقلي: «لا حول ولا قوة إلا بالله» كنز من كنوز الجنة    حسين آل الشيخ: النميمة تفسد الإخاء وتورث العداوة    حساد المتنبي وشاعريته    حملات إعلامية بين «كيد النساء» و«تبعية الأطفال»    ميراث المدينة الأولى    أبعاد الاستشراق المختص بالإسلاميات هامشية مزدوجة    رياح نشطة وطقس حار على معظم مناطق المملكة    "هيئة الطرق": الباحة أرض الضباب.. رحلة صيفية ساحرة تعانق الغيوم عبر شبكة طرق متطورة    الجبل الأسود في جازان.. قمم تعانق الضباب وتجذب الزوار بأجوائها الرائعة    إنقاذ مريضة تسعينية بتقنية متقدمة في مركز صحة القلب بمدينة الملك سعود الطبية    جراحة تنهي معاناة مريضة من آلام مزمنة في الوجه والبلع استمرت لسنوات ب"سعود الطبية"    تجمع مكة الصحي يفعّل خدمة فحص ما قبل الزواج بمركز صحي العوالي    القادسية يُعلن رحيل أوباميانغ    مهند شبير يحول شغفه بالعسل إلى علامة سعودية    معادلة عكسية في زيارة الفعاليات بين الإناث والذكور    انطلاق أول تدريبات ⁧‫قدم الدانة‬⁩ للموسم الكروي المقبل    اختتام أعمال الإجتماع الأول للجان الفرعية ببرنامج الجبيل مدينة صحية    خارطة لزيادة الاهتمام بالكاريكاتير    السعودية: نرفض كافة التدخلات الخارجية في سوريا    جامعة الإمام عبد الرحمن تختتم فعاليات برنامج موهبة الإثرائي الأكاديمي    (إثراء) يعلن عن فوز 4 فرق في المنافسة الوطنية لسباق STEM السعودية    برنامج تطوير الثروة الحيوانية والسمكية يعلن توطين تقنية «فيچ قارد»    المملكة تعزي العراق قيادة وحكومة وشعبًا في ضحايا «حريق الكوت»    تعليم الطائف يختتم فعاليات برنامج موهبة الإثرائي الأكاديمي لأكثر من 200 طالب وطالبة    صدور بيان عن السعودية و 10 دول حول تطورات الأحداث في سوريا    أمير منطقة جازان يستقبل وكيل الإمارة والوكلاء المساعدين الجدد    المدينة المنورة تبرز ريادتها في المنتدى السياسي 2025    الأولى عالميا.. التخصصي يزرع جهاز دعم بطيني مزدوج بمساعدة الروبوت    تنفيذ حكم القتل تعزيرًا بقاتل الدكتور عبد الملك بكر قاضي    وزارة الحج والعمرة تكرم عمر بالبيد    المفتي يستعرض أعمال "الإفتاء" ومشاريع "ترابط"    20 قتيلاً.. وتصعيد إنساني خطير في غزة.. مجزرة إسرائيلية في خان يونس    ضبط 275 كجم مخدرات والإطاحة ب11 مروجاً    د. باجبير يتلقى التعازي في وفاة ابنة شقيقه    " الأمن العام" يعرف بخطوات إصدار شهادة خلو سوابق    بوتين لا ينوي وقف الحرب.. روسيا تواصل استهداف مدن أوكرانيا    نيابة عن أمير عسير محافظ طريب يكرم (38) متفوقًا ومتفوقة بالدورة (14) في محافظة طريب    أمير تبوك يطمئن على صحة الشيخ عون أبو طقيقه    عزت رئيس نيجيريا في وفاة الرئيس السابق محمد بخاري.. القيادة تهنئ رئيس فرنسا بذكرى اليوم الوطني لبلاده    نائب أمير الرياض يؤدي صلاة الميت على الشثري    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



نماذج OpenAI بهلوسة غير مسبوقة
نشر في الوطن يوم 20 - 04 - 2025

أطلقت شركة OpenAI مؤخرًا نماذجها الجديدة المسماة o3 وo4-mini، ضمن ما يعرف بنماذج الاستدلال، والتي وُصفت بأنها تمثل تطورًا كبيرًا في قدراتها الحسابية، خصوصًا في مجالات البرمجة والرياضيات. لكن المفارقة أن هذه النماذج تعاني من مشكلة قديمة تتفاقم: الهلوسة.
الهلوسة في الذكاء الاصطناعي تعني أن يُنتج النموذج معلومات خاطئة تبدو مقنعة، وقد كانت مشكلة مستمرة في جميع النماذج السابقة، إلا أن المقلق في النماذج الجديدة أنها تُظهر معدلات أعلى من الهلوسة مقارنة بنماذج OpenAI الأقدم مثل o1 وGPT-4o.
في اختبارات داخلية، تبين أن نموذج o3 يهلوس في نحو 33 % من إجابات اختبار PersonQA، وهو معيار داخلي لقياس دقة النموذج في المعلومات المتعلقة بالأشخاص، وهي نسبة تقارب ضعف ما سجله o1 وo3-mini. أما o4-mini فكانت نتائجه أسوأ، حيث بلغت نسبة الهلوسة 48 %.
ولعل الأمر الأكثر إثارة للقلق هو أن OpenAI نفسها لا تعرف حتى الآن السبب الدقيق لزيادة هذه المشكلة، وصرحت في تقاريرها بأن الأمر يحتاج إلى مزيد من البحث لفهم العلاقة بين توسيع نطاق النماذج وزيادة معدلات الهلوسة، وفقًا ل«تك كرانش».
مؤسسة الأبحاث Transluce لاحظت أيضًا أن نموذج o3 لا يكتفي بالمعلومات الخاطئة، بل قد «يختلق سيناريوهات»، كادعائه تشغيل كود برمجي على جهاز MacBook Pro رغم عدم امتلاكه القدرة على ذلك، مما يثير تساؤلات حول حدود مصداقية النموذج.
ورغم هذه المشكلات، فإن بعض الخبراء، مثل كيان كاتانفوروش من جامعة ستانفورد، يرون أن الأداء البرمجي العالي لo3 يجعله منافسًا قويًا، لكنه لا يزال يقع في أخطاء مثل تقديم روابط وهمية أو غير فعالة.
وفي ظل تزايد اعتماد الشركات على نماذج الذكاء الاصطناعي، تصبح دقة المخرجات أمرًا أساسيًا لا يمكن التهاون فيه، خاصة في مجالات حساسة مثل القانون أو الطب. من هنا، يُطرح أحد الحلول المحتملة: دمج النماذج مع إمكانيات البحث الحي عبر الإنترنت، كما هو الحال في نموذج GPT-4o، الذي أظهر دقة بلغت 90 % في اختبار SimpleQA.
في النهاية، يبقى الاستدلال أداة واعدة، لكنه يحمل في طياته تحديات حقيقية، وعلى رأسها الهلوسة. ويبدو أن OpenAI، ومعها المجتمع البحثي، أمام مفترق طرق: إما السيطرة على هذه الظاهرة، أو مواجهة تباطؤ في اعتماد هذه النماذج في تطبيقات الحياة الواقعية.


انقر هنا لقراءة الخبر من مصدره.