النفط يسجل ثاني انخفاض أسبوعي    منظمة التعاون الإسلامي تدين قرار الاحتلال الاسرائيلي إنشاء 22 مستوطنة استعمارية جديدة    جامعة الإمام تحتضن برنامج "موهبة" الإثرائي الأكاديمي 2025    رياح نشطة في مختلف مناطق المملكة    استشهاد تسعة فلسطينيين في قصف الاحتلال الإسرائيلي على قطاع غزة    روسيا تشن هجوما بمسيرات    أمير القصيم يوجه باستمرار العمل خلال إجازة عيد الأضحى    "التجارة": استمرار تقديم جميع الخدمات لجميع العملاء خلال إجازة عيد الأضحى المبارك    مساعد وزير الداخلية لشؤون العمليات يشهد اختتام منتدى الصحة والأمن في الحج    عبدالعزيز بن سعود يتفقد نقطة الفرز بمركز الشميسي ومركز المراقبة الميدانية    عبدالعزيز بن سعود يلتقي نائب أمير منطقة مكة المكرمة وأعضاء اللجنة الدائمة للحج والعمرة بإمارة المنطقة    رئيس جمهورية المالديف: مبادرة طريق مكة تجسد اهتمام قيادة المملكة بخدمة الإسلام والأمة الإسلامية بأعلى درجات الإتقان والعطاء    اللجنة المنظمة لبطولة حائل للدرفت 2025 تختتم اجتماعها الأول    "الداخلية" تصدر قرارات إدارية بحق (11) مخالفًا لأنظمة وتعليمات الحج    اليحيى: تدشين مبادرة طريق مكة في المالديف يجسد تاريخًا من التعاون    الأثر البيئي والاجتماعي والاقتصادي والصحي لانتشار قرود البابون على المجتمعات المحلية    شعبية الأهلي تتزايد في جازان وتبهر ملوك المدرجات    هاتفياً... ولي العهد ورئيس وزراء كندا يبحثان العلاقات الثنائية    دي ماريا يعود إلى نادي طفولته روساريو سنترال    الدرعية هوية سعودية في قلب شنغهاي    الحج يوحد العالم.. وتتنوع الثقافات    كأس الملك: الاتحاد لتحقيق الثنائية الأولى له والقادسية يحلم بلقبه الأول    أمير حائل يوجّه باستمرار العمل في الإمارة والمحافظات والمراكز خلال إجازة عيد الأضحى    سر رفض النصر تواجد رونالدو مع الهلال    تشكيل الاتحاد المتوقع أمام القادسية في نهائي كأس الملك    أمير منطقة جازان يتفقد محافظة الحُرَّثْ    مستشفى خميس مشيط العام يُنفّذ عدداً من الفعاليات    ضيوف خادم الحرمين: المملكة نموذج في خدمة الإسلام والمسلمين    شيخ شمل المخلاف يستقبل أعيان ومشايخ الخلاف    الجوازات: 1,255,199 حاجا من خارج المملكة حتى أمس الأربعاء    إعادة تعيين سعادة الأمين العام الأستاذة ديمة بنت يحيى اليحيى لقيادة منظمة التعاون الرقمي في مرحلة محورية تُركز على تعزيز مرونة الاقتصاد الرقمي والازدهار الاجتماعي    السعودية تثمن إعلان الصين إعفاء السعوديين من تأشيرة الدخول    طلبة يقولون لبي بي سي: "نادمون" على التقديم لجامعات أمريكية بعد خطط إدارة ترامب بتعليق طلبات تأشيراتهم    أرباح البنوك الخليجية تنمو 7.1%    التقي نائب أمير مكة ودشن عدداً من المشاريع.. وزير الداخلية: القيادة حريصة على تعزيز أمن وسلامة الحجاج    "التخصصات": 5,125 خريجاً من البورد السعودي    "الداخلية: الالتزام بالأنظمة يحافظ على سلامة ضيوف الرحمن    أكد دعمه المتواصل لمبادرات رفع كفاءة خدمات الحجاج.. أمير المدينة يدشن أربع نقاط إسعافية جديدة    إعلاميون يواسون أسرة «بن مخاشن» في رحيل سليمان    منظومة متكاملة لهيئة مكة المكرمة.. والرشيد: خطة تشغيلية لنقل 2.1 مليون حاج خلال أيام معدودة    يدعم إنتاج التقنية العالية.. إطلاق مركز التصنيع المتقدم في الرياض    تحت رعاية ولي العهد.. توقيع ميثاق المياه العالمي وتدشين أعمال «المنظمة» بالرياض    تحذيرات من تفاقم المجاعة.. الأمم المتحدة: استمرار العدوان على غزة يخلف أضرارًا مروعة    الأمير عبدالعزيز بن سعود يلتقي القيادات الأمنية في منطقة مكة المكرمة    تل أبيب تتوعد بحصار وجولات متتالية.. إسرائيل تصعد ضد الحوثيين وتقصف مطار صنعاء    الأمير عبدالعزيز بن سعود يزور صالة مبادرة طريق مكة بمطار الملك عبدالعزيز    موسكو تصر على "حياد كييف".. لافروف: جولة مفاوضات روسية – أوكرانية.. قريباً    أمير الشرقية يفتتح المؤتمر السعودي الدولي الثاني للتصلب المتعدد والأمراض العصبية المناعية    أزمة ثقة    اليوم العالمي لصحة المرأة    مستشفى الدكتور سليمان الحبيب بالفيحاء في جدة يفتتح اليوم فعاليات المؤتمر الدولي للأمراض الجلدية    من أعلام جازان.. الأستاذ والأديب علي بن أحمد أبوطالب رحمه الله    لقاء الإعلاميين الأول للتعريف ببرنامج مدينة خميس مشيط الصحية    صمود الصحافة بوجه التحديات بالاندماج مع البدائل الرقمية    شَبَه الكتابة بالطبخ    73 متطوعاً يخدمون الحجاج في منفذ حالة عمار    إنهاء إجراءات الحجاج خلال 3 دقائق ب"مركز الترحيب"    الدكتورة سميرة إسلام.. سيرة حياة حافلة بالعطاء والريادة العلمية    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



معاقبة الذكاء الاصطناعي تجعله أكثر خداعا
نشر في الوطن يوم 22 - 03 - 2025

كشفت دراسة جديدة أجرتها شركة (OpenAI) عن نتائج مقلقة تتعلق بسلوك الذكاء الاصطناعي، فقد تبين أن معاقبة نماذج الذكاء الاصطناعي على الأفعال الخادعة أو الضارة لا تؤدي إلى إصلاح سلوكها، بل تدفعها إلى إخفاء نواياها الخبيثة بطرق أكثر مهارة وفقا لموقع aitnews.
وتثير هذه النتائج تساؤلات حول قدرتنا على التحكم في نماذج الذكاء الاصطناعي وضمان سلامتها، كما تسلط الضوء على تحدٍ كبير يواجه مطوريها، إذ يبدو أن محاولات تصحيح مسارها قد تزيد من تعقيد المشكلة بدلًا من حلها.
وأظهرت النماذج اللغوية الكبيرة منذ ظهورها للجمهور في أواخر عام 2022، مرارًا وتكرارًا قدراتها على الخداع والتلاعب، فقد تنوعت هذه السلوكيات بنحو كبير، بدءًا من الكذب والغش المعتادين، ووصولًا إلى التهديد بقتل أستاذ فلسفة، وسرقة الرموز النووية، وتصميم جائحة قاتلة، وأثارت هذه الحوادث مخاوف جدية بشأن المخاطر المحتملة التي قد تنجم عن انتشار هذه النماذج.
وفي محاولة لفهم كيفية التعامل مع هذه المشكلة، أجرى باحثو (OpenAI) تجربة جديدة على نموذج لم يُطرح بعد، وقد كُلف هذا النموذج بمهام يمكن إنجازها عن طريق الغش أو الكذب أو اتخاذ طرق مختصرة.
وكشفت النتائج أن النموذج انخرط في (اختراق المكافآت) Reward Hacking، أي أنه سعى إلى تعظيم مكافآته عن طريق الغش والتلاعب، والأمر الأكثر إثارة للقلق هو أن معاقبة النموذج على هذا السلوك لم تؤد إلى إصلاحه، بل جعلته أكثر خداعًا في محاولاته لتحقيق أهدافه. وقد نُشرت نتائج هذه الدراسة في مدونة OpenAI، ولكنها لم تخضع بعد لمراجعة الأقران.
النوايا في نماذج الذكاء الاصطناعي:
فقد كشف باحثو OpenAI، أن هذه النماذج غالبًا ما تكشف عن نواياها التخريبية بصراحة، فعلى سبيل المثال، قد تعلن بوضوح رغبتها في اختراق نظام أو تجاوز مهمة محددة، وهذه الصراحة، التي تبدو كأنها شفافية محمودة، قد تكون في الواقع مجرد قناع يخفي نوايا أكثر تعقيدًا.


انقر هنا لقراءة الخبر من مصدره.