كنو: سعيد بتسجيل هدف الفوز على فلسطين وهدفنا تحقيق كأس العرب    الأدب وذاكرة التاريخ    قلم وشمعة وإدارة    المرونة والثقة تحرك القطاع الخاص خلال 10 سنوات    أسبوع الفرص والمخاطر للسوق السعودي    معرض جدة للكتاب 2025 يسجل إقبالا كبيرا في يومه الأول    الجريمة والعنف والهجرة تتصدر مخاوف العالم في 2025    السعودية تتفوق على فلسطين وتتأهل لنصف نهائي كأس العرب    العمل التطوعي.. عقود من المشاركة المجتمعية    القبض على 7 إثيوبيين في عسير لتهريبهم (140) كجم "قات"    نائب أمير الرياض يعزي أبناء علي بن عبدالرحمن البرغش في وفاة والدهم    المملكة.. مظلة سياسية واقتصادية واجتماعية مكنت سورية من مواجهة التحديات    مشروعات نفطية عالمية ب25 مليون برميل يومياً لتوازن السوق    مدينون للمرأة بحياتنا كلها    المغرب لنصف نهائي كأس العرب    بلجيكا: الأصول الروسية المجمدة ستستخدم لتمويل قرض لأوكرانيا    بيلينجهام يثق في قدرة ألونسو وريال مدريد على التعافي رغم الضغوط    كتاب جدة يستهل ندواته الحوارية بالفلسفة للجميع    انطلاق أكبر هاكاثون في العالم    نائب وزير البيئة يترأس الاجتماع التشاوري لوزراء البيئة العرب ويعقد لقاءات ثنائية    وفاة طفلة رضيعة في غزة بسبب البرد الشديد    القصبي يشرف مهرجان المونودراما بالدمام.. وتتويج عشرة فائزين في ليلة مسرحية لافتة    نائب أمير جازان يستقبل الدكتور الملا    خوجة في مكة يستعرض تاريخ الصحافة السعودية ومستقبلها الرقمي    يوم الجبال الدولي مشاركة واسعة لإبراز جمال تضاريس السعودية    القيادة تهنئ رئيس بوركينا فاسو بذكرى يوم الجمهورية لبلاده    روضة إكرام تختتم دورتها النسائية المتخصصة بالأحكام الشرعية لإجراءات الجنائز    45 ركنًا تستعرض خيرات حفر الباطن في مهرجان المنتجات الزراعية    رئيس الخلود: صلاح غير مناسب لدوري روشن    برعاية محافظ صبيا المكلف"برّ العالية" تُدشّن مشروع قوارب الصيد لتمكين الأسر المنتجة    طرق ذكية لاستخدام ChatGPT    ريما مسمار: المخرجات السعوديات مبدعات    فعاليات ترفيهية لذوي الإعاقة بمزرعة غيم    ممدوح بن طلال.. إرثٌ لا يرحل    مهرجان البحر الأحمر.. برنامج الأفلام الطويلة    أمير المدينة المنورة يستقبل تنفيذي حقوق الإنسان في منظمة التعاون الإسلامي    استضعاف المرأة    مستشفى الملك فهد الجامعي يعزّز التأهيل السمعي للبالغين    «طبية الداخلية» تقيم ورشتي عمل حول الرعاية الصحية    تطعيم بلا بروتين بيض    في ختام مجموعات كأس الخليج تحت 23 عاماً.. الأخضر يواجه نظيره القطري للصدارة    اتفاقيات مليارية لدعم القطاعات التنموية    القيادة تعزّي ملك المغرب في ضحايا انهيار مبنيين متجاورين في مدينة فاس    غرفة إسكندراني تعج بالمحبين    «مسألة حياة أو موت».. كوميديا رومانسية مختلفة    بيروت تؤكد سيادتها واستقلال قرارها الداخلي.. رفض لبناني رسمي لدعوة إيران    أمير الشرقية يسلّم اعتماد "حياك" لجمعية «بناء»    زواج يوسف    الأرض على موعد مع شهب التوأميات    في ذمة الله    ضغوط أمريكية لتنفيذ المرحلة الثانية.. واشنطن تلزم تل أبيب بالتقدم في اتفاق غزة    احتيال إلكتروني يحرر سجيناً في بريطانيا    في سادس جولات اليورباليج.. مواجهة حاسمة بين سيلتيك غلاسكو وروما    دراسة تكشف دور «الحب» في الحماية من السمنة    استئصال البروستاتا بتقنية الهوليب لمريض سبعيني في الخبر دون شق جراحي    ضمن المشاريع الإستراتيجية لتعزيز الجاهزية القتالية للقوات الملكية.. ولي العهد يرعى حفل افتتاح مرافق قاعدة الملك سلمان الجوية    طيور مائية    ولي العهد يفتتح مرافق قاعدة الملك سلمان الجوية    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



مؤشر إنتاجية الذكاء الاصطناعي

أبهرنا الذكاء الاصطناعي في السنوات الأخيرة بقدراته الفائقة حتى بدأنا نرى أثرها على سوق العمل، كل ذلك نتيجة العناوين الكبيرة: نموذج يتفوق في اختبار المحاماة المعياري، وآخر يهزم بطل العالم في الشطرنج. كل ما سبق رائع، لكن هل تكفي هذه القدرات لاستبدال الموظفين، وهل يستطيع النموذج صياغة عقد، أو تقييم صفقة استحواذ، أو تشخيص حالة مرضية؟
استجابة للفجوات التي شعر بها عدد من الاقتصاديين والمختصين لوضع النماذج على المحك، صدر هذا العام مؤشر إنتاجية الذكاء الاصطناعي (APEX). يحاول هذا المؤشر أن ينتقل من اختبارات التجريد والقدرات النظرية إلى واقع العمل المهني، ليجيب عن أسئلة أعمق من قدرة النموذج على استرجاع المعلومات ووضعها في سياق جديد، إنما عن قدرته ليؤدي مهاما دقيقة في القانون والتمويل والاستشارات والطب. ونتيجة لذلك يحاول المؤشر أن يجيب عن تحدي حساب قيمة ساعات عمل الذكاء الاصطناعي مقارنة بساعات عمل المختصين في مختلف المهن.
يجمع المؤشر بين البساطة والصرامة. فقد صمم المؤشر خبراء في أربعة مجالات: المصرفية الاستثمارية، الاستشارات الإدارية، المحاماة، والرعاية الطبية الأولية. تضم هذه المجالات مئتي مهمة واقعية تحاكي ما يقوم به المحترفون يوميا. كل مهمة مدعومة بوثائق أساسية: جداول بيانات، مذكرات، ملفات مساندة، إضافة إلى معايير تقييم تفصيلية. لا يحكم على النماذج بذكائها الظاهري، بل وفق استيفائها لعشرات المعايير الدقيقة: تماسك نموذج التقييم المالي، عمق المذكرة القانونية في استيعابها للقضايا السابقة، أخذ التاريخ المرضي بكل تشعباته عند تقديم النصيحة الطبية.
عندما طبق المؤشر جاءت نتائج لافتة. فقد حقق تشات (جي بي تي) أفضل نتيجة بنحو 64 في المئة. قد تبدو النتيجة إيجابية، إنما تعني أن النموذج أخفق في ثلث المعايير. المنافسون الآخرون مثل نموذج جيميني تأخر قليلا، بينما حلت النماذج مفتوحة المصدر في ذيل القائمة. كما تفاوت الأداء حسب المجال: القانون أسهل، بينما الطب ظل هو الأصعب بلا منازع. بناء على ذلك، لك الحق في الحذر من نصائح الذكاء الاصطناعي ولو في أمر بسيط كرشحة برد.
تدل نتائج المؤشر أن استبدال العمالة عالية المهارة ليس بالأمر الهين. تستطيع النماذج التعرف على الأنماط، لكنها تعجز عن تحليل السياق أو التعميم فتؤدي إلى أخطاء باهظة الثمن بل كارثية. الأمر الآخر، ليست الإنتاجية مسألة ذكاء فقط، بل مسألة موثوقية واندماج بيئي. المحامي الذي ينجح في 64 في المئة من القضايا فقط هو عبء على المهنة وليس نجما صاعدا.
لا ندري إن كان المؤشر سيصبح معيارا ذهبيا لقياس كفاءة النماذج، فمجالاته محدودة، ومعاييره ليست مثالية، ونظام تقييمه لا يزال في طور التطوير. يكفي أنه هز الثقة بقدرة النماذج على استبدال العاملين قبل أن ندرك ذلك تحت واقع كارثة أو اثنتين.


انقر هنا لقراءة الخبر من مصدره.