الملك سلمان يوجه باستضافة الخليجيين العالقين بمطارات السعودية    الملك يوجه باستضافة كافة العالقين في مطارات المملكة من الأشقاء الخليجيين مواطني دول مجلس التعاون    تحت رعاية ولي العهد.. إحسان تنظم حفل تكريم المحسنين الجمعة القادمة    كيف يمكن أن يؤثر الهجوم على إيران على سوق النفط العالمي والاقتصاد    البحرين: الدفاع الجوي يتصدى لهجمات إيرانية جديدة ولا ضحايا أو مصابين    القيادة المركزية الأميركية: لا خسائر في قواتنا بالمنطقة    إيران تضلل العالم وتستهدف مواقع مدنية في هجماتها على دول الخليج    شباك الخليج تنهي جفاف بيريرا    النصر يعلن إصابة راغد النجار بالرباط الصليبي    مانشستر سيتي يضغط على آرسنال بفوز ثمين في معقل ليدز    حراك استثنائي يرسم خارطة جازان في أسبوع    تفعيل العربات الإسعافية الكهربائية في المدينة    طائرة مسيرة تستهدف مطار الكويت الدولي    وصول الطائرة الإغاثية السعودية ال 82 لإغاثة الشعب الفلسطيني في غزة    حين كانت القرية تكبر في قلوبنا قبل أن تكبر في العمران    الكويت: وقوع إصابات ل 3 من منتسبي القوات المسلحة في القاعدة الجوية    جمعية نالا لفنون السرد تطلق أعمالها ونشاطاتها    ولي العهد والرئيس الفرنسي يبحثان الأوضاع الخطيرة بالمنطقة    الخطوط السعودية: إلغاء عدد من الرحلات لأسباب تتعلق بالسلامة الجوية    *لقاء مفتوح يجمع رجال وسيدات الأعمال في أولى فعاليات "ديوانية غرفة تبوك" بموسمها الثاني*    أمانة تبوك تخصص 18 موقعًا لبسطة خير السعودية 2026 تخدم 164 بائع    "اجاويد في عيون العالم" بنسختها الثانية في اجاويد٤ بمحافظة سراة عبيدة.    العويران: القادسية يصنع الفارق.. وموسمه الرمضاني لوحة إبداع    المملكة تعرب عن رفضها وإدانتها بأشد العبارات للهجمات الإيرانية السافرة والجبانة التي استهدفت منطقة الرياض والمنطقة الشرقية وتم التصدي لها    أوبك بلس تعتزم دراسة زيادة الإمدادات بعد قصف إيران    ولي العهد يجري اتصالات هاتفية بقادة الإمارات والبحرين وقطر والكويت والأردن    البيئة تطلق أسبوع المياه السعودي الأول أبريل المقبل    سوريا تغلق الممرات الجوية الجنوبية أمام الطيران    الخطوط السعودية تلغي عددا من رحلاتها نظرا لتطور الأوضاع في المنطقة    كيف ابتلع نسيج نزار صالح بوقري    الجمعية الخيرية ببلسمر تطلق مبادرة تفطير الصائمين    وزارة الشؤون الإسلامية تنفّذ برنامج خادم الحرمين لتوزيع التمور في ملاوي    فهد حكمي ابتسامة الوطن التي لن تنطفئ    في أمسية طبية.. ديوانية أجاويد 4 بسراة عبيدة تناقش آلام الظهر وسبل الوقاية منها    التوقيت الزوالي في المسجد النبوي.. امتداد تاريخي لعناية المسلمين بالمواقيت    تركي آل الشيخ يعلن مواجهة أوليكساندر أوسيك وبطل الكيك بوكسينغ ريكو فيرهوفن على لقب الوزن الثقيل    «سلمان للإغاثة» يوزّع (1,000) سلة غذائية في محلية الروصيرص بولاية النيل الأزرق بالسودان    الجبيل الصناعية تحتضن معرض «آيات.. بلسان عربي مبين»    "مدرك"… من فكرة توعوية إلى قصة وعي مجتمعي تتجدد للموسم الثالث في جازان    200 مستفيد ل"عمرة القادسية الرمضانية    إفطار رمضاني يجمع المسؤولين والأهالي في قوز الجعافرة… وجولة ميدانية تعزز دعم مراكز النشاط    ذكرى يوم التأسيس .. صور مضيئة لجذور تاريخية راسخة و أمجاد حضارة    تقنية جديدة للتحكم في سلوك الحيوان عن طريق الذكاء الاصطناعي    جامعة الإمام عبدالرحمن بن فيصل تُطلق مبادرة "صحتك في رمضان"    "الغذاء والدواء" تُحذّر من عدد من منتجات حليب الأطفال لشركة "نوتريشيا دانون"    ديوانية أجاويد تحتفي بالموروث الشعبي في أمسية ثقافية تربوية بسراة عبيدة    فجر جديد من الأمن والوحدة    جمعية اقتصاديات الطاقة تُعلن تشكيل مجلس الإدارة    نفحات رمضانية    حكواتي التلفزيون..!    الأميرة سارة بنت خالد بن مساعد تكرّم بيت الشاورما تقديرًا لدعمه جمعية إنسان ورعاية الأيتام    أمير جازان ونائبه يشاركان قادة ومنسوبي القطاعات الأمنية إفطارهم الرمضاني في الميدان    ولي العهد يعزي ولي عهد الكويت    تصعيد ميداني في غزة والضفة.. هدم واعتقالات شمالاً وقصف مستمر جنوباً    19489 طالبة وطالبة يتأهلون ل«أولمبياد نسمو»    مفاوضات تختبر فرص التهدئة.. جولة حاسمة بين واشنطن وطهران في جنيف    إفطار العطيشان    صحة جازان تُحيي ذكرى "يوم التأسيس" وسط أجواء رياضية وتثقيفية ببطولة "مدرك"    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



مقدمة مختصرة جدًا في علم البيانات
نشر في اليوم يوم 10 - 09 - 2016

كتبت فيما سبق عن ثورة المعلومات الخامسة أو ثورة البيانات الضخمة، وفي تقديري الشخصي أن أهم ما يميزها هو شيوع علم البيانات للاستفادة من هذه البيانات. وأود أن أقدم في هذا المقال مدخلاً مبسطاً (وإن كان أكثر تقنية من المقالات الأخرى) لعلم البيانات لغير المتخصصين. علم البيانات كما ذكرت سابقاً هو مجموعة من أساليب التحليل التي تعتمد على خوارزميات التعلم الآلي وأساليب التنقيب في البيانات مع اتباع المنهج العلمي واستعمال علم الإحصاء. وعلم البيانات في حقيقته ليس جديداً وكان يمارس تحت مسميات أخرى، لكن مع تطور الحاسبات وتوافر البيانات أصبح أكثر شيوعاً وأسهل في الاستفادة منه، ومنح اسماً جديداً زاد من جاذبيته.
يبدأ معظم علماء البيانات بمرحلة من الاستكشاف، ومحاولة فهم توزيع البيانات التي يتعاملون معها، ويكون ذلك عن طريق الاطلاع على الإحصاءات المتعلقة بها، ومحاولة عرضها على شكل رسوم بيانية. مما يمكن الباحث من الحكم على مدى دقة البيانات وإمكانية الإعتماد عليها. ومن ثم تكون مرحلة إعداد البيانات و«تنظيفها» من خلال إلغاء أي أجزاء يبدو أنها تالفة أو غير دقيقة من خلال الأساليب الإحصائية، ومن ثم التأكد من بقاء ما يكفي من بيانات لإجراء التحليلات المطلوبة.
ويقوم علماء البيانات بتقسيم البيانات إلى ما يدعى مجموعة التعليم (Training Set) ومجموعة الاختبار (Test Set). والسبب في ذلك أن استخدام جميع البيانات في صناعة النموذج سيؤدي إلى ما يدعى بالإفراط في المطابقة (overfitting) ما يفسر الماء بعد جهد بالماء! حيث إن الهدف في العادة هو الاستفادة من البيانات المتوافرة لبناء نماذج لتوقع ما لا يتوافر من بيانات، وإذا ما أفرطنا في مطابقة البيانات المتوافرة فإن النموذج سوف يعطي نتائج ضعيفة جدا للبيانات الأخرى التي لم يرها من قبل. ولذلك تنتشر المقولة المنسوبة لرونالد كوس (Ronald Coase) الحائز على جائزة نوبل في الاقتصاد: «إذا قمت بتعذيب البيانات لمدة كافية فإنها ستعترف!»، والمقصود بها التحذير من التعامل مع البيانات بطريقة خاطئة لإثبات نتائج مسبقة، لذلك يتم تمرين النماذج على مجموعة التعليم فقط، ثم اختبار أدائها على مجموعة الاختبار، وكما يعلم خبراء علم الإحصاء أن الحصول على نتيجة مطابقة عالية (يمكن تقديرها فوق 90%) عادةً ما تعني وجود خطأ في تحضير البيانات، حيث إن أنجح النماذج تكون في الأغلب أقل دقة في صحة توقعاتها.
يمكن تقسيم النماذج التي يستعملها علماء البيانات بشكل عام إلى ثلاثة أساليب لتحليل البيانات:
1- تحليل الانحدار (regression)، وهو يستخدم لبناء نماذج لتوقع النتائج الرقمية، ويحدد فيه المتغير المستهدف (target variable)، والبيانات الأخرى المستخدمة لتوقع قيمة المتغير المستهدف، وتسمى متغيرات التوقع (predictor variables) مثل: محاولة تحديد عمر مستخدم الجوال من خلال الخدمات وعدد الدقائق التي استهلكها.
2- التصنيف (classification) وهو يشبه الأسلوب الأول، لكنه يستخدم لتوقع النتائج غير الرقمية، ويقسم البيانات إلى قسمين أو أكثر على أساس قيم محددة مسبقاً للمتغير المستهدف. مثل محاولة تحديد جنس المشتري بناءً على قائمة مشتريات.
3- تجميع البيانات (clustering)، يستخدم هذ الأسلوب لتقسيم البيانات إلى مجموعات متجانسة، لكنه يختلف عن سابقيه في كونه لا يعطى تعليمات (unsupervised) بخصوص أساس التقسيم. وقد يخرج بنتائج غير متوقعة للتشابه بين مجموعات كانت تبدو مختلفة لأول وهلة، مثل: محاولة تقسيم بيانات زبائن شركة إلى عدد محدد من المجموعات.
يستخدم في التحليل عدد كبير من الخوارزميات، مثل: «Neural Networks»، «Nearest Neighbor»، «SVM»، «Random Forests» وغيرها. وتختلف جودة أدائها باختلاف المسائل، وكثيرا ما يحصل علماء البيانات على أفضل نتائج عن طريق التجريب والخطأ ومن ثم التصحيح، وبالاعتماد على الخبرة السابقة وليس على قوانين محددة. وتستخدم طرق مطورة من هذه الأساليب كذلك لتحليل الكلام، (text analytics) ومحاولة معرفة «الانطباعات» (sentiment) في وسائل التواصل الاجتماعي، إضافة إلى تحليل الروابط والتأثير في الشبكات الاجتماعية وغيرها.
وتستخدم هذه الأساليب لتطبيقات بسيطة مثل محاولة توقع عدد زبائن أحد المحلات التجارية أو تحليل سمعة منتج ما على تويتر، وتستعمل أساليب مطورة منها لبرمجة السيارات ذاتية القيادة والروبوتات وغيرها من التطبيقات الأكثر تعقيداً. لعل ما سبق يعطي فكرة عن كيفية الاستفادة من علم البيانات، وتعدد استعمالاته ولماذا يعتبر من أهم التخصصات اليوم.


انقر هنا لقراءة الخبر من مصدره.