أمير جازان يستقبل قائد قوة الطواري الخاصة بالمنطقة    أمير الشرقية يستقبل مدير عام التدريب التقني ويطّلع على برنامج "بيدي"    "البيئة" تطلق فعاليات الحملات الإرشادية الزراعية الأربعاء المقبل    خادم الحرمين يتلقى رسالة خطية من رئيس جمهورية أنغولا    شبكة القطيف الصحية تنظم دورة تخصصية في تمريض النساء والتوليد    رئيس مجلس الشورى يصل إلى مملكة كمبوديا في مستهل زيارة رسمية    الانتهاء من إنشاء مضمار مشي رياضي في جوف بني هاجر    ارتفاع عدد الشهداء الفلسطينيين في القصف الإسرائيلي على غزة إلى 58 شهيدًا    ولي العهد يعزّي ولي العهد بدولة الكويت في وفاة الشيخ فهد صباح الناصر المبارك الصباح    حملة توعوية وتثقيفية على مغاسل الملابس بالظهران    أمير جازان يتسلم التقرير السنوي لإدارة مرور المنطقة    أمير جازان يكرّم الفائزين بجائزتي المواطنة المسؤولة و"صيتاثون" في دورتها الرابعة    نمو أصول صندوق الاستثمارات إلى 4.32 تريليون ريال وإيرادات 413 مليار ريال    الأمير محمد بن عبدالعزيز يدشن عددًا من المشروعات بجامعة جازان    "الشمري": يزور مدير عام فرع وزارة الشؤون الإسلامية بالمنطقة    "تجمع جازان الصحي" يُحذر: تجنبوا الشمس وقت الذروة    السمنة مرض مزمن لا ضعف إرادة    لمسة وفاء.. سلطان بن أحمد السديري    الاحمدي يكتب.. جمَّلتها ياهلال    البيعة الثامنة لولي العهد بلغة الثقافة والفنون    هيئة الموسيقى السعودية وعازف البيانو الصيني وأول برنامج صيفي لتعليم البيانو في المملكة    سعد الصقير أول طبيب أمراض جلدية من دول الخليج يحصل على وسام القيادة الدولية في الأمراض الجلدية لعام 2025    كندا تلغي ضريبة الخدمات الرقمية    ترسيخ الحوكمة وتعزيز التكامل بين الجهات ذات العلاقة.. السعودية تقفز إلى المرتبة 13 عالمياً في حقوق الملكية الفكرية    وزارة الخارجية تُعرب عن تعازي المملكة لجمهورية السودان إثر حادث انهيار منجم للذهب    التعليم في ميزان المجتمع    توقيف شخصين ظهرا في محتوى مرئي بسلاحين ناريين    نقل 1404 مرضى داخل المملكة وخارجها عبر 507 رحلات إخلاء    نائب أمير مكة والقنصل العراقي يناقشان الموضوعات المشتركة    رئيس "الشورى" يبحث تعزيز العلاقات البرلمانية في كمبوديا    تصعيد متبادل بين العقوبات والمواقف السياسية.. روسيا تشن أعنف هجوم جوي على أوكرانيا    الملكية الفكرية ليست مائدة نقاش ديني.. بل مبدأ لا يُمس!    انطلق في مدينة الملك عبدالعزيز للعلوم والتقنية.. "جيل الابتكار".. يعزز ثقافة البحث لدى الموهوبين السعوديين    ما عاد في العمر متسع للعتاب    مادتا التعبير والخط    نتائج قوية تتجاوز مستهدف رؤية 2030.. 2.8 % معدل البطالة في المملكة خلال الربع الأول    مطار الملك عبدالعزيز الدولي يوفر وسائل نقل رسمية متنوعة    أكد أهمية مناهج التعليم الديني.. العيسى يشدد: تحصين الشباب المسلم من الأفكار الدخيلة على "الاعتدال"    بحثا جهود الحفاظ على أمن واستقرار المنطقة.. وزير الدفاع ورئيس هيئة الأركان الإيرانية يستعرضان العلاقات    مدرب تشيلسي ينتقد الفيفا ومونديال الأندية    بعد وداعه لكأس كونكاكاف الذهبية.. رينارد: أتحمل المسؤولية.. وسنكون جاهزين لتصفيات ملحق المونديال    دواء جديد يعطي أملاً لمرضى السكري من النوع الأول    "الصحة العالمية" تفشل في تحديد سبب جائحة كوفيد- 19    أخضر السيدات يخسر أمام الفلبين بثلاثية في تصفيات كأس آسيا    "الملك سلمان للإغاثة".. جهود إنسانية متواصلة    بعنوان "النمر يبقى نمر".. الاتحاد يجدد عقد مدافعه "شراحيلي" حتى 2028    فاطمة العنزي ممثلة الحدود الشمالية في لجنة المسؤولية الاجتماعية بالاتحاد السعودي للدراجات    «الشؤون النسائية بالمسجد النبوي» تُطلق فرصًا تطوعية    استعراض أعمال الشؤون الإسلامية أمام أمير تبوك    المملكة تواصل ضرباتها الاستباقية ضد المخدرات    الأحوال المدنية المتنقلة تقدم خدماتها في خمسة مواقع    خمس شراكات لدعم مستفيدي «إنجاب الشرقية»    الجامعة الإسلامية تدعم الأبحاث المتميزة    نائب أمير منطقة مكة يستقبل القنصلَ العام لجمهورية العراق    أمير تبوك يطلع على التقرير السنوي لاعمال فرع وزارة الشؤون الاسلامية بالمنطقة    الشؤون الإسلامية في جازان تنفذ جولات ميدانية لصيانة جوامع ومساجد المنطقة    ترامب يحث الكونغرس على "قتل" إذاعة (صوت أمريكا)    أقوى كاميرا تكتشف الكون    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



محركات البحث تستخدم تقنيات إحصائية لا تفهم النصوص . أساليب التفتيش الذكي عن المعلومات ومضامينها على الإنترنت
نشر في الحياة يوم 07 - 10 - 2007

بعد أن شهد القرن العشرون ظهور شبكة الانترنت، التي قدمّت للبشرية أسلوباً جديداً للتواصل، يبدو مطلع القرن ال21 وكأنه مهجوس بمفهوم تحويل التواصل الى جزء من الحياة اليومية، خصوصاً الاستفادة من شبكات التواصل الرقمي في الحصول على المعلومات التي تعتبر مفتاحاً أساسياً في عملية المعرفة وبالتالي التقدم والتنمية. لقد وُضع الكثير من المعارف الانسانية على الشبكات الرقمية التي تعتبر الانترنت نموذجها الأبرز، وبالتالي لم يعد توافر المعلومة هاجساً، إذ يفترض أنها متوافرة دوماً، وصارت الأهمية لمحتوى المعلومة، أي للنص الرقمي الذي يحملها في طياته الالكترونية كما في سياقاته اللغوية. وصار المحتوى بعداً جديداً في عملية البحث عن المعلومات على الشبكات الرقمية. ويبدو توضيح هذا السياق مدخلاً ضرورياً لتناول موضوع التفتيش المؤتمت والذكي عن المعلومات راهناً.
هل محركات البحث"ذكية"؟
يجري البحث راهناً، عن المعلومات عبر محركات بحث مثل"غوغل"Google وپ"ياهو"Yahoo وپ"فوالا"Voila وپ"ألتافيستا"Altavista وغيرها. ويعتمد عملها عموماً على تقديم واجهة لكتابة طلب البحث عن معلومات محدّدة. تعمد بعض محركات البحث الى البحث عن النصوص باستعمال التقنيات الإحصائية، كأن تفتش النصوص بالاستناد الى عدد الكلمات المطابقة لتلك المستخدمة في كتابة الطلب، ثم ترسل النصوص إلى المستخدم تراتبياً بحسب عدد تلك الكلمات داخل النص.
تروج هذة الآلية في التفتيش في محركات البحث، ربما بسبب سهولتها نسبياً، لكنها تفتقر إلى الدقة. فمن وجهة نظر علمية ولغوية، لا يحدّد العدّد أهمية الكلمات بالنسبة إلى النص. كما أن وجود كلمة في أحد النصوص، وإن تكرّرت، لا يعني أن الموضوع يتحدث عنها بالضرورة. إن وجود كلمة"فضاء"في نص لا يعني أنه يتناول الفضاء وعلومه. وفي المقابل، قد تحتوي بعض النصوص على معلومات مهمة عن الفضاء، من دون أن تكرر تلك الكلمة كثيراً في متنه.
وهكذا، فأحياناً لا نحصل على المطلوب، وأحياناً أخرى نحصل على كمية هائله من المعلومات والوثائق ليس في استطاعتنا قراءتها ولا مراجعتها. ويصف البعض هذا الوضع بعبارة"كثرة المعلومات تقتل المعرفة".
إذاً، يؤدي اعتماد الطرق الإحصائية وغير الذكية في البحث إلى مشاكل جمّة. إن العمل الإحصائي لا يصلح أداة للتحليل اللغوي - الألسني للنصوص.
من ناحية ثانيه، فإن لكل مستخدم هدفاً معيناً من المعلومات التي يريدها في النص، وغالباً ما يتصل ذلك بمفهوم النص. فمن المعلوم أن النص يُفْهَم من كل شخص بحسب الحال والسياق. وليس من المبالغة القول أن لكل تفسيره الخاص للنص.
إن الباحث عن المعلومات قد يكون صحافياً أو باحثاً أو طبيباً أو غيرهم. ولا يبحث الصحافي مثلاً في نص معين عن المعلومات عينها التي قد يسعى وراءها الباحث. ولربما يهتم الصحافي بالبحث عن"ما قيل"وپ"من قال"حول موضوع ما، أما الباحث فقد يفتش عن العلاقات السببية والحلول المطروحة لإشكالية معينة داخل النص. لهذا يجب التفتيش عن محركات بحث مختلفة ومتطورة، تعطي لكلٍ حاجته من المعلومات التي يفترض وجودها ضمن نصوص تُنتقى بطريقة مناسبة أيضاً.
ويتطلب هذا الأمر برامج معلوماتية تعالج النصوص بصورة مؤتمتة، أي أنها تتعامل مع المحتوى الدلالي للنص وتجزئه بحسب أنماط دلالاته. وفي هذه الحال، يصبح النص مجموعة من العلاقات بين مكوّناته، والتي تنتظم بحسب المحتوى اللغوي لهذه الأجزاء. وفي العموم، نجد في النص العناوين بأنواعها وترابطاتها، والخلاصات، والتعاريف، والعلاقات السببية، والجمل الأكثر أهمية التي يريد الكاتب أن يوصلها الى القارئ، والاقتباس المباشر، والاقتباس المنقول، والعلاقات الزمانية والمكانية وغيرها. وتشكّل هذه الأنماط الخريطة الدلالية للنصوص، خصوصاً تلك التي تتناول العلوم والإعلام.
تحاول مختبرات الأبحاث في الكثير من الجامعات الغربية والقليل من الجامعات العربية أن تطوّر تلك المحركات الذكية تمهيداً لوضعها في متناول الجميع. وبذا، تُساعد تلك الأبحاث في الانتقال من النمط الإحصائي في التفتيش عن المعلومات، إلى مراحل أكثر ذكاء تحلّل فيها نصوص المعلومات بحسب محتواها وسياقاتها وتركيبتها.
وفي اللغة التقنية، يوصف ذلك بأنه الانتقال من شبكة الإنترنت، بالطريقة التي نستعملها راهناً، إلى"الويب 2.0". وحالياً ما زال كثير من المعلومات الموضوعة على الإنترنت مكتوب بلغة"النص الفائق الترابط""اتش تي ام أل"HTML اختصاراً لعبارة Hyper Text Markup Language التي تهتم بشكل النصوص، ولا تقدر على توصيف المحتوى. أما"الويب 2.0"فمن خصائصه توصيف النصوص بحسب المحتوى الدلالي، وخصوصاً باستخدام لغة"اكس أم أل"XML، اختصاراً لعبارة eXtensible Markup Langage. وفي"الويب 2.0"تتصرف محركات البحث كعميل ذكي، إلى درجة أنها تتعلم بذاتها تلقائياً من خلال تعامل المستخدم وسلوكياته. كما يتحوّل النص المُفرد إلى وحدة في إمكانها أن تتفاعل مع بقية النصوص.
أتمتة فهم النص ودلالاته
تجدر الإشارة إلى أن عملية كتابة النصوص على الشبكات الإلكترونية، وبالتالي توصيفها عبر اللغات الرقمية، هي مسألة يتولاها اختصاصيون، وينطبق ذلك على لغتي"اتش تي ام أل"وپ"اكس أم أل". وفي المقابل، تبذل جهود علمية ضخمة للتوصل الى برامج تستطيع أن"تتفهم"التوصيف الدلالي للمعنى المتضمن في النص، وبطريقة مؤتمتة كلياً. وتستخدم نظريات لغوية وألسنية لمساندة تلك الجهود المعلوماتية، وبطريقة تساعد على الوصول إلى صنع هذه البرامج في شكل مقبول نسبياً. والحق أن العمل اليدوي لم يعد كافياً لمعالجة الكم الهائل من النصوص والمعلومات المتاحة على الشبكات حالياً.
ويستعمل الكثير من تلك العمليات تقنية الپ"أر أس أس"RSS ، اختصاراً لعبارة"ريلي سمبل سينديكاشن"Really Simple Syndication، وترجمتها"البيع البسيط فعلياً"، التي تعطي المستخدم معلومات تتناسب مع وجهة نظره، ومع مجموعة العبارات التي تشكل بالنسبة إليه مفاتيح للمواضيع التي يهتم بها بطريقة مستمرة.
وفي مثال لافت، يستعمل مختبر اللغات والمعلوماتية والمنطق في جامعة السوربون الباريسية، برنامجاً يفتش عن المعلومات بالاستناد الى وجهة نظر المستخدم، كما تظهر في ما يقتبسه من نصوص. هذا البرنامج له أهمية كبيرة بالنسبة الى العاملين في مجال التواصل. ويعطي نموذجاً للقدرة على تزويد المستخدم بالاقتباسات المتاحة في الجرائد الفرنسية التي تستخدم تقنيات الپ"أر أس أس". وفي تجربة لافتة، استعمل هذا البرنامج لمراقبة أقوال المرشحين لانتخابات رئاسة الجمهورية الفرنسية عام 2007، سواء تلك التي ظهرت في الصحف الفرنسية أم في مواقع الويب الخاصة بأولئك المرشحين. وأعطى البرنامج معطيات عن كيفية استعمال تصريحات المرشحين، وكذلك طرق استخدامها داخل النصوص. ويعطي ذلك نموذجاً عن برامج الكومبيوتر التي تسعى الى التعامل لغوياً وألسنياً مع النصوص.
وفي سياق متصل، أعطى البرنامج معلومات عن الطرق التي يستعمل بها الجمهور الاقتباسات المأخوذة من مصادر متنوعة. كما تبيّن أنه يصلح مؤشراً الى موضوعية الصحف أيضاً، وخصوصاً لجهة استخدام أفعال التواصل، فمثلاً تختلف دلالة عبارة"قال فلان"عن استعمال فعل"أشار فلان"مع اقتباس الجملة نفسها، وكذلك الأمر بالنسبة الى عبارات من نوع"زعم فلان"أو"أعلن فلان". تجدر الإشارة إلى أن العمل جار حالياً على هذا البرنامج لكي يتعامل مع الاقتباسات من الصحف العربية التي تستخدم تقنية"أر أس أس".
ويتمثل الهدف من هذا البرنامج في الحصول على الخلاصة الآلية، وبحسب أقوال الكاتب. وإن التفتيش الآلي عن الخلاصة أصبح ضرورة، لأن وفرة النصوص تعوق استخدامها مباشرة، ما يبرز الحاجة الى أدوات ذكية تُقدم خلاصات عنها.
وبذا، يشبه هذا البرنامج القراءة السريعة للنص وتصفّحه، ما يوصل إلى أهم محتوياته.
وكذلك يدخل البرنامج ضمن البرامج الذكية، التي تشكّل جزءاً من"الذكاء الاصطناعي"Artificial Intelligence بمفهومه الحديث. ومن المعلوم أن الحاسوب ليس له القدرة على التفكير ولا على الفهم، ولكن هذه القدرة على التحليل ممكنة إذا لقن قواعد واضحة للتعامل مع النصوص.
وفي هذا السياق، تبرز مشكلة أن الكومبيوتر لا يتعامل إلا باللغة الرقمية، التي تستند الى تسلسلات من رقمي"صفر"وپ"واحد".
إن كل المعلومات والأنظمة التي تتعامل مع الحاسوب تكتب بهذه الطريقة حصرياً، ما يؤدي الى اقتصار كل دال على مدلول بعينه. والمعلوم أن العلاقة بين الدال والمدلول في اللغة الطبيعية، هي متعددة وتتنوع بحسب السياق.
فكيف من الممكن أن نصل إلى المعنى المتعدد في الحاسوب الذي يصر على أن كل الإشارات الموجودة فيه لها معنى وحيد؟
ثمة طريقة يستعملها بعض الاختصاصيين تعتمد على إحدى نظريات الألسنية الحديثة، وتسمى"الاستكشاف التناصي"وهي من ضمن الأبحاث في مجال علوم المعرفة والتي تضع النقاط حول دور السياق في الفهم والتأويل وترتكز على مبدأ أن السياق اللساني الذي يدخل مباشرة في تحديد المعاني وبنائها، يرفع التباس المفردات والقواعد والدلالات.
* أستاذ في الجامعة اللبنانية


انقر هنا لقراءة الخبر من مصدره.