المديرية العامة للدفاع المدني تشارك في جناح وزارة الداخلية بمعرض الدفاع العالمي 2026    أمير القصيم يرعى تخريج 13 ألفا من جامعة القصيم    فضية وبرونزية للسعودية في بطولة آسيا لدراجات الطريق "القصيم 2026"        تعاون بين «Magna AI» و «Zchwantech» بقيمة 700 مليون دولار لدعم الذكاء الاصطناعي السيادي في ماليزيا    الأمير سعود بن نهار يتفقّد ميقاتي السيل الكبير ووادي محرم ويطّلع على جاهزية الخدمات لاستقبال المعتمرين في رمضان    بنك الدم الإقليمي بالقصيم يحصل على اعتماد الجمعية الأمريكية لبنوك الدم (AABB)    انطلاق أعمال النسخة الثانية من مؤتمر العُلا لاقتصادات الأسواق الناشئة 2026    1000 شخصية يشهدون اطلاق أول مؤشر عالمي لتقييم رعاية الموهوبين    وزير الثقافة السوري يشيد بجهود هيئة الأدب والنشر والترجمة    نائب أمير المنطقة الشرقية يهنئ قائد حرس الحدود بالمنطقة بمناسبة تعيينه    سالم الدوسري ينضم لغيابات الهلال أمام شباب الأهلي    البرنامج السعودي لتنمية وإعمار اليمن يعيد تأهيل "خيصة" الصيادين دعمًا لسبل العيش في سقطرى    كبدك تعلن نجاح أول زراعة كبد لعام 2026    أجاويد 4 تستعد للانطلاق في عسير بمعسكر تأهيلي ولقاء مع أمير المنطقة ورئيس هيئة تطويرها    سوكبا تمهل المكاتب المهنية 20 يوما لمعالجة ملاحظات الفحص الدوري    استشهاد فلسطينية وإصابة آخرين بنيران جيش الاحتلال في قطاع غزة    56 بطلا على حلبات الرياض في ختام بطولة حزام المملكة للملاكمة    إصدار التقرير الأول لسجل السرطان الخليجي للفترة 2020-2013م    ارتفاع احتياطيات النقد الأجنبي في الصين إلى 3.3991 تريليونات دولار    موجة ضباب على المنطقة الشرقية    منتدى الإعلام.. يواكب عالمًا يتشكّل    5000 منشط دعوي في مكة    «بيئة حائل» تكثف جولاتها الرقابية على الأسواق والمسالخ استعداداً لرمضان    ضبط 20237 مخالفًا    إمام المسجد النبوي: الدعاء لُبُّ العبادة وجوهرها    أمانة نجران تغلق مخبزاً مخالفاً    «التوعية بالظواهر الجوية» يزيد ثقافة الوقاية    «دار رعاية نفسية» في جدة.. حاجة مجتمعية    تقارير.. كونسيساو غاضب من ادارة الاتحاد    الدنمارك ترى إمكانية لاتفاق مع أميركا بشأن جرينلاند يحترم «الخطوط الحمراء»    «دعم» تؤهل قيادات تطوعية    رحل بعد مسيرة حافلة بالعطاء في خدمة الوطن.. أمراء يؤدون صلاة الميت على محمد السويلم    موجز    وفد الكشافة يطمئن على القوقاني    رابطةُ العالم الإسلامي تُدين التفجيرَ الإرهابيَّ الذي استهدفَ مسجدًا في إسلام آباد    أوستن مقر الأخضر السعودي في كأس العالم 2026    التعادل يخيم على لقاء القادسية والفتح    القيادة تهنئ الحاكم العام لنيوزيلندا بذكرى اليوم الوطني    3 حالات تسمح للجمعيات الأهلية بتجاوز أهدافها    حادث يدخل الفنانة نهال القاضي في حالة حرجة    تحت رعاية الأمير عبدالعزيز بن سعود.. نائب وزير الداخلية المكلف يشهد حفل تخريج الدفعة ال (7) من الدورة التأهيلية للفرد الأساسي (نساء) بكلية الملك فهد الأمنية    بسبب«الهواتف» انتحار 3 شقيقات    «آبل» تحذر من هجوم عبر رسائل مزيفة باسمها    وسط تعثر المفاوضات.. موسكو تقصف منشآت الطاقة في كييف    اتفاقيات نوعية تعكس التعاون في مختلف المشاريع.. السعودية وسوريا.. مرحلة جديدة من الشراكة الاستثمارية    ضبط 1455 حالة لممنوعات بالمنافذ    مختص يحذر من أطعمة ترفع سكر الدم    خبراء يحذرون من مخاطر السجائر الإلكترونية    بحضور قيادات رياضية.. تتويج الأبطال في ختام بطولة مهد الجيل القادم    الظلم... طريق الهلاك    دعم الإمارات للدعم السريع يفاقم أزمة السودان واستمرار القتل والعبث    انطلاق منافسات النسخة الحادية عشرة من مسابقة أمير الرياض لحفظ القرآن بشقراء    الجزائر تبدأ إلغاء اتفاقية خدمات النقل الجوي مع الإمارات    قائد قوات الدفاع الجوي يرعى حفل تخرج معهد الدفاع الجوي    أمير الرياض يستقبل سفير الكويت    أمير منطقة جازان وسمو نائبه يعزّيان عريفة قبيلة السادة النعامية بالعالية في وفاة والدته    نائب أمير جازان يعزي شيخ شمل السادة الخلاوية وتوابعها في وفاة والده    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



الثبيتي: هدفنا «محتوى» يليق بالثقافة
نشر في الحياة يوم 20 - 04 - 2012

تعتبر المدونة اللغوية العربية لمدينة الملك عبدالعزيز للعلوم والتقنية أو (المدونة العربية) أحد المشاريع الاستراتيجية لمبادرة الملك عبدالله للمحتوى العربي. يهدف المشروع إلى بناء مدونة لغوية عربية تحوي 700 مليون كلمة مما دوّن بالعربية ابتداء من العصر الجاهلي وحتى العصر الحديث ومن مختلف المناطق والبلدان، مع الأخذ في الاعتبار طبيعة وحجم النشاط الفكري لكل فترة، وتنوع أوعية النشر فيها (مخطوطات، صحف، كتب، مجلات، دوريات علمية،...) والسائد من المجالات العلمية والفكرية المختلفة (المعتقدات، علوم العربية، العلوم الطبيعية، الأدب...).
كما يشمل المشروع إضافة إلى المادة اللغوية المصنفة، إنشاء موقع للمدونة على الإنترنت، إضافة إلى أدوات للبحث والتحليل اللغوي والإحصائي تعزز الاستفادة من مواد المدونة.
«الحياة» التقت المشرف على المدونة العربية الدكتور عبدالمحسن الثبيتي، فكان هذا الحوار معه حول هذا المشروع الثقافي الرائد:
بداية هل يمكن تعريف القارئ بفكرة المدونة العربية؟
- المدونات اللغوية ببساطة هي نصوصٌ إلكترونية تجمع لغرض معين بناء على معايير خارجية. وعندما نقول معايير خارجية، أي أنه لا علاقة لمحتوى النص ومفرداته وتراكيبه بقرار اختيار النص. ومن أمثلة هذه المعايير الخارجية، الفترة التي ظهر فيها النص وموضوعه ومكان طباعته. واعتماداً على هذا التعريف فإننا نقول إن المدونة اللغوية العربية لمدينة الملك عبدالعزيز للعلوم والتقنية - التي نسميها اختصاراً المدونة العربية - هي نصوص إلكترونية جمعت لغرضين رئيسيين، هما دراسة اللغة وبناء النماذج الحاسوبية للغة العربية من واقع استخدامها الفعلي لكلا الغرضين. وكانت المعايير التي اعتمدناها لجمع هذه النصوص مرتكزة على محاور رئيسية هي الزمن (من عصر ما قبل الإسلام وحتى عصرنا الحالي) والوعاء الذي ظهر فيه النص بما يتناسب مع الفترة الزمنية (مخطوطات، كتب، صحف مجلات،...) ثم المجال المعرفي الشائع في كل زمن والمناسب لكل وعاء وأن تكون أغلب مادتها من البلدان العربية.
هل يمكن معرفة كيف بدأت فكرة المدونة اللغوية هذه؟ وكيف تحولت من فكرة إلى واقع؟
- بداية أوضحُ أن فكرة استخدام المدونات اللغوية بدأت في بدايات الستينات الميلادية من القرن الماضي في أميركا تحديداً وكانت أولى المدونات هي مدونة براون - نسبة إلى جامعة براون الأميركية - التي حوت مليون كلمة من الإنكليزية الأميركية المعاصرة في ذلك الوقت. وكانت تتكون من 500 نص كل منها يحتوي على ألفي كلمة. ولعلك تتخيل الوقت والجهد الذي بذل لجمع هذا العدد ورقمنته وتهيئته للحاسب المحدود القدرات ذلك الوقت مقارنة بوقتنا الحالي. وكانت الفكرة الرئيسية لهذا المشروع هي دراسة اللغة بناء على استخدامها الواقعي الفعلي (التجريبي)، وجوبهت هذه الفكرة بحرب شديدة من تشومسكي ومدرسته التي كانت تدرس اللغة بأسلوب مغاير. وتسبب هذا في تأخر الاستفادة من المدونات اللغوية لمدة عشرين سنة إلى أن بدأت الفكرة تلقى القبول والاستحسان مرة أخرى بسبب الفوائد التي ظهرت من استخداماتها في الثمانينات من القرن الماضي، خصوصاً في بريطانيا ثم انتشر هذا الاهتمام إلى أوروبا واميركا. ومن نهاية فترة الثمانينات من القرن العشرين كانت هناك محاولات لبناء مدونات لغوية عربية، ولكن أغلبها لم يكن متاحاً للاستفادة منه. وكانت تعاني من مشكلتين رئيستين: الأولى أنها محدودة الحجم في الأغلب، والثانية أنها كانت منحازة لمصدر واحد فقط وهو الصحف ولفترة زمنية ضيقة. وعند وضع الخطة الوطنية للعلوم والتقنية وكذلك مبادرة الملك عبدالله للمحتوى العربي كانت أولى التوصيات هي بناء مدونة لغوية عربية كونها الأساس الذي يمكن أن تنطلق منه جهود تطوير تقنيات حوسبة اللغة التي ستعزز من جودة وكمية المحتوى العربي على الإنترنت وتسهل الوصول اليه والتعامل معه بطريقة أفضل.
تسعى المدونة اللغوية لتكون أكبر مدونة لغوية عربية، إذ تطمح للوصول إلى بليون كلمة.. إلى أين وصل هذا الطموح الآن؟
- وصلنا الآن إلى أكثر من 700 مليون كلمة موزعة على أكثر من مليون نصٍ. تم جمع وتصنيف أغلبها بطريقة آلية خلال أقل من عام. ونخطط إلى أن تصل المدونة إلى بليون كلمة قبل نهاية العام بحول الله.
كيف تبنت مدينة الملك عبدالعزيز للعلوم والتقنية هذا المشروع؟ وما الدعم الذي قدمته للمشروع؟
- المدونة اللغوية العربية مشروع استراتيجي من مشاريع مبادرة الملك عبدالله للمحتوى العربي. ومدينة الملك عبدالعزيز هي الجهة المسؤولة عن هذه المبادرة، وتولت المدينة جميع التكاليف المادية الخاصة بالمدونة وبالعاملين عليها.
إلى من هي موجهة فكرة المحتوى العربي، بمعنى آخر من هم الذين يمكنهم الاستفادة من هذا المشروع في ما بعد؟
- مبادرة الملك عبدالله للمحتوى العربي كما أراها هي مبادرة لتعزيز وجود محتوى عربي بالكم والكيف اللائقين بالثقافة العربية والإسلامية على الإنترنت، كما تسعى لتشجيع صناعة قائمة على المحتوى العربي والتعامل معه سواء في الانترنت أو داخل المؤسسات العامة والخاصة. وحتى تنجح هذه الصناعة يجب ان تدعم من خلال تشجيع الأبحاث التي تتعامل مع المحتوى العربي بصوره المتعددة وتوفير البنية الأساسية لهذه الابحاث. وأول خطوة لهذا المجهود والتوجه هي إيجاد البيانات اللازمة والكافية لإجراء الأبحاث الخاصة بمعالجة اللغة العربية في صورتها المكتوبة. هذه البيانات هي المدونة اللغوية العربية. والمدونة العربية موجهة بالدرجة الاولى الى اللغويين لدراسة اللغة العربية واستخداماتها بطريقة جديدة غير مطروقة في ما احسب من قبل، كما أن المدونة موجهة للمهتمين بحوسبة اللغة لبناء النماذج الحاسوبية للغة العربية وإنتاج أنظمة يمكن ان تتعامل مع النصوص العربية بذكاء.
هل ثمة عراقيل واجهت تحقيق هذا المشروع الكبير؟
- هناك بعض الصعوبات وهي تتعلق بالحصول على بعض النصوص خصوصاً النصوص العلمية والتطبيقية وكذلك الحصول على نصوص للصحف والمجلات القديمة. وحاولنا التواصل مع صحف ومجلات عدة لتزويدنا بنسخ الكترونية لأعدادها القديمة ولكننا للأسف لم نلق أي تجاوب.
وصلت الكلمات في المدونة والتي من دون تكرار إلى ما يزيد على ستة ملايين كلمة، كيف سيكون الأمر بعد سنة مثلاً؟
- دعني أُعرف معنى كلمة عند استخدامنا لها في المدونة. ما نعنيه بالكلمة هو رسمها. فمثلاً الرسم المختلف لكلمة كتاب مثل (كِتاب، كُتاَب، كِتابُ، كِتابٌ، كِتابَ، كتابُ) يجعلها كلمات مختلفة. وكذا الحال في رسم حرف الجر (إلى، الى، إلى، إلى) و(أن، ان، إن، أنَ و إنَ)، فالتشكيل والهمزات وإضافة المدود واختلاف طرق استخدامها تؤثر كثيراً في هذا. وهذه أحد المصاعب التي تواجه معالجة اللغة العربية.
بطبيعة الحال كلما اضفنا نصوصاً جديدة للمدونة سيزداد عدد الكلمات المفردة في المدونة ولكن مقدار الزيادة بطبيعة الحال ستقل مع الزمن ومع ازدياد عدد النصوص لأن المدونة ستستقر وتصل الى مرحلة التشبع ولعلي انبه هنا الى أن قسماً كبيراً من كلمات المدونة لا يظهر الا مرة واحدة او لعدد محدود. وهذه في الغالب لا تكون محط اهتمام الباحثين.
اغلب التركيز يكون على الكلمات الاكثر تكراراً والكلمات المتوسطة الاستخدام. بالإمكان ازالة التشكيل من النصوص أو حتى تصحيح الهمزات وازالة المدود، ولكن هنا نكون غيرنا النص الأصلي، وبالتالي أنتجنا صورة مغايرة ومخالفة للواقع الفعلي للغة وستكون كل دراساتنا الخاصة باللغة أو حوسبتها وكذلك ما ينتج منها من انظمة وبرامج لمعالجتها غير ذات نفع إن قمنا فعلاً بالتدخل والتصحيح بحسب ما نراه.


انقر هنا لقراءة الخبر من مصدره.