نموذج منطقي

ظهرت في الأعوام الأخيرة كثير من المحاولات لإضفاء المنطق على نظام استرجاع المعلومات وكان أولها محاولة استخدام المنطق الكلاسيكي من قبل العالم Cooper من أجل التعبير عن الملائمة بين المستند والاستعلام كتسلسل منطقي (عملية اقتضاء منطقي) بحيث إذا كان الاستعلام تسلسل منطقي للمستند عندها يعتبر المستند ملائم، ولكن عملية المطابقة المنطقية هذه تعتبر جداً صارمة لأنه لا يوجد درجة للملائمة فالمستند إما يعبر عن الاستعلام أو لا يعبر عنه، وهذه من إحدى نقاط ضعف المنطق الكلاسيكي في تمثيل نظام استرجاع المعلومات. ثم جاء العالم Van Rijsbergen الذي أدرك أن نظم البحث عن المعلومات القائمة على الطرق الإحصائية (النموذج الشعاعي, البولياني الموسع،...) قد وصلت إلى حدودها النظرية فابتكر نظرية جديدة لاستخدام المنطق الغير الكلاسيكي معتمداً على فكرة الاقتضاء غير المؤكد بين المستند والاستعلام وهو بنظريته هذه فتح الباب أمام الأبحاث التي تناقش اختيار المنطق المناسب لتمثيل المستند والاستعلام ومعرفة النظام وعملية الاستدلال التي تقوم على فكرة عدم الحتمية. والنموذج المنطقي في نظم استرجاع المعلومات يسعى لاسترجاع الوثائق التي لها علاقة بحاجة الزبون آخذاً بعين الاعتبار مجموعة من العوامل التي تأثر على عملية الاسترجاع مما يميزه عن باقي نماذج البحث

العوامل المؤثرة على فاعلية نظم استرجاع المعلومات

  1. الموضوع الذي يبحث عنه المستخدم.
  2. المعرفة الموجودة لدى المستخدم أو حتى مجرد الاعتقاد بوجودها لدى المستخدم .
  3. المعلومات التي كانت متاحة مسبقاً للمستخدم مثلاً المعلومات التي سبق للمستخدم وأن تصفحها.
  4. العلاقة بين المواضيع المختلفة.
  5. غاية المستخدم أو درجة عمق المعرفة التي يريدها المستخدم.


الموضوع الذي يبحث عنه المستخدم

وهو أهم عامل في عملية الاسترجاع بشرط أن الاستعلام الذي يكتبه المستخدم يعبر تماماً عن الموضوع الذي يريده


حالة المعرفة (knowledge state)

إن المعرفة الموجودة لدى المستخدم تمثل دور هام في عملية الاسترجاع وخاصة عندما تكون الوثيقة التي صدرت كنتيجة لاستعلام معين لا تتبع بشكل مباشر المعلومة المطلوبة وإنما تحمل صلة بها.

اعتماداً على معرفة المستخدم يمكن أن تكون أو لا تكون وثيقة ما مناسبة لاستعلامه.

مثلاً لنفرض أنه لدينا وثيقة تحمل معلومات عن "استرجاع المعلومات" وأخرى عن " Document Indexing" وأنه لدينا مستخدم مبتدئ في معرفته بموضوع "Information Retrieval" ويريد أن يعرف عنه، فمثل هذا المستخدم لا يمكن أن يكون على علم بأن document indexing هي مرحلة من مراحل information retrieval، لذلك يجب أن لا يكون في نتيجة البحث الخاصة بهذا المستخدم وثيقة تحمل معلومات عن document indexing.

بينما لو كان المستخدم الذي يقوم بعملية البحث خبير بمعرفته بموضوع "استرجاع المعلومات" فلا بد أن تكون نتيجة البحث الخاصة به حاوية على مواضيع عدة لها علاقة ب"استرجاع المعلومات" ومنها الوثائق التي تتحدث عن document indexing. فكما نرى أن نفس موضوع الاستعلام أدى إلى نتائج بحث مختلفة اعتماداًُ على معرفة المستخدم الذي يقوم بعملية البحث، ولكن كيف نستطيع أن نحقق مثل هذه النتائج؟لذا كان لا بد من وجود قاعدة بيانات خاصة بالمعرفة التي يملكها المستخدمين والتي تدخل كعنصر أساسي في عملية البحث . وعند عدم التأكد من المعرفة التي يملكها المستخدمين يصبح لدينا مفهوم مختلف عن المعرفة وهو ما يدعى الاعتقاد بأن هذا المستخدم لديه معرفة معينة (تبعاً لسلوكه في التصفح مثلاً) ويريد شي معين مما يحول دون دقة النتائج مقارنة مع المعرفة الأكيدة للمستخدم

حالة المعلومات(Information state)

ولهذا العامل أهمية كبيرة تتجلى في استبعاد المعلومات التي سبق للمستخدم وأن تصفحها وتزويده فقط بالمعلومات الجديدة التي لا يعرفها في مجال معين وهو ما نعتبره في غاية الأهمية في حال كانت نتائج البحث عن موضوع معين كثيرة جداً، عندها بدلاً من أن نضيع وقت المستخدم في تصفح النتائج جميعها ليكتشف بعد مدة طويلة من البحث في أنه لم يتعلم معلومات جديدة نقوم بتوفير الجهد عليه ونزوده فقط بالمعلومات الجديدة، إذاً لا بد من أن نقوم بتخزين كل ما يقوم المستخدم بتصفحه لنستطيع من خلال سجل المستخدم تجنب الصفحات التي زارها سابقاً.

المنطق الكلاسيكي

يتألف المنطق L من مجموعة من القضايا {p,q,v,..} و مجموعة من الروابط المنطقية التالية النفي ¬

الوصل ^

الفصل ν

الاقتضاء→

التكافؤ ↔


حيث يشكل المنطق الكلاسيكي لغة تملك قواعد صرفية (Syntax) ودلالات (Semantics)

تمثل القواعد الصرفية أي صيغة (جملة) جيدة الصياغة وكمثال على جملة جيدةالصياغة

¬ p →(q ^ r)


بينما الدلالة تعني قيمة للقضية المذكورة في العبارة أو قيمة للجملة جيدة الصياغة وهذه القيمة في المنطق الكلاسيكي إما صفر (خاطئة) أو واحد(صحيحة) ، فقيمة (دلالة) صيغة منطقية ناتجة عن تطبيق واحد أو أكثر من الروابط المنطقية على مجموعة من القضايا استخدم المنطق الكلا سيكي في نظم استرجاع المعلومات حيث يقوم على فكرة استدلال عبارات من مجموعة قضايا ولكنه قاصر عن التعبير عن أهم خصائص نظام استرجاع المعلومات -مثلا التعبير عن أهمية كلمة ما في الاستعلام أو المستند- وهذا أدى إلى ظهور بدائل منطقية غير كلاسكية

قصور المنطق الكلاسيكي في التعبير عن خصائص نظام البحث عن المعلومات

الأهمية (Significance)

في كل مستند هناك كلمات تملك أهمية أكبر من أي كلمة أخرى وعادة يكون تكرارها أكبر وهذه الكلمات هي التي تعبر عن المستند بشكل أكبر ومعظم نماذج نظم استرجاع المعلومات تراعي كيفية تمثيل أهمية كلمة في مستند إلا أن النموذج المنطقي يعجز عن التعبير عن الأهمية وقد يتبادر إلى ذهن القارئ أنه لو مثلا تكررت لدينا كلمة p مرتان نستطيع التعبير عنها في النموذج المنطقي على النحوي الآتي p ^p ولكن تلك العبارة يتم اختصارها إلى p وذلك بسبب الحقيقة الحتمية التي تقول أن p^p↔p ممكن لحل هذه المشكلة أن نستخدم المنطق بالتوازي مع تقنيات التوزين (إعطاء أهمية للكلمة) مثل نظرية الاحتمالات أو القياسات المعتمدة على الإحصاء .

احتواء المعلومات(Information containment)

في الحالة العملية يتم ربط بين كلمتين عندما تكون أحد الكلمات تحوي معلومات عن الأخرى ولكن هذا ليس دائماً صحيح بالنسبة للمنطق الكلاسيكي حيث إنه يعاني من مشكلتين

المشكلة الأولى : عادة يتم الربط بين كلمتين باستخدام عملية الاقتضاء المنطقي p→qوالتي تكافئ ¬pνq وهذا يعني أن الإقتضاء دوما صحيح طالما الطرف الأول منه p خاطئ ولكن مثل هذه الحالة لا تعبر دوماً عن الحقائق العملية وكمثال على ذلك سمر تحب السباحة → 2+1=5


ولكن ذلك الاقتضاء يمكن أن يقرأه البعض بطريقة أفضل وهي أن إذا كانت p صحيحة فحتماً مستحيل أن تكون q خاطئة وقد تعني تللك العبارة أيضا للبعض p→q دوماً صحيح عندما يكون كل من p,q صحيحتان وهذا يقودنا إلى المشكلة الثانية لعملية الربط باستخدام الاقتضاء المنطقي لنمعن النظر في المثال التالي

الموز هو نوع من الفواكه→ 2+2=4

إن الاقتضاء السابق في المنطق الكلاسيكي صحيح لأن كلا طرفيه صحيحي ولكن لا يوجد أي رابط بين طرفيه بالأحرى هو بلا معنى ! ومن تلك المشكلتين السابقتين نستنتج أن النموذج المنطقي الكلاسكي يعجز في أغلب الأحيان عن تمثيل احتواء معلومة لمعلومة أخرى أي لا يستطيع أن يعبر عن الملائمة بين المستند الاستعلام والحلول البديلة يمكن أن نجدها في المنطق الشرطي أو نظرية الحالة حيث تغدو عملية الاقتضاء صحيحة عندما يكون كلا الطرفين مرتبطين معرفياً

النية أو القصد أو المعنى المرتبط بالسياق ( Intensionality)

من المعروف في أي لغة أنه يوجد لبعض الكلمات أكثر من مرادف مختلف والذي ينسب إلى سياق الجملة(الحديث) فعلى حسب السياق يمكن تحدد المعنى الصحيح للكلمة مثلاً كلمة bank قد تشير إلى النقود money أو تشير إلى اسم نهر في بلد ما وكما قلنا الذي يحدد المرادف الصحيح هو السياق ، وإذا انتقلنا إلى المنطق الكلاسيكي الذي يعالج المرادفات بعليمة الاقتضاء المنطقي كأن نقول bank→money وعندها أي ورود لكلمة bank في أي سياق في النص سيستبدلها بكلمة money حتى لو كانت تعني نهر bank الموجود في البلد الفلاني

ومن ذلك يتضح بشكل جلي عجز المنطق الكلاسيكي عن التعبير عن خاصية المعنى المرتبط بالسياق والمنطق الذي يعالج هذه الخاصية يسمى المنطق القصدي.

تدفق المعلومات (Flow of information)

إن المعلومات التي يحويها أي مستند يمكن أن تقسم إلى نوعين، النوع الأول المعلومات المذكورة بشكل صريح في المستند والنوع الآخر هي المعلومات التي تم استنتاجها من محتوى المستند الصريح وكمثال على ذلك “cross country skiing”. هي أحد أنواع Scandinavian sports و نستطيع القول أن المستند الذي ذكر فيه “cross country skiing” بشكل صريح يعبر عن أي استعلام عن Scandinavian sports حتى لو تكن الجملة الأخيرة مذكورة صراحة في المستند حيث إن ظاهرة احتواء المعلومات التي ذكرناها سابقا تعرف خاصية تدفق المعلومات وقد رأينا قصور المنطق الكلاسيكي في معالجة مثل هذه الحالات لأنه في بعض الحالات قد يمثل علاقات لا تعني بشيئ مفيد ولكنها تمثل إقتضاء صحيح من وجهة نظر المنطق الكلاسيكي والمنطق الذي يعالج هذه الحالات يسمى نظرية الحالة.

عدم الحتمية (Uncertainty)

إن عملية استنتاج (اشتقاق) الاستعلام من المستند هي عملية بحد ذاتها غير مؤكدة ولنوضح السبب في مثال لنفترض أن المستند يتكلم عن الحيوانات التي تعيش في القطب الشمالي والاستعلام كان عن طيور البطريق في هذه الحالة إن علاقة الاقتضاء من المستند إلى الاستعلام في المنطق الكلاسيكي تعني أن كل الحيوانات في القطب الشمالي هي طيور البطريق ولكن الحقيقة تقول غير ذلك ونستطيع القول أن ذلك الاقتضاء غير مؤكد يمتلك احتمال معين حتما لا يساوي الواحد وقد يكون أحد أسباب عدم الحتمية هو الجزيئة أي عدم كفاية المعلومات للقيام بعملية الاستدلال فعلى سبيل المثال لنفرض أنه وردنا كلمة bat في المستند لم نستطيع من خلال السياق الكشف فيما لو كانت هذه الكلمة تعني bat baseball أو flying mammal لذلك هنا عملية الاستدلال تعد غير حتمية وكلما كانت عملية الاستدلال غير حتمية أكثر كلما كانت موائمة المستند للاستعلام أقل وهذه الاحتمالية لا يمكن تمثيلها في المنطق الكلاسيكي ولكن بمحاولة تمثيل عدم الحتمية كمقدار كمي فإن هذا يساعد على قياس مدى موائمة المستند للاستعلام ومما يجعل النموذج يحقق خاصية ترتيب نتائج البحث ونستطيع معالجة هذه الحالة باستخدام نظريات عدم الحتمية الشهيرة مثل نظرية الاحتمالات أو نظرية المجموعات الترجيحية أو نظرية الدليل .

المنطق الغير الكلاسيكي

يعتبر المنطق الكلاسيكي قاصراً على تمثيل أهم خصائص نظام استرجاع المعلومات ولعل أبرز مشكلاته كانت عدم القدرة على إعطاء درجة ملائمة بين المستند والاستعلام (ترتيب النتائج) التي تشكل هي بحد ذاتها خاصة لا يمكن الاستغناء عنها في أي نظام استرجاع معلومات فعّال، حيث يتم فقط التعبير عن عملية الملائمة بالاقتضاء منطقي بسيط D→q ومن هنا انطلق العالم Van Rijsbergen عام 1986 بفكرته بتوسيع هذا الاقتضاء وجعله غير مؤكد أي يمتلك قيمة احتمالية وهو بفكرته هذه مهد الطريق لأبحاث عديدة تناولت الجوانب الآتية في البحث

  1. كيفية تمثيل المستند والاستعلام ومعرفة النظام
  2. نمذجة عملية الاستدلال اعتماداً على الاقتضاء غير المؤكد.

النموذج المعتمد على المنطق الشكلي (Modal Logic) والبيانات المفاهيمية (المعرفيّة)

يشبه المنطقُ الشكلي المنطق الكلاسيكي الذي تم شرحه سابقاً ولكنه يعتمد على تقييم صحة قضية نسبةً إلى عالَم معين والعوالم المرتبطة بِه, حيث يعبر عن الاستعلام كعبارة منطقية ويعتبر المستند عالم معين و عملية الملائمة بين المستند والاستعلام تعتمد على صحة العبارة المنطقية للاستعلام ضمن عالم المستند أو العوالم الأخرى المرتبطة بعوالم المستند وهنا تبرز لدينا قضية وهي تعريف عملية الارتباط بين عالمين التي تعتمد على مقدرة تحويل عالم معين ما d إلى عالم آخر dَ على سبيل المثال لا الحصر يمتلك العالَم dَ كلمات مرادفة للكلمات التي توجد في العالَم d . إن علاقة الارتباط بين عالمين تمتلك خصائص التي قد لا تكون محققة دوماً فمثلاً هنالك خاصة التعدية كأن نقول إن عالم المستند d مرتبط بعالم المستند dَ وعالم المستند dَ مرتبط بعالم المستند dً إذاً عالم المستند d مرتبط بعالم المستند dً ولكن يجب أن يؤخذ بعين الاعتبار أن خاصة التعدية قد تكون صحيحة أو قد تكون خاطئةً. ويسمح هذا المنطق أيضاً بتحويل الاستعلام والمعلومات إلى صيغة أخرى رسمية تتميز بالقدرة على الاستنتاج وهذه الصيغة الرسمية هي البيانات المعرفية والتي هي عبارة عن بيان مؤلف من مفاهيم وعلاقات مفاهيمية حيث يعتبر كل من الاستعلام والمستند بيانين معرفيين و عملية التحويل التي تكلمنا عنها آنفاً ما هي إلا مجموعة من العمليات التي تطبق على البيان المعرفي فمثلاً نستطيع تحويل بيان إلى آخر باستبدال مفهوم ما ضمن بيان بمفهوم آخر أعم.

مجال البحث في هذا النموذج مفتوح أمام كيفية البناء الآلي للبيان المعرفي للاستعلام والمستند.

ماهي البيانات المعرفية

هي صيغة رسمية لتمثيل المعارف (Knowledge Represntation)والتي تتميز بقدرتها الفائقة على تمثيل المعارف المعقدة وعالية الدقة وهناك الكثير من الأبحاث لتمديد نظرية البيان المعرفي لتمثيل المعرفة الغير المؤكدة. وتقوم فكرة استخدام البيان المعرفي في تمثيل نظام استرجاع المعلومات بشكل عام على تمثيل كل من المستند والاستعلام كبيان معرفي CGd, CGqومطابقة بين البيان المفاهيمي للمستند CGd مع البيان المفاهيمي للاستعلام CGq اعتماد على فكرة إسقاط بيان مفاهيمي على آخر باستخدام النموذج المنطقي ومن ثم كأي نموذج مطابقة لابد من إيجاد طريقة لترتيب النتائيج وفق منهجية معينة ونظريات في البيانات المعرفية.

تطبيقات عملية على النموذج المنطقي

وصلات خارجية


مراجع

Conceptual Graph Aboutness ,Computer Science Paper ,Theo Huibers and Iadh Ounis and Jean-Pierre Chevallet

LOGICAL MODELS IN INFORMATION RETRIEVAL(INTRODUCTION AND OVERVIEW), Computer Science Paper ,MOUNIALALMAS