أولاً: تعليق على الخبر الخاص بانطلاق المحرك الذي نشر في 14 سبتمبر 2006 على أخبار مكتوب
1- " أول وأقوى محرك بحث عربي على شبكة الإنترنت يستخدم قواعد اللغة العربية في عمليات ونتائج البحث"
- بالنسبة لموضوع أول هذه لقد تحدثت فيها في المدونتين السابقتين.
- ولكنه هنا جاء بصفة جديدة وهي "أقوى" وينطبق عليها أيضاً كثيراً مما قلته سلفاً.
- لكن الجديد الأهم هنا هو ربطه بقيمة موضوعية ( الأول الذي يفعل كذا ) وهي هنا "يستخدم قواعد اللغة العربية"، ولهذا الأمر ثلاثة أبعاد :
أولهم: هل هو الأول بالفعل الذي يقوم بذلك أي استخدام قواعد اللغة العربية ومراعاة خصائصها في عملية الاسترجاع؟! أشك في ذلك، لماذا؟، سأضرب مثالاً واحداً جاء بذهني يجعلني أشك في العبارة ألا وهو محرك البحث الهدهد فنظرة سريعة إلى صفحة(البحث التفصيلي) وصفحة (عن الهدهد) تؤكد أنه يستخدم ( أو كان يستخدم ) قواعد اللغة العربية، وهذا المحرك قد ظهر في عام 2004، وهناك غيره من قام بذلك أيضاً في السنوات السابقة.
ثانيهم: إن بناء أداة بحث عربية على الإنترنت لا تقوم فقط على معالجة اللغة العربية آلياً ومدى توافر ذلك في الأداة، فهذا هو مجرد جانب واحد فقط ( بتفاصيله المتعددة ) من جوانب وعناصر بناء أداة البحث كنظام استرجاع للمعلومات، ولعلي لا أكون متجاوزاً إن قلت أنه ليس هو الجانب الأهم، قد تتساءل لماذا أقول ذلك؟ دعني أوضح لك: إذا كان لديك نظام استرجاع لأي نوع من أنواع الأوعية وكانت قدرته على مراعاة الخصائص اللغوية أكثر من ممتازة ولكنه يفتقد أسس تنظيم ومعالجة وإتاحة هذا المجتمع من الأوعية، بمعنى أنه سيكون قادراً على البحث لغوياً بشكل جيد في مجموعة عشوائية غير منتظمة أو معالجة وغير مضبوطة، فماذا ستكون النتيجة؟!!
ثالثهم: إن الجانب اللغوي في تصميم نظم الاسترجاع عموماً ومنها أدوات البحث لا تقتصر فقط على الجانب الخاص بالمعالجة الآلية لخصائص اللغة ولكن للأمر أبعاد أخرى ( سأحاول أن آتي على ذكرها في تدوينة تالية )
ملحوظة خارج السياق:
لاحظت أن أغلب أدوات البحث العربية التي تظهر تركز على ثلاثة أبعاد فقط في الترويج لنفسها غالباً:
الأول هو معالجة اللغة العربية آلياً.
الثاني هو فلترة أو ترشيح المواقع لمراعاة الثقافة العربية
الثالث هو حجم قاعدة البيانات ( أي التغطية )
وكلها أمور على أهميتها بالطبع إلا أنها ليست وحيدة في منظومة بناء أدوات البحث، كما أنه يشوبها الخلط المفاهيمي أحياناً مثل البعد الأول كما ذكرنا، والبعد الثالث حيث يفتقد أغلب هذه الأدوات للمفهوم الوعائي، ومفهوم الوحدة الببليوجرافية في التعامل مع مجتمع المصادر، وكل همهم أن يذكروا الرقم الأكبر في عدد ما تحتويه قاعدة البيانات، وعلى افتراض أني أملك قاعدة بيانات كبيرة جداً حسب تصوري دون وجود ما يسمح بتحقيق كفاءة الاسترجاع من هذه القاعدة ففيم ينفعني إذن هذا الاتساع في حجمها.
2- " يعد هذا المشروع ... زواره بنتائج بحث مذهلة ومتفوقة"