المدونات في :

أرسل الإدراج التالي


اســمك مطلوب
بريدك الإلكتروني مطلوب
بريد صديقك الإلكتروني مطلوب
الرسالة 300 حرف كحد أعلى

محتويات الإدراج الذي تريد إرساله:
محرك البحث "عربي": القول والقول المردود (ثانيا ً)

ثانياً: تعليق على الآراء الواردة في نقاش حول " عربي" على إحدى المدونات

( يجب الإشارة في البدء أن المدونة التي ورد عليها هذا النقاش هي المدونة الخاصة بالأستاذ سميح طوقان الرئيس التنفيذي لمجموعة مكتوب، وشاركه من مسئولي مكتوب أحد الأشخاص تحت اسم "عصام" وأغلب الظن أنه الأستاذ عصام بايزيدي رئيس قسم تطوير المنتجات بمكتوب، ويمكن الوصول إلى المدونة من خلال الرابط التالي samih.maktoobblog.com ، وسيكون تعليقي على ما ورد بها حتى يوم 19 سبتمبر/ أيلول 2006 الساعة 12.10 مساء وهو توقيت آخر تعليق تم إرساله في المدى الزمني الذي أعلق عليه )

 

   :أ- تعليقات عامة 

1- "هذا يوم مهم في تاريخ الإنترنت العربية"

( ذكر ذلك الأستاذ سميح في سياق تأكيده على أهمية وجود محرك بحث عربي )

بالفعل هو كذلك أو بالأحرى سيكون كذلك عندما يوجد محرك البحث العربي الحقيقي الفعال الذي يقوم بدوره على الوجه الأمثل، وتكون سلبياته أقل من إيجابياته، ولكن التساؤل أين نحن الآن من ذلك؟!

2- أتفق تماماً مع الأستاذ سميح أن وجود أداة بحث عربية فعالة هو مشروع وطني حقاً، و يخدم المجتمع العربي والثقافة العربية والمواطنين العرب على اختلاف احتياجاتهم المعلوماتية في أنحاء وطننا العربي.

3- وأؤكد على أنه لابد من التفريق بين من يحبط العزائم وبين من يفيد في إنارة الطريق وتصحيح الأوضاع.

4- وأؤكد أيضاً أنه ليس مما يعيب الإنسان وطنيته أبداً، ولكن العيب في اختلال القيم الذي أصبح فيه من يلفظ كلمة الوطن والوطنية قبلة للتهكم والمتهكمين.

 

ب- تعليقات في قلب الموضوع:

 1- "إذا كانت محركات البحث موجودة دلنا على واحد منها؟؟؟؟"

رد بذلك الأستاذ سميح على الأستاذ قويدر عندما قال له "أنا لا أعلم ما الجديد في الموضوع ...لكن ومنذ 1996 ومحركات البحث العربية موجودة" أحيلك إلى تدوينة سابقة بها ذكر لعدد من محركات البحث فقط وردوا كمثال، وإذا كانت حجتك أنهم ليسوا محركات بل أدلة وأنهم يفهرسون المواقع ككل وليس الصفحات كما رددت في مدونتك : "أنت تتكلم على مواقع عبارة عن أدلة تسمي نفسها محركات بحث وهي عبارة عن قاعدة بيانات لأسماء المواقع" و " أن محرك البحث مشروع ضخم يفهرس عشرات الملايين من الصفحات"، عذراً أستاذ سميح فالكثير من الأدوات المذكورة في التدوينة التي أشرت إليك بالرجوع إليها ليس بها أي أدلة إطلاقاً (هذه واحدة)، وأيضاً تفهرس صفحات المواقع (هذه واحدة أخرى) مثل محركي أجوب و أمامك (وليلقي القارئ نظرة عليهما ويحكم بنفسه إذا ما كان هذين العنصرين متوافرين أم لا؟). وبما أني أكتب في سياق متخصص هنا فيجب أن أشير إلى تصويب مصطلح معين؛ هي عناوين المواقعTitles وليس "أسماء المواقع". وكما قلت لواحد من محدثيك في هذا النقاش "معلوماتك في الموضوع تحناج إلى توضيح" دعني أقول لك إن معلوماتك في الموضوع تحتاج إلى توضيح أيضاً، واسمح لي أن أوضح لك لماذا:

أولاً: الدليل ومحرك البحث فئتان أساسيتان من فئات أدوات البحث، كل من هما له دوره و أهميته ووظيفته، لا يغني أحدهما عن الآخر، فالذي يحكم التفضيل بينهما هي عوامل مرتبطة بحاجة المستفيد أو المستخدم وطبيعتها وطبيعة المجال الموضوعي المرتبطة به وغير ذلك من الأمور (وأعتقد أنه ستكون هناك تدوينة لاحقة عن عناصر البناء الفارقة بينهما والخصائص المميزة لكل منهما)

ثانياً: يحتوي مفهومك عن محركات البحث على لبس وخلط، فظنك أن محركات البحث هي تلك أدوات البحث التي تفهرس صفحات المواقع فقط هو أمرغير صحيح، وللعلم هناك دراسات تقيم أداء محركات البحث من حيث درجة استرجاعها للصفحات الرئيسية فقط للمواقع ( أي الموقع ككل وليس صفحات) مثل الدراسة

Which search Engine is best at finding airline site home pages?

http://research.microsoft.com/users/nickcr/pubs/craswell_tr01.pdf

(هذه الدراسة مجرد مثال فقط قريب من ذهني)، وربما يكون هذا اللبس نتيجة وسبب في نفس الوقت، وفي الحالتين هو نتيجة لإغفال أمور منطقية مبدئية وسبب لإغفال نفس الأمور أيضاً، ما هي هذه الأمور إذن؟، دعني أستعرضها لك:

- مستويات التحليل في المعالجة؛  فهناك المستوى الكلي Macro  والمستوى الجزئي Micro أو التحليلي Analytical ، فهناك الموقع كوحدة كلية وهناك صفحة الموقع كوحدة تحليلية (وتضم محركات البحث الإثنين معاً) ، مثل هذه المدونة (مستوى كلي) والتدوينات ذاتها (مستوى تحليلي بعناوين صفحاتها)، حاجات المستفيدين مختلفة قد يحتاج بعضهم الوصول للكل وقد يحتاج البعض الآخر الوصول للجزء، حتى المستفيد الواحد قد يحتاج هذا وذاك وفقاً لحاجته المعلوماتية المتغيرة.

- مستويات البحث ؛ فهناك بحث عن وثيقة بعينها وهناك بحث عن معلومة بعينها (وفقاً لحاجات المستفيد)، وعندما تبحث عن الأولى فقد تبحث عن وثيقة مفردة محددة وهنا تبحث عنها بالعنوان أو المؤلف، أو قد تبحث عن عدة وثائق في موضوع بعينه.

- مستويات أو أنواع المعلومات ذاتها؛ سواء معلومات ببليوجرافية Bibliographic أو حقائقية Factual أو نصية Textual.

 

    وهكذا كما ترى فحاجات المستفيد متنوعة والمعلومات التي يبحث عنها لتلبية هذه الحاجات متنوعة بالطبع، ولهذا كان التنوع في الأدوات، وليس لأقلل من شأن فئة لصالح أخرى!!، ولكل عيوبه ومزاياه. وتجدر الإشارة هنا إلى أن الدراسات التطبيقية المقارنة بين الأدلة ومحركات البحث قد أثبتت أنه على الرغم من قلة حجم التغطية في الأدلة مقارنة بمحركات البحث إلا أن الأدلة أكثر دقة في الاسترجاع والوصول إلى نتائج أكثر علاقة بموضوع البحث على عكس المحركات التي تضم تغطية أعلى ولكن كفاءة أقل.

 

2- وعندما ترد على نفس الشخص قائلاً "موقع أين عبارة عن دليل يحتوي عدة مئات أو عدة آلاف من أسماء المواقع.لا تستطيع فيه البحث عن المعلومات ضمن ملايين الصفحات العربية.جرب أن تبحث عن اسم معين أو معلومة معينة"

     لن أرد عليك كما رد عليك "وعلى ذمة أين فهم محرك بحث..مذكور على أول صفحة"، بل سأقول لك أدخل إلى أين الآن ستجد البحث من خلال صفحات الإنترنت، ستجد البحث في الصور، والبحث في الأخبار، حتى البحث في الصفحات الدينية متوافر (وأنا أتحدث هنا عن مجرد توافر هذه الملامح وليس عن تقييم هذا التوافر)، هذا بالإضافة إلى الدليل الذي تصر أنت على عدم وجود سواه، بمفاهيمك أنت أليس هذا محرك بحث ؟!!. (يمكنكم الدخول إلى أين ومعاينته www.ayna.com  )

3- "محرك البحث ليس قاعدة بيانات في المعنى التقليدي فهو تكنولوجيا متطورة ومكلفة جداً تحتوي على ما يسمى Crawler الذي يقوم بالطوفان بشكل مستمر على صفحات الإنترنت في جميع أنحاء العالم فإذا ما ظهرت صفحة فهو يقوم بفهرستها"

ذكر ذلك الأستاذ سميح في سياق توضيحه لمفهوم محرك البحث، أما تعليقي فسيكون كالتالي:

أولاً: أي محرك بحث يضم قاعدة بيانات كواحد من أهم مكوناته، قد تكون بسيطة، قد تكون معقدة، في النهاية هي قاعدة بيانات، ليس هو قاعدة البيانات إنما هي أحد مكوناته.

ثانياً: الـ Crawler لا يقوم بفهرسة المصادر هو يكتشف المصادر أيها السادة

ثالثاً: إن أي محرك بحث لابد له من أربعة مكونات رئيسية ( اختلفت الآراء حولهم وعددهم لكن أغلب الإنتاج الفكري يتفق على هذه المكونات الأربعة) وهي بترتيب دورها في منظومة عمل أداة البحث  :

1- أداة اكتشاف المصادر  crawler,spider,harvester,worm,robot كل هذه أسماء تشير إلى نفس الشئ أو المكون، وإن كان اقترح البعض تسمية جامعة للفئة كلها وهي Robot ، وهذا المكون دوره اكتشاف المصادر أو مواقع وصفحات الإنترنت Harvesting or Resource Diecovery .

( بالمناسبة كان اقتراح التسمية الجامعةRobot  في الدراسة التالية :

Nicholson, Scott . A Proposal for Categorization and Nomenclature for Web Search Tools . Journal Of Internet Cataloguing . Volume 2 Number 3/4 (2000) . pp 9-28 . (

2- برنامج التكشيف indexer ، ودوره تكشيف الصفحات التي تم تجميعها و القيام بعملية التكشيف indexing  وفقاً لسياسات التكشيف الخاصة بكل أداة.

3- قاعدة البيانات أو الكشاف نفسه index وهو الذي يضم مخرجات عملية التكشيف وهو الذي يتم البحث فيه.

4- محرك البحث search engine ، و يقصد به البرنامج الخاص الذي ينفذ عمليات البحث ويقوم بها داخل الكشاف أو قاعدة البيانات (يجب التفريق هنا بين المصطلحين في الاستخدام؛ محرك البحث كبرنامج وواحد من مكونات أداة البحث، ومحرك البحث الذي هو أداة البحث ذاتها)

     فلأكتفي الآن بهذه التعليقات، ويبقى أن أذكر أن واحداً من المسئولين في مكتوب تمنى أثناء النقاش لأحد المشاركين أن يرى بعينه الفرق الشاسع ما بين ما كان موجودا وما يتم توفيره، وأنا أدعوهم أيضاً لمعرفة بعض المؤشرات عن المحرك من خلال تجارب قياس بعض جوانبه في التدوينات التالية ليدركوا الفرق الشاسع.

 

 لكن قبل أذهب إلى التجارب دعوني أخطركم وأخطرهم بأمر ما في هذا الصدد:

     أترون هذه المدونة التي اكتب فيها الآن و كل منكم يقرأها الآن، أنتم تعلمون أنها على مدونات مكتوب أي نفس المجموعة صاحبة محرك البحث "عربي" أي أن المحرك أقرب إلى هذه المدونات، ومع ذلك وعلى الرغم أيضاً أن المحرك يقدم خدمة بحث خاصة في المدونات إلا أنك إذا حاولت البحث بعنوان هذه المدونة لن تجدها في قاعدة بياناته، و بالرغم من ذلك إذا بحثت بعنوانها في جوجول ستسترجعها مباشرة،  وتوقيت هذه الملاحظة الساعة 12.30 منتصف ليلة الأحد 29 أكتوبر ( وقد ضمن جوجول المدونة في قاعدة بياناته في اليوم التالي أو الذي يليه على الأكثر من إنشائها).

  

htolaib.maktoobblog.com

www.maktoobblog.com/htolaib

عربي: لا يسترجع المدونة بأي العنوانين

جوجول: يسترجع المدونة بالعنوان الأول

 

نفس الشئ بالنسبة لمدونة سميح طوقان ( على الرغم من أنها موجودة منذ نوفمبر 2005 كما يشير أرشيف المدونة) :

samih.maktoobblog.com

www.maktoobblog.com/samih

عربي: لا يسترجع المدونة بالعنوان الأول و يسترجعه بالثاني، ولا تسترجع أي صفحات من المدونة سوى الصفحة الرئيسية .

جوجول: يسترجع المدونة بالعنوانين معاً 

 

 

 



"لا يتحمّل مكتوب أيّة مسؤوليّة عن المواد الّتي يتم عرضها و/أو نشرها في مدوّنات مكتوب. ويتحمل المستخدمون بالتالي كامل
المسؤولية عن كتاباتهم وإدرجاتهم التي تخالف القوانين أو تنتهك حقوق الملكيّة أو حقوق الآخرين أو أي طرف آخر."