«لَبلِب» محرك بحث عربي يعتمد على نفسه وقدرات «زواحفه»

«لَبلِب» (lableb.com) هو محرك بحث عربي يعتمد على الذكاء الاصطناعي Artificial Intelligence، وهو بُنِيَ من الصفر، ولا يعتمد في نتائجه على محركات بحث اخرى… نستفيد من تجارب الآخرين في المحتوى العربي لنبني تجربة أفضل للمستخدم العربي». بتلك الكلمات المتوثّبة، ردّ القيّمون على محرّك البحث «لَبلِب» على أسئلة طرحتها «الحياة» عليهم عبر البريد الإلكتروني.

وقبل أيام قليلة، أطلقت «مختبرات لبيب» في دولة الإمارات العربيّة المتحدة النسخة التجريبية («بيتا» Beta) من محرك البحث العربي «لَبلِب» الذي يقدّم إجابات فوريّة لمستخدميه، اعتماداً على الذكاء الاصطناعي. وتزامنت تلك الانطلاقة مع استحداث الإمارات أول وزارة للذكاء الاصطناعي خليجيّاً وعربيّاً، أناطت مسؤوليتها إلى الوزير عمر بن سلطان العلماء (27 سنة) الذي يعتبر من أصغر الوزراء سناً في الدول العربيّة.

وعموماً، يعتمد عمل محرّكات البحث الرقميّة على أدوات ذكيّة تسمّى «زواحف الشبكة» Web Crawler، وهي تجوب الإنترنت على مدار الساعة، وتلتقط ما يستجد من معلومات وبيانات ووثائق وغيرها. وتضمن «الزواحف» تجدّد محرك البحث وتوسّعه، كما تتكامل مع قواعد بياناته. وأوضح القيّمون على «لَبلِب» أنّه يعمد إلى فهرسة الـ «ويب» العربي بكامله من طريق أدوات فهرسة خاصة، ولا يستثني صفحة عربية. وبعدها، يصفّي «لَبلِب» النتائج ويعيد ترتيبها بما يخدم تطوير تجربة مستخدميه، خصوصاً السرعة في الوصول إلى النتائج.

أهمية الذكاء الاصطناعي

يركز»لَبلِب» على تقنيات الذكاء الاصطناعي وتعلّم الآلة لتحسين الفهم المؤتمت للغة العربية. ويعد بقرب تقديم خدمات بحث باللغة العربية، تكون موجّهة إلى المؤسسات والشركات.

ورداً على سؤال عن كيفيّة تعامل «لَبلِب» وزواحفه مع مسألة المعادل الرقمي للحرف العربي Digital Equivalence of Arabic Letter، ذكّروا بأن تلك المسألة حُلّت من طريق «الترميز العالمي الموحّد» («يونيكود» Unicode). وأضافوا: «تستخدم أغلب المواقع العربية الحديثة ترميز الـ «يونيكود»، فيما تستعمل المواقع القديمة ترميزات آخرى، وهي معروفة ولا مشكلة في التعامل معها. هناك مشكلة لدى محركات البحث عموماً تتصل بالصفحات التي يُكتَبْ في شيفرتها أنّها تستخدم ترميزاً معيناً، ثم يتبيّن أنها تعتمد ترميزاً آخر. ويأتي ذلك من سوء تصميم تلك الصفحات، ما يؤدّي أيضاً إلى خفض ترتيبها من قبل محرّكات البحث». وأعطى مسؤولو «لَبلِب» إجابة عن المقاربة التي اعتمدت في التعامل مثلاً مع المحتوى العربي المكتوب في صفحات الـ «بي دي أف». وبيّنوا أنهم يملكون مكتبات برمجية خاصة بهم تساعدهم في قراءة محتوى تلك الصفحات بسهولة.

وفي السياق عينه، بيّن مسؤولو «لَبلِب» أنّ المحتوى المكتوب بما يعرف باسم «عربيزي» الشائع على صفحات الـ «سوشال ميديا»، هو في انحسار كبير وفق إحصاءاتهم التي استندت إلى تحليل الفهرس العربي الذي طوّروه بأنفسهم. وأضافوا: «سبب العربيزي هو الهواتف القديمة التي كان صعباً فيها التبديل بين اللغات. وحاضراً، تتيح الهواتف الذكية تبديل اللغة في شكل سهل جداً، ما أدّى إلى انحسار العربيزي».

وفي إجابتهم عن سياسة «لَبلِب» في الإعلانات، أوضحوا أنهم لم يطلقوا خدمة إعلانات حتى الآن، مفضلين التركيز على تحسين عمل المحرك وإجاباته الذكيّة الفوريّة.

وجاء في صفحة «من نحن» على موقع «لَبلِب» أنّه محرك بحث يعالج طبيعة المحتوى العربي على الإنترنت، كي يساعد المستخدم العربي للوصول إلى مبتغاه في شكل مباشر. ويتيح «لَبلِب» للمستخدم استثناء صفحات ذات مواضيع معينة من نتائج البحث، كالمواقع الدينيّة والمنتديات الاجتماعيّة ومواقع المنوعات، وهي أشياء منتشرة في المحتوى العربي حالياً لكنها تعيق الوصول إلى محتوى عربي مفيد. ويتيح «لَبلِب» الوصول إلى بعض المعلومات على هيئة إجابات مباشرة، من دون الضغط على روابط إلكترونيّة.

وأشار بيان عن إطلاق ذلك المحرك إلى أن المشروع «ما زال في مرحلة الإطلاق التجريبي، وستكون نتائج البحث في تطور شبه لحظي، عبر عمليات الفهرسة والأرشفة والتصنيف. إضافة إلى أن «لَبلِب» يتعلّم من طلبات البحث التي يقوم بها المستخدمون ما يؤدي أيضاً إلى تحسين النتائج». وأشار القيّمون على المحرك إلى أنّ فريقه يضم مجموعة مميزة من مهندسي الذكاء الاصطناعي في المنطقة العربيّة. واستطاع الفريق الحصول على بيانات مهمة عبر تحليل المحتوى العربي على الإنترنت وتصنيفه، والتعرف إلى مواضيعه، واللهجات المستخدمة في إنتاجه في كل بلد عربيّ، ونوعية المواقع العربية التي تغلب عليها المنتديات والمواقع الدينية والمنوعات.
_________
*الحياة

شاهد أيضاً

ابن ملكا البغدادي.. سبق غاليليو ونيوتن باكتشافاته

ابن ملكا البغدادي.. سبق غاليليو ونيوتن باكتشافاته يقطان مصطفى منذ منتصف القرن الحادي عشر وحتى …

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *