الأربعاء 6 يوليو 2022
مواقيت الصلاة
أبرز الأخبار
عدد اليوم
عدد اليوم
الإمارات
ابتسام المزروعي لـ«الاتحاد»: «نور» مساهم فعّال لاستراتيجية الإمارات للذكاء الاصطناعي
ابتسام المزروعي لـ«الاتحاد»: «نور» مساهم فعّال لاستراتيجية الإمارات للذكاء الاصطناعي
12 ابريل 2022 02:13

منى الحمودي (أبوظبي) 

أكدت الدكتورة ابتسام المزروعي، مدير وحدة الذكاء الاصطناعي لدى معهد الابتكار التكنولوجي،  أن معالجة اللغة الطبيعية تعد إحدى أهم مجالات الذكاء الاصطناعي والتعلم الآلي حالياً، ووفقاً لـ «موردور إنتليجنس» يُتوقع أن تصل قيمة قطاع معالجة اللغة الطبيعية حول العالم إلى 42.04 مليار دولار أميركي بحلول عام 2026، بمعدل نمو سنوي مركب يبلغ %21.5. 
وقالت: «تُعتبر معالجة اللغة الطبيعية على نطاق واسع مهمة بسبب قدرتها على دعم التعلم الفوري، أي تدريب نموذج لوظيفة معينة ثم إعادة استخدامه لنشاط مرتبط بها، وبالتالي توفير الوقت والتكلفة».
جاء ذلك في تصريحات لها بمناسبة إطلاق مشروع «نور» من قبل معهد الابتكار التكنولوجي، مركز الأبحاث العالمي وذراع الأبحاث التطبيقية التابع لمجلس أبحاث التكنولوجيا المتطورة.
وأضافت الدكتورة المزروعي: «إن إطلاق مشروع «نور» أكبر نموذج معالجة طبيعية للغة العربية في العالم حتى الآن، يعد إنجازاً كبيراً، وهو ليس سوى الخطوة الأولى ضمن جهود المعهد للمساهمة في استراتيجية الإمارات للذكاء الاصطناعي، عبر دعم دمج الذكاء الاصطناعي في القطاعات الاقتصادية الرئيسة، حيث تكمن أهمية هذا النموذج في إحداث ثورة في نماذج معالجة اللغة الطبيعية التي سوف تساعد في تمكين التحول الرقمي وتعلم الآلات ودعم الذكاء الاصطناعي.
وتابعت «تنتشر النماذج اللغوية الكبيرة ضمن مجال معالجة اللغة الطبيعية بقوة، ونفخر بتقديم هذا النموذج المتطور الذي يضم 10 مليارات عامل متغيّر، ويشكل أكبر نموذج معالجة طبيعية للغة العربية حول العالم، حيث تعد مجموعة البيانات العربية الضخمة والمتميزة التي جُمعت لتدريب النموذج ثمرة شهور من العمل الجاد، الذي تضمّن تنسيق واستخلاص وفلترة مصادر متنوعة، وسيصبح «نور» نموذج الاستكشاف المفضل للغة العربية بالنسبة للأكاديميين والشركات في كل أنحاء العالم.
أشارت الدكتورة ابتسام المزروعي إلى تنفيذ نموذج «نور» مهام متنوعة في مختلف المجالات بسهولة عبر تعليمات «اللغة الطبيعية»، حيث صمم باحثو المعهد قنوات شاملة لجمع البيانات عالية الجودة لبناء «نور» ، بما يضم عمليات لفلترة والتنسيق على نطاق واسع، كما أنشأ فريق الأبحاث لدى للمعهد خدمات مُحسّنة للتدريب والخدمة الموزعة على أوسع نطاق، وذلك لتوفير تطبيقات باستدلال فعال وتخصص نموذجي. 
وذكرت أن ما يميز الإنسان هو اللغة التي يتحدث ويكتب بها، لذلك فإن تطوير نموذج متقدم باستخدام الذكاء الاصطناعي لمعالجة اللغة الطبيعية يعد أمر بالغ الأهمية في العالم لدعم فهم الآلات للغة البشرية. مشيرةً إلى وجود نماذج باللغة الإنجليزية والصينية والكورية وهناك دول تعمل على هذه النماذج لتمكين الآلات من فهم لغتها مثل السويد، وغيرها.
ولفتت أنه من المهم تقديم نموذج متطور لفهم اللغة العربية، والتي تعد من أكثر اللغات تعقيداً وصعوبة، لذلك قام الباحثون في المعهد على استخدام آليات متطورة للذكاء الاصطناعي واستخدام بيانات ضخمة وعالية الجودة باللغة العربية لتدريب الآلة. وتعد مجموعة البيانات التدريبية المستخدمة لإنشاء «نور» أكبر مجموعات البيانات العربية عالية الجودة والعابرة للقطاعات في العالم، حيث تجمع بين بيانات الويب والكتب والشعر والمقالات الإخبارية والمعلومات التقنية لتوسيع نطاق تطبيق النموذج إلى حد كبير.
وقالت: عمل فريق العمل بشكل متواصل وجهود حثيثة لتوفير البيانات من الكتب والمقالات العلمية والأخبار، ونثمّن هنا دور صحيفة «الاتحاد» لدعمها في توفير الوصول إلى الكميات الهائلة من البيانات اللازمة في مرحلة التدريب من خلال توفير الوصول إلى بيانات ضخمة عالية الجودة باللغة العربية لتدريب وتعليم الآلة باستخدام آليات متطورة للذكاء الاصطناعي، بما يضمن الخروج بنتائج دقيقة لمخرجات عملية لنموذج «نور».
وأضافت: «كما تعاون فريق معهد الابتكار التكنولوجي من الباحثين المتقدمين والمتخصصين في الذكاء الاصطناعي ضمن وحدة الذكاء الاصطناعي التابعة له، مع «لايت أون»، شركة التكنولوجيا التي توفر تقنيات الذكاء الآلي على أوسع نطاق للمؤسسات، ووحّد الطرفان جهودهما في مبادرة لإحداث ثورة في نماذج المعالجة الطبيعية للغة العربية.»
أوضحت بأن معالجة اللغة الطبيعية مجال تركيز رئيس للباحثين لدى معهد الابتكار التكنولوجي كونها تعتبر على نطاق واسع مهمة بسبب قدرتها على دعم التعلم الفوري، أي تدريب نموذج لوظيفة معينة ثم إعادة استخدامه لنشاط مرتبط بها، وبالتالي توفير الوقت والتكلفة، كما أصبحت معالجة اللغة الطبيعية أداة مهمة لكشف ومنع انتشار الأخبار المزيفة والمعلومات المضللة، واستخدامه لاكتشاف التنمر عبر الإنترنت، حيث يتم تطوير تصنيفات للكشف عن استخدام اللغة المسيئة والمهينة، وكذلك التحريض على الكراهية.
كما يساعد استخدام الشركات لأدوات معالجة اللغة الطبيعية، على تقييم المواقف حول العلامة التجارية وتحديد المجالات المحتملة للتحسين، ورصد التعليقات السلبية بسرعة (والاستجابة بشكل استباقي)، واكتساب ميزة تنافسية. بالإضافة لذلك تدعم معالجة اللغة الطبيعية التفاعل مع الآلات وتسريع المهام التي تشمل الإجابة عن الأسئلة والترجمة الآلية والتلخيص. بالإضافة لذلك تحقق نماذج معالجة اللغة الطبيعية التي يتم ابتكارها عبر الجمع بين تقنيات التعلم الخاضعة وغير الخاضعة للإشراف نتائج أكثر دقة، خصوصاً في مجال تفسير النصوص.
وأوضحت بأنه تم تدريب «نور» على 128 وحدة معالجة رسومات من طراز A100، مستفيداً من نهج التوازي ثلاثي الأبعاد المتطور، مما يسمح بتوزيع العمليات الحوسبية وضمان الاستخدام الفعال لموارد الأجهزة المتاحة. كما تأسس نموذج«نور» لمعالجة اللغة الطبيعية على بنية «ترانسفومر» واسعة الانتشار، ويشابه نموذج وحدة فك التشفير ضمنه نموذج GPT-3 من حيث البنية وتمت برمجته لمعالجة المهام التولّدية.

مجالات التطبيق 
وفيما يتعلق بمجالات التطبيق المحتملة لمشروع «نور» للمعالجة الطبيعية للغة العربية، قالت الدكتورة ابتسام المزروعي، إنه عبر تطوير نموذج «نور» للمعالجة الطبيعية للغة العربية، يأمل المعهد في امتلاك أفضلية المبتكر الأول وتحقيق الريادة في هذا المجال المستقبلي وتحويل «نور» إلى نموذج الاستكشاف المفضل بالعربية للأكاديميين والشركات، نظراً لندرة تلك النماذج حالياً.
وأضافت قائلة:«وفرنا واجهة برمجة التطبيقات الخاصة بنموذج «نور» للجمهور، بحيث يمكن للمجتمع ككل الاستفادة منه، ومثل أي نموذج لمعالجة اللغة الطبيعية، نهدف لتطبيق «نور»عبر عدة مجالات. وتشمل تلك المجالات، تحليل المواقف (رصد وسائل التواصل الاجتماعي والبحث عن الاستجابات)، تصنيف النصوص، روبوتات المحادثة والمساعدين الافتراضيين، استخراج النص، الترجمة الآلية، تلخيص النص، معلومات ودراسات السوق والتصحيح التلقائي».
وفي الختام حول إطلاق اسم «نور» على المشروع، أفادت الدكتورة ابتسام المزروعي، بأن اسم نور من معنى الكلمة، وهو توصيل نموذج اللغة العربية هذا كونه سيساعد على تنوير العقول.

 

جميع الحقوق محفوظة لصحيفة الاتحاد 2022©