كشف مركز أبوظبي للأبحاث المبتكرة عن أكبر نموذج لمعالجة اللغة العربية في العالم.
تعد معالجة اللغة الطبيعية ، أو NPL ، جزءًا أساسيًا من قطاع الذكاء الاصطناعي المزدهر ، حيث تساعد أجهزة الكمبيوتر في فك تشفير الكلمات المنطوقة والمكتوبة لتسريع تطوير كل شيء بدءًا من أدوات الترجمة اللغوية إلى المساعد الذكي على غرار Siri و Alexa.
قد يمنح نموذج نور ، الذي تم تطويره في معهد الابتكار التكنولوجي ، العالم العربي ميزة جديدة في الدفع الرقمي نظرًا لأن أدوات مثل روبوتات المحادثة وذكاء السوق والترجمة الآلية معرضة جدًا للأسواق الناطقة باللغة الإنجليزية والصينية.
تتمثل الأولوية في إيجاد الطرق التي ستخدم بها نور الشركات والأكاديميين لبناء أدوات جديدة ، مثل توفير تحليل المشاعر على وسائل التواصل الاجتماعي ، أو تطوير مساعدين افتراضيين جدد باللغة العربية ، دكتورة ابتسام المزروعي ، مديرة معهد دراسات الترجمة التي قادت المشروع. وطني.
لكنها قالت إن نسخة أصغر من نور ستكون متاحة أيضًا للجمهور كنموذج مفتوح المصدر.
“نحن نريد [Noor] ساهمت في المجتمع “.
حجم نور كبير. في البرمجة اللغوية العصبية ، يعتمد حجم نموذج معين على عدد القيم التي يتم تدريب النموذج عليها. تُعرف هذه القيم بالمعلمات ، وهي اللبنات الأساسية للتعلم الآلي. كلما زاد عدد المعلمات ، كان نموذج البرمجة اللغوية العصبية أكثر تعقيدًا وقدرة.
قبل ذلك ، كان أكبر نموذج عربي متاح هو AraGPT ، وهو نموذج تم تدريبه على 1.5 مليار متغير. تم تدريب نور على 10 مليارات معلمة ، بما في ذلك مجموعة البيانات التي تجمع بين بيانات الويب والكتب والشعر والمقالات الإخبارية والمعلومات التقنية لتوسيع التطبيقات التي يمكن بناؤها بشكل كبير.
وفقًا لـ TII ، هذه هي مجموعة البيانات العربية من بين أعلى المجالات جودة على الإطلاق.
قال الدكتور المزراوي: “على مقياس 10 مليارات ، يمكن لنموذجنا التعامل مع مهام أكثر تقدمًا واتخاذ تعليمات أكثر تعقيدًا من إنسان إلى آلة”.
“على سبيل المثال ، يمكنه تلخيص النصوص ، والمساعدة في الكتابة – على سبيل المثال ، بيان صحفي. ويمكن استخدامه أيضًا لتشغيل روبوتات محادثة أكثر طبيعية وكفاءة ، أو حتى تقييم مستوى لغة الموظفين. هذه هي البداية فقط ، ونحن نريد لزيادة النماذج الكبيرة والخاصة. يمكنك فعل المزيد في المستقبل. “
يعتبر TII ، ذراع الأبحاث التطبيقية في مجلس أبوظبي لبحوث التكنولوجيا المتقدمة ، جزءًا مهمًا من جهود دولة الإمارات العربية المتحدة للتنويع بدلاً من الاعتماد على صادرات النفط وتطوير اقتصاد قائم على المعرفة. نور هي الخطوة الأولى في جهود مركز الأبحاث للمساهمة في استراتيجية الإمارات العربية المتحدة الأوسع للذكاء الاصطناعي من خلال تسريع تبني وتكامل الذكاء الاصطناعي في الاقتصاد الأوسع.
قال الدكتور راي جونسون ، الرئيس التنفيذي لشركة TII: “لقد أثبت فريق الخبراء لدينا مرة أخرى أن هذه المنطقة يمكن أن تحقق نتائج رائدة في مجال البحث والتطوير للتأثير على العالم”.
تم التحديث: 15 أبريل 2022 ، 3:49 مساءً
“هواة الإنترنت المتواضعين بشكل يثير الغضب. مثيري الشغب فخور. عاشق الويب. رجل أعمال. محامي الموسيقى الحائز على جوائز.”