معهد الابتكار التكنولوجي يقدم أكبر نموذج عربي في البرمجة اللغوية العصبية في العالم

شركة ابتكار التكنولوجيا (TII) ، مركز أبحاث عالمي ، قدّم NOOR ، أكبر نموذج لمعالجة اللغة العربية في العالم (NLP) حتى الآن. ينفذ نموذج NOOR مجموعة متنوعة من الوظائف عبر المجال.

لإنشاء NOOR ، صمم الباحثون في TII خط أنابيب من طرف إلى طرف لجمع بيانات عالية الجودة ، بما في ذلك الزحف والترشيح والتنظيم في القياس. طور المتخصصون في TII أيضًا خدمات مثالية للتدريب والخدمة الموزعة المكثفة ، لتوفير التطبيقات ذات الاستدلال الفعال والخبرة النموذجية.

انضم إلى هذا الجهد فريق من الباحثين والخبراء المتقدمين في وحدة مركزية الذكاء الاصطناعي (AI) في TII. خفيفةشركة تكنولوجيا تُحدث ثورة في نماذج البرمجة اللغوية العصبية العربية ، وتفتح ذكاءً آليًا مكثفًا للشركات.

أستاذ. مروان دباقال الباحث الرئيسي ، مركز أبحاث العلوم الرقمية ووحدة مراكز الذكاء الاصطناعي الشاملة ، TII: “لقد وسّع الجيل الجديد من نطاق النموذج العربي القياسي الحديث من خلال تعزيز المعرفة في نماذج اللغات الكبيرة لإنشاء TII ، عبر- النظام والقطع بمئات هذا الجيل الجديد متخصص في أبحاث الذكاء الاصطناعي.

قاعدة بيانات Noorin التدريبية هي أكبر قاعدة بيانات عربية عالية الجودة في العالم تجمع بين بيانات الويب والكتب والقصائد والمقالات الإخبارية والمعلومات التقنية لتوسيع نطاق تطبيق النموذج بشكل كبير.

دكتور. ابسوم المسروي، مدير وحدة مركزية الذكاء الاصطناعي ، TII ، قال: “لقد اقتحمت نماذج اللغات الكبيرة عالم معالجة اللغة الطبيعية ، ونحن فخورون بتقديم هذا النموذج المتطور مع 10 مليار معلمة – أكبر نموذج عربي في البرمجة اللغوية العصبية في العالم.، هو نتيجة لعدة أشهر من العمل الشاق الذي تضمن معالجة وكشط وتصفية المصادر المختلفة.

READ  تهدف استوديوهات رايس إلى الارتقاء بالمنطقة على مستوى العالم ، كما تقول المؤسس المشارك أماندا تورنبول

وأشار د. كنموذج لوحدة فك التشفير فقط في إطار عمل مثل GPT-3 ، فقد تم تصميمه لمعالجة المهام التي تم إنشاؤها باستخدام بنية محسّنة لتعكس أحدث التطورات في عالم التعلم الآلي ، بما في ذلك التحسينات مثل التضمين المتقدم. للمساعدة في ضمان الجودة في قاعدة بيانات نور ، صمم فريق TII خط أنابيب ترشيح آلي يعتمد على تقنيات التعلم الآلي. تتعرف هذه الأدوات على النص كمراجع قياسية وتحمي العينة من التعرض لمحتوى البريد العشوائي.

من خلال الترقية إلى أحدث التوازي ثلاثي الأبعاد ، تم تدريب نور على مورد حوسبة عالي الأداء مع 128 وحدة معالجة رسومات A100 ، مما يتيح توزيع الحسابات ويضمن الاستخدام الفعال لموارد الأجهزة المتاحة.

وأشار د.

LEAVE A REPLY

Please enter your comment!
Please enter your name here