دراسة سدايا: النماذج اللغوية العربية الكبيرة تدعم حضور اللغة العربية الرقمي وتساعد على المنافسة العالمية
أكدت دراسة حديثة الدور المحوري للنماذج اللغوية العربية الكبيرة في تمكين حضور اللغة العربية في الفضاءات الرقمية وتعزيز قدرتها على المنافسة عالميًا. ويأتي ذلك بما يدعم حضور اللغة العربية في البيئة الرقمية، ويسرّع تبنّي الابتكار في المؤسسات، مبينة تصدر المملكة العربية السعودية قائمة الدول المطوّعة للنماذج اللغوية العربية عام 2025.
وسعت الدراسة التي أجرتها الهيئة السعودية للبيانات والذكاء الاصطناعي “سدايا”، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، إلى دعم تطوير منظومة الذكاء الاصطناعي باللغة العربية، وتحديد متطلبات تطوير نماذج أكثر قدرة على فهم اللغة العربية ولهجاتها المتنوعة، وتوليد المحتوى وتنفيذ التعليمات.
وتناولت الدراسة تاريخ تطور النماذج اللغوية العربية منذ بداياتها اعتمادًا على الأنظمة القائمة على القواعد قبل عام 2000م، مرورًا بالنماذج الإحصائية والشبكات العصبية، وصولًا إلى مرحلة النماذج اللغوية الكبيرة وتطبيقاتها التوليدية المعاصرة خلال الفترة من 2022 حتى 2025م، حيث شهدت هذه المرحلة إطلاق عشرات النماذج العربية، من بينها نماذج حوارية وأخرى توليدية موجّهة لدعم الاحتياج العربي في المجالات التقنية والتعليمية والمعرفية.
ورصدت الدراسة أكثر من (53) نموذجًا لغويًا عربيًا حتى الربع الأول من عام 2025م، وتصدرت المملكة العربية السعودية قائمة الدول المطوّعة لهذه النماذج؛ بينما أبدت جهات دولية اهتمامًا ملحوظًا بتطوير نماذج لغوية داعمة للغة العربية. وأظهرت التحليلات ضعف الاستثمار في النماذج اللغوية العربية الداعمة للصيغ الصوتية والبصرية، رغم أهميتها المستقبلية، إذ كانت (81%) من هذه النماذج أحادية الوسائط وتتعامَل مع النصوص فقط، فيما كانت نسبة النماذج متعددة الوسائط (7%).
أما من ناحية القدرات، فقد أوضحت الدراسة أن النماذج اللغوية العربية تضمنت ثلاث مهام رئيسية، وهي: فهم اللغة، وتوليد المحتوى، والمحادثة وتنفيذ التعليمات؛ بينما لا تزال القدرات المعرفية والاستدلالية وتعدد اللغات والدعم البرمجي منخفضة المستوى مقارنة بالنماذج اللغوية العالمية.
وفقًا لنتائج تقييم المقياس المعياري (بلسم) الصادر عن مجمع الملك سلمان العالمي للغة العربية الذي يقارن أداء النماذج اللغوية العربية بنظيراتها العالمية في المهام اللغوية العربية، فقد أظهرت تفوق النماذج العالمية في أغلبية فئات المهارات اللغوية، وعكست النتائج في الوقت ذاته نقاط قوة واعدة لبعض النماذج العربية في بعض المهام النوعية، وتفوقت بشكل طفيف في مهارة التلخيص، فيما قدمت أداءً مقاربًا في مهام الكتابة الإبداعية والفهم القرائي.
واستعرضت الدراسة الوضع الراهن للنماذج العربية، مشيرةً إلى وجود نماذج مطوّعة في دول عربية أبرزها المملكة العربية السعودية والإمارات، إضافةً إلى نماذج طُوِّرت في جهات دولية داعمة للغة العربية. وكشفت الدراسة عن وجود فجوات أبرزها محدودية أحجام النماذج وعدد معاملاتها مقارنة بالنماذج العالمية، وافتقار البيانات العربية الشاملة، وندرة المقاييس المرجعية العربية المتخصصة في تقييم الأداء.
وضعت الدراسة خارطة طريق توضّح خطوات عملية لتحقيق الريادة للنماذج اللغوية العربية الكبيرة، من خلال التركيز على توفير البيانات العربية بجودة عالية وشمولية لمختلف اللهجات والمجالات، وتطوير نماذج لغوية متعددة القدرات وأحجام متنوعة، وبناء مقاييس مرجعية عربية لتقييم جودة النماذج، بالإضافة إلى دعم تبنّي النماذج العربية محليًا عبر المؤسسات الحكومية والخاصة، ونشرها للاستخدام المجتمعي.
وتأتي هذه الدراسة في إطار التعاون بين “سدايا” ومجمع الملك سلمان العالمي للغة العربية، كخطوة نوعية تعكس اهتمام المملكة بالجمع بين الهوية اللغوية والثقافية والتطور التقني، والعمل على ضمان حضور اللغة العربية في منظومة الذكاء الاصطناعي العالمية. ويساهم هذا التعاون في تعزيز مكانة المملكة باعتبارها مركزًا إقليميًا رائدًا في تطوير تقنيات اللغة العربية وتمكين المحتوى العربي الرقمي.
شبكة الأخبار المتحدة – UNN العربية
منصة إعلامية مستقلة تقدّم أخباراً موثوقة وتحليلات موضوعية، وتسعى إلى تعزيز السلام والحوار الثقافي حول العالم، لنقل الحقيقة وبناء جسور التفاهم بين الشعوب.
للمزيد من الأخبار يمكنكم زيارة صفحتنا الرئيسية:
https://un-news.org
