كانت أمريكا اللاتينية مهد الأنواع الأدبية والموسيقية الشهيرة على مستوى العالم ، والأطعمة الأساسية مثل البطاطس والإلهام وراء الوجبة السعيدة المعروفة. يمكن أن تصبح أيضا مهد شكل جديد من الذكاء الاصطناعى.
يعمل تحالف من مؤسسات الأبحاث على ما يسمونه latamgpt – وهي أداة يمكن أن تأخذ في الاعتبار الفروق اللغوية في المنطقة والخبرات الثقافية و “الخصوصيات”.
والهدف من ذلك هو تقديم نظرة خاطفة أكثر إثارة للخلاف على الأمريكتين ومنطقة البحر الكاريبي أكثر من تلك الموجودة في نماذج اللغة الكبيرة (LLMs) التي جاءت في الغالب من الشركات الأمريكية أو الصينية وتم تدريبهم إلى حد كبير باللغة الإنجليزية.
وقال رودريغو دوران روجاس ، مدير المركز الوطني للذكاء الاصطناعي في تشيلي ، الذي ينسق الجهد: “نريد تطوير قدراتنا ، وإيجاد حلول محلية قائمة على الذكاء الاصطناعي ونخلق فهمًا أفضل لهذه الأدوات في أمريكا اللاتينية وعن أمريكا اللاتينية”.
قال دوران روجاس إنه لأغراض عامة ، سيتم الضغط على المشروع بشدة للتنافس مع “النماذج الفنية التي تحتوي على ميزانيات بملايين ملايين” ، لكن “ما يمكن أن يقدمه نموذجنا أن الآخرين لا يكونون أكثر ثراءً وتمثيليًا لأمريكا اللاتينية والكاريبي ،” شعبها ومخرجاتها.
على سبيل المثال ، قال Durán Rojas إن الاختبار الأولي أظهر أن Latamgpt قد حقق نتائج أفضل بكثير عند الاستعلام عن تاريخ أمريكا الجنوبية ، وأن الشيء نفسه متوقع عندما يُطلب من LLM ، على سبيل المثال ، كتابة قصيدة بأسلوب المؤلفين المحليين أو تقديم نظرة عامة على سياسة التعليم الإقليمي.
هناك أكثر من 30 مؤسسة متورطة في تطوير Latamgpt من البلدان في جميع أنحاء نصف الكرة الأرضية ، ويشمل المتعاونون اللاتينيون في الولايات المتحدة مثل Freddy Vilches Meneses ، أستاذ مشارك في الدراسات الإسبانية في كلية لويس آند كلارك في ولاية أوريغون. وقال إن هذا تقديرا لكيفية “تجارب لاتيني وأمريكا اللاتينية هي زمالة ثقافية تتجاوز الجغرافيا”.
وقال فيلش مينسيس: “هناك عناصر من أمريكا اللاتينية في ولاية أوريغون ، في كاليفورنيا ، في تكساس”. “نريد التأكد من دمج تلك التجربة اللاتينية أيضًا.”
تم الإعلان عن Latamgpt ، التي تهدف إلى إطلاق أول نسخة متوفرة للجمهور في يونيو ، الشهر الماضي في أعقاب التزام إقليمي تم تقديمه خلال قمة حول الذكاء الاصطناعي في أوروغواي للتركيز على “الأخلاق والشاملة والمفيدة” للتنمية التكنولوجية “للترويج وحماية حقوق الإنسان” واستكشاف أفضل السياسات العامة الممكنة لحكم AI.
يتبع هذا الاندفاع امتصاصًا متزايدًا في منطقة التقدم التكنولوجي مثل استخدام الطائرات بدون طيار لمراقبة إزالة الغابات في غابات الأمازون المطيرة ، وتطوير التطبيقات لتشجيع المزيد من الناس على مواصلة تعلم اللغات الأصلية ، أو إنشاء الخوارزميات للمساعدة في البحث عن الإجراءات التي تختفي.
يتم الآن استخدام بعض تلك المستندات المحفوظة كمصادر لتدريب Latamgpt ، إلى جانب الأوراق والسجلات والسجلات التي أتاحتها المؤسسات مثل المكتبات والمحفوظات الوطنية على وجه التحديد للمشروع. وقال دوران روجاس إن هذا يمنح النموذج المزيد من الفوارق والاتساع المترجمة أكثر من بيانات الإنترنت العامة التي تميل إلى استخدام أنظمة أخرى.
وقال دوران روجاس: “سيكون لدى Latamgpt سياق أكثر من اللغات النموذجية الأخرى ، وبالتالي ينبغي أن يهدأ أقل بكثير” عندما يتعلق الأمر بحالات الاستخدام. الهلوسة هي ما يسميه باحثو الذكاء الاصطناعى عندما يصنع نموذج ما على ما يبدو إجابة غير صحيحة أو خاطئة على الرغم من أنها تم تقديمها على أنها واقعية.
حتى الآن ، تحتوي مجموعة بيانات المشروع على أكثر من 8 تيرابايت من المعلومات حتى يمكن أن يعمل النموذج على حوالي 55 مليار معلمة (المتغيرات التي تقوم بها LLM بإخراج التنبؤ ، مثل الخلايا العصبية التي تتزامن أو تواصل في الدماغ البشري). قال دوران روجاس إن هذا قريب إلى حد ما من أول نسخة عامة من ChatGPT عندما أطلقتها Openai في خريف عام 2022.
تحديات لهجات متنوعة وقواعد معقدة
كما سعت ChatGPT وغيرها من الطرز مثل Google Gemini في السنوات الأخيرة لتشمل نطاقًا أوسع من البيانات لتقديم البرامج بلغات أخرى غير اللغة الإنجليزية و “التوطين” – مثل LLM مع العلم بالرد في النظام المتري عندما تكون ذات صلة أو لفهم التعبيرات.
تعترف تلك الشركات بأهمية توسيع هذا العرض. قالت Hyunjeong Choe ، مديرة الهندسة والتدويل لتطبيقات Google Gemini ، إنها “تجربة مخصصة” يمكن أن تكون “ضرورية للملاءمة الثقافية والحساسية”.
لكنهم يدركون أيضًا أنه مسعى معقد بشكل خاص ، لأن معظم بيانات التدريب المتاحة لهم هي باللغة الإنجليزية. وقال تشوي: “إن تعقيدات اللغات المختلفة يمكن أن تشكل عقبة كبيرة بالنسبة لجميع نماذج الذكاء الاصطناعي … قد تكون اللغات ذات القواعد النحوية المعقدة أو لهجات متنوعة أو موارد رقمية محدودة أكثر صعوبة في التدريب”.
قامت Latamgpt ، من خلال شبكاتها المؤسسية مع المكتبات والمحفوظات ، إلى حد ما إلى حد ما – ولكن ليس تمامًا. قال دوران روجاس إنهم ما زالوا يكافحون لدمج اللغات الأصلية التي يتحدث بها الملايين في المنطقة لأن الوثائق المكتوبة ليست متاحة على نطاق واسع.
لكنهم ما زالوا يهدفون إلى المحاولة لأنها تتقن نموذجها باستمرار – على الرغم من أنها تشدد على أهمية التعاون.
وقال Vilches Meneses ، أستاذ لويس آند كلارك: “جودة وسمات النتائج التي يمكننا الحصول عليها تعتمد علينا مع انضمام أمريكا اللاتينية للمساهمة بقدر ما يمكننا”.
حاليًا ، مع تاريخ إطلاق يونيو المبدئي ، لا يزال LATAMGPT يتلقى البيانات كمتعاونين يقومون بانتظام مع أسئلة محددة لقياسها مقارنة بالنماذج الأخرى المتاحة.
من بين الأسئلة التي يختبرونها استفسارات في العديد من الأسماء والمصطلحات المختلفة المستخدمة في المنطقة للحصول على كلمة محددة مثل “سيارة” ، أو طلب لـ GPT لتقديم مخطط مقارنة لكيفية استجابة دول المنطقة للهجرة الجماعية من أماكن مثل فنزويلا.
هناك هدف كبير من Latamgpt هو التعرف على هذه التطورات التكنولوجية حتى يمكن إدراجها في السياسات واللوائح العامة ، وفقًا لدورين روجاس.
لذلك ، فإن إنشاء شبكة transcontinental للمساعدة في تطوير المشروع أمر أساسي ، ومن المحتمل أن يظل Durán Rojas كذلك.
يقول: “الجانب الأكثر أهمية ، أعظم إرث ، هو هذا الترابط الذي وجدناه لتعزيز وتطوير الحلول القائمة على الذكاء الاصطناعي”. “النموذج ، أعني أنه من الرائع أن نجعله ، لكن التعاون – هذا هو ما سيؤثر أكثر على كيفية بناء الأشياء للمضي قدمًا.”
ومع ذلك ، هناك فرصة متزايدة لتقديم المزيد من المساهمات مع لمسة لاتينية.
“في قاعدتها ، هذا يخلق بشكل مشترك شيئًا من أمريكا اللاتينية لأمريكا اللاتينية وللحصول على العالم ، كدليل على أنفسنا وللآخرين ، يمكننا أيضًا إنتاج تقنية عالية ،” قال Vilches Meneses ، “ويمكننا أن نساهم في معرفة الذكاء الاصطناعي بينما لا نزال نستخدم الذكاء الاجتماعي والثقافي”.
تم نشر نسخة سابقة من هذه القصة لأول مرة بواسطة Noticias Telemundo.
تم نشر هذا المقال في الأصل على NBCNews.com
اترك ردك