تم تدريب الذكاء الاصطناعي التوليدي على قرون من الفن والكتابة التي أنتجها البشر.
لكن العلماء والنقاد تساءلوا عما يمكن أن يحدث بمجرد اعتماد الذكاء الاصطناعي على نطاق واسع والبدء في التدريب على مخرجاته.
تشير دراسة جديدة إلى بعض الإجابات.
في يناير 2026، نشر باحثو الذكاء الاصطناعي أرند هينتزي وفريدا بروشينغر أوستروم وجوري شوساو دراسة توضح ما يحدث عندما يُسمح لأنظمة الذكاء الاصطناعي التوليدية بالعمل بشكل مستقل – توليد وتفسير مخرجاتها الخاصة دون تدخل بشري.
ربط الباحثون نظام تحويل النص إلى صورة بنظام تحويل الصورة إلى نص، وسمحوا لهم بالتكرار – الصورة، التسمية التوضيحية، الصورة، التسمية التوضيحية – مرارًا وتكرارًا.
وبغض النظر عن مدى تنوع مطالبات البداية – وبغض النظر عن مدى العشوائية المسموح بها للأنظمة – فقد تقاربت المخرجات بسرعة في مجموعة ضيقة من الموضوعات المرئية العامة والمألوفة: مناظر المدينة الجوية، والمباني الفخمة، والمناظر الطبيعية الرعوية. والأمر الأكثر إثارة للدهشة هو أن النظام “نسي” بسرعة موجه البداية الخاص به.
أطلق الباحثون على النتائج اسم “موسيقى المصاعد المرئية” – ممتعة ومصقولة، لكنها خالية من أي معنى حقيقي.
على سبيل المثال، بدأوا بالصورة السريعة، “رئيس الوزراء ينكب على وثائق الإستراتيجية، محاولًا إقناع الجمهور باتفاق سلام هش بينما يتنقل بين ثقل وظيفته وسط العمل العسكري الوشيك”. ثم تمت تسمية الصورة الناتجة بواسطة الذكاء الاصطناعي. تم استخدام هذه التسمية التوضيحية كمطالبة لإنشاء الصورة التالية.
بعد تكرار هذه الحلقة، انتهى الباحثون إلى صورة لطيفة لمساحة داخلية رسمية – لا يوجد أشخاص، ولا دراما، ولا إحساس حقيقي بالزمان والمكان.
باعتباري عالم كمبيوتر يدرس النماذج التوليدية والإبداع، أرى أن نتائج هذه الدراسة جزء مهم من النقاش حول ما إذا كان الذكاء الاصطناعي سيؤدي إلى الركود الثقافي.
تظهر النتائج أن أنظمة الذكاء الاصطناعي التوليدية نفسها تميل نحو التجانس عند استخدامها بشكل مستقل ومتكرر. حتى أنهم يقترحون أن أنظمة الذكاء الاصطناعي تعمل حاليًا بهذه الطريقة افتراضيًا.
المألوف هو الافتراضي
قد تبدو هذه التجربة في غير محلها: معظم الناس لا يطلبون من أنظمة الذكاء الاصطناعي أن تقوم بوصف وإعادة إنشاء صورهم الخاصة إلى ما لا نهاية. حدث التقارب مع مجموعة من الصور المخزنة اللطيفة دون إعادة تدريب. لم تتم إضافة أي بيانات جديدة. لم يتم تعلم أي شيء. لقد ظهر الانهيار نتيجة الاستخدام المتكرر فقط.
لكنني أعتقد أن إعداد التجربة يمكن اعتباره أداة تشخيصية. إنه يكشف ما تحافظ عليه الأنظمة التوليدية عندما لا يتدخل أحد.

وهذا له آثار أوسع نطاقا، لأن الثقافة الحديثة تتأثر بشكل متزايد بهذا النوع من الأنابيب على وجه التحديد. يتم تلخيص الصور في النص. يتم تحويل النص إلى صور. يتم ترتيب المحتوى وتصفيته وتجديده أثناء تنقله بين الكلمات والصور ومقاطع الفيديو. من المرجح الآن أن يتم كتابة المقالات الجديدة على الويب بواسطة الذكاء الاصطناعي أكثر من البشر. حتى عندما يظل البشر في الحلقة، فإنهم غالبًا ما يختارون من بين الخيارات التي أنشأها الذكاء الاصطناعي بدلاً من البدء من الصفر.
تظهر نتائج هذه الدراسة الحديثة أن السلوك الافتراضي لهذه الأنظمة هو ضغط المعنى نحو ما هو أكثر دراية، ويمكن التعرف عليه، وسهل التجديد.
ركود ثقافي أم تسارع؟
على مدى السنوات القليلة الماضية، حذر المتشككون من أن الذكاء الاصطناعي التوليدي يمكن أن يؤدي إلى ركود ثقافي من خلال إغراق الويب بمحتوى اصطناعي تتدرب عليه أنظمة الذكاء الاصطناعي المستقبلية. وبمرور الوقت، كما تقول الحجة، فإن هذه الحلقة التكرارية من شأنها أن تؤدي إلى تضييق نطاق التنوع والابتكار.
لقد تراجع أبطال التكنولوجيا، مشيرين إلى أن المخاوف من التدهور الثقافي تصاحب كل تكنولوجيا جديدة. ويجادلون بأن البشر سيكونون دائمًا الحكم النهائي للقرارات الإبداعية.
والأمر المفقود في هذه المناقشة هو الأدلة التجريبية التي تظهر أين يبدأ التجانس فعلياً.
لا تختبر الدراسة الجديدة إعادة التدريب على البيانات الناتجة عن الذكاء الاصطناعي. وبدلا من ذلك، فإنه يظهر شيئا أكثر جوهرية: يحدث التجانس قبل أن تدخل إعادة التدريب إلى الصورة. إن المحتوى الذي تنتجه أنظمة الذكاء الاصطناعي التوليدية بشكل طبيعي – عند استخدامه بشكل مستقل ومتكرر – هو بالفعل مضغوط وعام.
وهذا يعيد صياغة حجة الركود. ولا يقتصر الخطر على احتمال تدريب النماذج المستقبلية على المحتوى الناتج عن الذكاء الاصطناعي فحسب، بل إن الثقافة التي يتوسطها الذكاء الاصطناعي تتم بالفعل تصفيتها بطرق تفضل المألوف، والقابل للوصف، والتقليدي.
ومن شأن إعادة التدريب أن تؤدي إلى تضخيم هذا التأثير. لكنه ليس مصدره.
هذا ليس الذعر الأخلاقي
المتشككون على حق بشأن شيء واحد: لقد تكيفت الثقافة دائمًا مع التقنيات الجديدة. التصوير لم يقتل الرسم. السينما لم تقتل المسرح. أتاحت الأدوات الرقمية أشكالًا جديدة من التعبير.
لكن تلك التقنيات السابقة لم تجبر الثقافة أبدًا على إعادة تشكيلها إلى ما لا نهاية عبر وسائل مختلفة على نطاق عالمي. ولم يقوموا بتلخيص أو تجديد أو تصنيف المنتجات الثقافية ــ القصص الإخبارية، أو الأغاني، أو الميمات، أو الأوراق الأكاديمية، أو الصور الفوتوغرافية، أو منشورات وسائل التواصل الاجتماعي ــ ملايين المرات يوميا، مسترشدين بنفس الافتراضات المدمجة حول ما هو “نموذجي”.
تظهر الدراسة أنه عندما يتم فرض المعنى عبر هذه الأنابيب بشكل متكرر، فإن التنوع ينهار ليس بسبب النوايا السيئة أو التصميم الخبيث أو إهمال الشركات، ولكن لأن أنواعًا معينة فقط من المعنى تبقى على قيد الحياة بعد التحويلات المتكررة من نص إلى صورة إلى نص.
وهذا لا يعني أن الركود الثقافي أمر لا مفر منه. الإبداع البشري مرن. لقد وجدت المؤسسات والثقافات الفرعية والفنانون دائمًا طرقًا لمقاومة التجانس. ولكن من وجهة نظري فإن نتائج الدراسة تظهر أن الركود يشكل خطراً حقيقياً ــ وليس خوفاً تخمينياً ــ إذا تُركت الأنظمة التوليدية لتعمل في نسختها الحالية.
كما أنها تساعد في توضيح مفهوم خاطئ شائع حول إبداع الذكاء الاصطناعي: إن إنتاج تنوعات لا نهاية لها ليس مثل إنتاج الابتكار. يمكن للنظام توليد ملايين الصور أثناء استكشاف زاوية صغيرة فقط من المساحة الثقافية.
وفي بحثي الخاص حول الذكاء الاصطناعي الإبداعي، وجدت أن الحداثة تتطلب تصميم أنظمة الذكاء الاصطناعي مع حوافز للانحراف عن المعايير. وبدونها، تعمل الأنظمة على تحسين الألفة لأن الألفة هي أفضل ما تعلمته. وتعزز الدراسة هذه النقطة تجريبيا. الحكم الذاتي وحده لا يضمن الاستكشاف. وفي بعض الحالات، فإنه يسرع التقارب.
لقد ظهر هذا النمط بالفعل في العالم الحقيقي: وجدت إحدى الدراسات أن خطط الدروس المولدة بواسطة الذكاء الاصطناعي أظهرت نفس الانجراف نحو المحتوى التقليدي غير الملهم، مما يؤكد أن أنظمة الذكاء الاصطناعي تتقارب نحو ما هو نموذجي بدلاً من ما هو فريد أو إبداعي.

ضاعت في الترجمة
كلما قمت بكتابة تعليق على الصورة، سيتم فقدان التفاصيل. وبالمثل لتوليد صورة من النص. ويحدث هذا سواء تم إجراؤه بواسطة إنسان أو بواسطة آلة.
وبهذا المعنى، فإن التقارب الذي حدث ليس فشلًا يقتصر على الذكاء الاصطناعي. إنه يعكس خاصية أعمق للارتداد من وسيلة إلى أخرى. عندما يمر المعنى بشكل متكرر عبر صيغتين مختلفتين، فإن العناصر الأكثر استقرارًا فقط هي التي تبقى.
ولكن من خلال تسليط الضوء على ما يبقى أثناء الترجمات المتكررة بين النص والصور، يستطيع المؤلفون إظهار أن المعنى تتم معالجته داخل الأنظمة التوليدية مع انجذاب هادئ نحو العام.
والمعنى الضمني هنا مثير للقلق: فحتى في ظل التوجيه البشري ــ سواء كان ذلك يعني كتابة المطالبات، أو اختيار المخرجات، أو تنقيح النتائج ــ فإن هذه الأنظمة لا تزال تتخلص من بعض التفاصيل وتضخم تفاصيل أخرى بطرق موجهة نحو ما هو “متوسط”.
إذا كان الذكاء الاصطناعي التوليدي يهدف إلى إثراء الثقافة بدلاً من تسطيحها، فأعتقد أن الأنظمة تحتاج إلى التصميم بطرق تقاوم التقارب نحو مخرجات متوسطة إحصائياً. يمكن أن تكون هناك مكافآت للانحراف ودعم أشكال التعبير الأقل شيوعًا والأقل انتشارًا.
توضح الدراسة شيئًا واحدًا: في غياب هذه التدخلات، سيستمر الذكاء الاصطناعي التوليدي في الانجراف نحو محتوى متواضع وغير ملهم.
ولم يعد الركود الثقافي مجرد تكهنات. إنه يحدث بالفعل.
تم إعادة نشر هذا المقال من The Conversation، وهي منظمة إخبارية مستقلة غير ربحية تقدم لك حقائق وتحليلات جديرة بالثقة لمساعدتك على فهم عالمنا المعقد. كتب بواسطة: أحمد الجمال، جامعة روتجرز
اقرأ المزيد:
لا يعمل أحمد الجمال في أي شركة أو مؤسسة أو يقدم الاستشارة أو يمتلك أسهمًا فيها أو يتلقى تمويلًا منها قد تستفيد من هذه المقالة، ولم يكشف عن أي انتماءات ذات صلة بعد تعيينه الأكاديمي.
















اترك ردك