قد يكون لدى الصين قريبًا نسختها الخاصة من نموذج تحويل النص إلى فيديو الخاص بشركة OpenAI

[Source]

تتعاون مجموعة من الباحثين وخبراء الذكاء الاصطناعي (AI) لتطوير استجابة الصين لنموذج Sora، وهو نموذج OpenAI المرتقب لتحويل النص إلى فيديو.

ما هو: أعلن أساتذة جامعة بكين وشركة Rabbitpre، وهي شركة للذكاء الاصطناعي مقرها في شنتشن، عن تعاونهم في منشور على GitHub يوم الجمعة، والذي أطلقوا عليه اسم Open-Sora. تم تسهيل المشروع من خلال مختبر Rabbitpre AIGC المشترك، وهو جهد مشترك بين الشركة وكلية الدراسات العليا بالجامعة.

وفقًا للفريق، يهدف Open-Sora إلى “إعادة إنتاج نموذج إنشاء الفيديو الخاص بـ OpenAI” باستخدام مستودع “بسيط وقابل للتطوير”. تسعى المجموعة للحصول على المساعدة من مجتمع المصادر المفتوحة لتطويرها.

التقدم حتى الآن: باستخدام إطار عمل مكون من ثلاثة أجزاء مع مكونات Video VQ-VAE، ومحول تقليل الضوضاء، وCondition Encoder، نجحت المجموعة في إنشاء عينات بنسب عرض إلى ارتفاع ودقة ومدد مختلفة لمقاطع الفيديو المعاد بناؤها، بما في ذلك مقاطع مدتها 10 و18 ثانية.

الشائع على NextShark: اليابان تضع حجر الأساس لأول متحف في العالم لفن ألعاب الفيديو

حول سورا: تم الكشف عن Sora في 15 فبراير، وهو أول نموذج لتحويل النص إلى فيديو من OpenAI يمكنه إنشاء مقاطع فيديو واقعية وعالية الجودة على الفور باستخدام المطالبات النصية فقط. حتى الآن، يمكن أن تستمر الفترات لمدة تصل إلى دقيقة.

وبينما تم الإعلان عن التكنولوجيا، قالت OpenAI إنها ليس لديها خطط لجعل Sora متاحًا للاستخدام العام في أي وقت قريب. لا تزال الشركة بحاجة إلى معالجة العديد من المشكلات مثل تقليل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، بالإضافة إلى تصنيف المنتج النهائي بشكل صحيح.

رائج على NextShark: فيديو لطفلة أمريكية مكسيكية تبكي لأنها ليست صينية ينتشر بسرعة كبيرة

ماذا بعد: حدد مختبر Rabbitpre AIGC المشترك بعض خططه المستقبلية لـ Open-Sora، والتي تتضمن إنشاء قاعدة تعليمات برمجية وتدريب نموذج غير مشروط على مجموعات البيانات الطبيعية. وبعد ذلك، تخطط المجموعة لتدريب النماذج لتعزيز الدقة والمدة كجزء من مراحل المشروع الأساسية.

ويخطط الفريق أيضًا لإجراء تجارب على مجموعة بيانات تحويل النص إلى فيديو، وتدريب نموذج دقة 1080 بكسل (1920 × 1080) على مجموعة بيانات تحويل الفيديو إلى نص، وتطوير نموذج تحكم بشروط إضافية.

رائج على NextShark: شاهد: فنان مكياج صيني يحول رجلاً يبلغ من العمر 57 عامًا إلى “27 عامًا”

تحميل تطبيق NextShark:

هل ترغب في مواكبة آخر الأخبار الأمريكية الآسيوية؟ قم بتنزيل تطبيق NextShark اليوم!