تعرض Nvidia نموذجًا للذكاء الاصطناعي يمكنه تعديل الأصوات وإنشاء أصوات جديدة

بقلم ستيفن نيليس

(رويترز) – عرضت نفيديا يوم الاثنين نموذجا جديدا للذكاء الاصطناعي لتوليد الموسيقى والصوت الذي يمكنه تعديل الأصوات وتوليد أصوات جديدة – وهي تقنية تستهدف منتجي الموسيقى والأفلام وألعاب الفيديو.

قالت Nvidia، أكبر مورد في العالم للرقائق والبرامج المستخدمة لإنشاء أنظمة الذكاء الاصطناعي، إنها ليس لديها خطط فورية للإصدار العلني لهذه التكنولوجيا، والتي تسميها Fugatto، وهي اختصار لـ Foundational Geneative Audio Transformer Opus 1.

إنه ينضم إلى التقنيات الأخرى التي تقدمها الشركات الناشئة مثل Runway واللاعبين الأكبر حجمًا مثل Meta Platforms التي يمكنها إنشاء صوت أو فيديو من مطالبة نصية.

تولد نسخة Nvidia ومقرها سانتا كلارا بولاية كاليفورنيا مؤثرات صوتية وموسيقى من وصف النص، بما في ذلك الأصوات الجديدة مثل صنع بوق ينبح مثل الكلب.

ما يجعلها مختلفة عن تقنيات الذكاء الاصطناعي الأخرى هو قدرتها على استيعاب الصوت الموجود وتعديله، على سبيل المثال عن طريق أخذ سطر يتم عزفه على البيانو وتحويله إلى سطر يغنيه صوت بشري، أو عن طريق تسجيل كلمة منطوقة وتغييرها اللهجة المستخدمة والمزاج المعبر عنه.

وقال بريان كاتانزارو، نائب رئيس أبحاث التعلم التطبيقي العميق في شركة إنفيديا: “إذا فكرنا في الصوت الاصطناعي على مدى الخمسين عامًا الماضية، فإن الموسيقى تبدو مختلفة الآن بسبب أجهزة الكمبيوتر، وبسبب أجهزة التوليف”. “أعتقد أن الذكاء الاصطناعي التوليدي سيجلب قدرات جديدة للموسيقى وألعاب الفيديو وللأشخاص العاديين الذين يرغبون في إنشاء الأشياء.”

وبينما تتفاوض شركات مثل OpenAI مع استوديوهات هوليوود حول ما إذا كان من الممكن استخدام الذكاء الاصطناعي في صناعة الترفيه وكيفية استخدامه، أصبحت العلاقة بين التكنولوجيا وهوليوود متوترة، خاصة بعد أن اتهمت نجمة هوليوود سكارليت جوهانسون شركة OpenAI بتقليد صوتها.

تم تدريب نموذج Nvidia الجديد على البيانات مفتوحة المصدر، وقالت الشركة إنها لا تزال تناقش ما إذا كان سيتم نشره علنًا وكيفية ذلك.

وقال كاتانزارو: “إن أي تكنولوجيا توليدية تحمل دائمًا بعض المخاطر، لأن الناس قد يستخدمونها لتوليد أشياء نفضل ألا يفعلوها”. “نحن بحاجة إلى توخي الحذر بشأن ذلك، ولهذا السبب ليس لدينا خطط فورية لإصدار هذا.”

لم يحدد منشئو نماذج الذكاء الاصطناعي التوليدية بعد كيفية منع إساءة استخدام التكنولوجيا مثل قيام المستخدم بإنشاء معلومات خاطئة أو انتهاك حقوق الطبع والنشر من خلال إنشاء أحرف محمية بحقوق الطبع والنشر.

وبالمثل، لم تذكر OpenAI وMeta متى تخططان لإصدار نماذجهما التي تولد الصوت أو الفيديو للجمهور.

(تقرير بقلم ستيفن نيليس في سان فرانسيسكو؛ تحرير بواسطة ويل دنهام)

Exit mobile version