أعلنت شركة Runway AI، وهي شركة ذكاء اصطناعي تركز على نماذج إنشاء الفيديو، عن ميزات جديدة يوم الثلاثاء. تتوفر الإمكانية الجديدة، التي يطلق عليها اسم Act-One، في أحدث نموذج لغة كبير من Gen-3 Alpha (LLM) للشركة، ويقال إنها تلتقط تعبيرات الوجه بدقة من مقاطع الفيديو المصدر ثم تعيد إنتاجها على الأحرف التي تم إنشاؤها بواسطة الذكاء الاصطناعي في الفيديو. تحل هذه الميزة مشكلة كبيرة في تقنية إنشاء الفيديو بالذكاء الاصطناعي، وهي تحويل الأشخاص الحقيقيين إلى شخصيات الذكاء الاصطناعي دون فقدان التعبيرات الواقعية.
تم تقديم قدرة Act-One Runway في Gen-3 Alpha
في أ مشاركة مدونةتفاصيل شركة الذكاء الاصطناعي عن قدرات إنشاء الفيديو الجديدة. تنص Runway على أن أداة Act-One يمكنها إنشاء محتوى مباشر ومحتوى متحرك باستخدام عروض الفيديو والصوت كمدخلات. تهدف هذه الأداة إلى تقديم أداء معبر للشخصية في مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي.
تقديم، الفصل الأول. طريقة جديدة لإنتاج مظاهر شخصية معبرة في Gen-3 Alpha تستخدم فيديو قيادة واحد وصورة شخصية. لا يلزم التقاط الحركة أو التزوير.
تعرف على المزيد حول القانون الأول أدناه.
(1/7) pic.twitter.com/p1Q8lR8K7G
— المدرج (@runwayml) 22 أكتوبر 2024
لقد غيرت مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي عملية إنشاء محتوى الفيديو بشكل كبير حيث يمكن للأفراد الآن إنشاء مقاطع فيديو محددة باستخدام أوامر نصية باللغة الطبيعية. ومع ذلك، هناك بعض القيود التي تعيق التكيف مع هذه التكنولوجيا. أحد هذه القيود هو عدم القدرة على التحكم في تغيير تعبيرات الشخصية في الفيديو أو تحسين أدائها في نطق الجمل والإيماءات وحركات العين.
ومع ذلك، مع Act-One، تحاول Runway سد الفجوة. تعمل هذه الأداة، التي تعمل فقط مع نماذج Gen-3 Alpha، على تبسيط عملية الرسوم المتحركة للوجه، والتي غالبًا ما تكون معقدة وتتطلب سير عمل متعدد الخطوات. حاليًا، يتطلب تحريك مثل هذه الشخصية تصوير شخص بالفيديو من زوايا متعددة، وتركيب الوجه يدويًا، والتقاط حركات وجهه بشكل منفصل.
تدعي شركة Runway أن Act-One يحل محل سير العمل ويحولها إلى عملية من خطوتين. يمكن للمستخدمين الآن تسجيل فيديو لأنفسهم أو لممثل من كاميرا أحادية النقطة، والتي يمكن أن تكون أيضًا هاتفًا ذكيًا، واختيار شخصية تعمل بالذكاء الاصطناعي. بمجرد اكتمالها، يُزعم أن هذه الأداة ليست قادرة على التقاط تعبيرات الوجه فحسب، بل أيضًا التفاصيل الصغيرة مثل حركات العين والتعبيرات الدقيقة وأسلوب التسليم.
ولتسليط الضوء على نطاق هذه الميزة، ذكرت الشركة في منشور مدونتها: “يحافظ النموذج على تعبيرات الوجه الواقعية ويترجم المظاهر بدقة إلى شخصيات بنسب مختلفة من الفيديو المصدر الأصلي. تفتح هذه المرونة إمكانيات جديدة لتصميم الشخصيات والرسوم المتحركة المبتكر.
تتمثل إحدى نقاط القوة في هذا النموذج في أنه ينتج مخرجات سينمائية وواقعية عبر نطاق واسع من زوايا الكاميرا والأطوال البؤرية. يتيح لك إنتاج عروض عاطفية بعمق كان مستحيلًا في السابق للشخصية مما يفتح آفاقًا جديدة للتعبير الإبداعي.
(4/7) pic.twitter.com/JG1Fvj8OUm
— المدرج (@runwayml) 22 أكتوبر 2024
والجدير بالذكر أنه في حين يمكن استخدام Act-One لشخصيات الرسوم المتحركة، فإنه يمكن استخدامه أيضًا لشخصيات الحركة الحية في التسلسلات السينمائية. علاوة على ذلك، يمكن لهذه الأداة أيضًا التقاط التفاصيل حتى لو كانت زاوية وجه الممثل مختلفة عن زاوية وجه شخصية الذكاء الاصطناعي.
يتم طرح هذه الميزة حاليًا لجميع المستخدمين على مراحل، ولكن نظرًا لأنها تعمل فقط على Gen-3 Alpha، سيحصل مستخدمو الطبقة المجانية على عدد محدود من الرموز المميزة لإنتاج مقاطع الفيديو باستخدام الأداة.