مدرج Act-One مع إمكانية التقاط تعابير الوجه المدعومة بالذكاء الاصطناعي والتي تمت إضافتها إلى نماذج Alpha Gen-3

أعلنت شركة Runway AI، وهي شركة ذكاء اصطناعي تركز على نماذج إنشاء الفيديو، عن ميزات جديدة يوم الثلاثاء. تتوفر الإمكانية الجديدة، التي يطلق عليها اسم Act-One، في أحدث نموذج لغة كبير من Gen-3 Alpha (LLM) للشركة، ويقال إنها تلتقط تعبيرات الوجه بدقة من مقاطع الفيديو المصدر ثم تعيد إنتاجها على الأحرف التي تم إنشاؤها بواسطة الذكاء الاصطناعي في الفيديو. تحل هذه الميزة مشكلة كبيرة في تقنية إنشاء الفيديو بالذكاء الاصطناعي، وهي تحويل الأشخاص الحقيقيين إلى شخصيات الذكاء الاصطناعي دون فقدان التعبيرات الواقعية.

تم تقديم قدرة Act-One Runway في Gen-3 Alpha

في أ مشاركة مدونةتفاصيل شركة الذكاء الاصطناعي عن قدرات إنشاء الفيديو الجديدة. تنص Runway على أن أداة Act-One يمكنها إنشاء محتوى مباشر ومحتوى متحرك باستخدام عروض الفيديو والصوت كمدخلات. تهدف هذه الأداة إلى تقديم أداء معبر للشخصية في مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي.

لقد غيرت مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي عملية إنشاء محتوى الفيديو بشكل كبير حيث يمكن للأفراد الآن إنشاء مقاطع فيديو محددة باستخدام أوامر نصية باللغة الطبيعية. ومع ذلك، هناك بعض القيود التي تعيق التكيف مع هذه التكنولوجيا. أحد هذه القيود هو عدم القدرة على التحكم في تغيير تعبيرات الشخصية في الفيديو أو تحسين أدائها في نطق الجمل والإيماءات وحركات العين.

ومع ذلك، مع Act-One، تحاول Runway سد الفجوة. تعمل هذه الأداة، التي تعمل فقط مع نماذج Gen-3 Alpha، على تبسيط عملية الرسوم المتحركة للوجه، والتي غالبًا ما تكون معقدة وتتطلب سير عمل متعدد الخطوات. حاليًا، يتطلب تحريك مثل هذه الشخصية تصوير شخص بالفيديو من زوايا متعددة، وتركيب الوجه يدويًا، والتقاط حركات وجهه بشكل منفصل.

تدعي شركة Runway أن Act-One يحل محل سير العمل ويحولها إلى عملية من خطوتين. يمكن للمستخدمين الآن تسجيل فيديو لأنفسهم أو لممثل من كاميرا أحادية النقطة، والتي يمكن أن تكون أيضًا هاتفًا ذكيًا، واختيار شخصية تعمل بالذكاء الاصطناعي. بمجرد اكتمالها، يُزعم أن هذه الأداة ليست قادرة على التقاط تعبيرات الوجه فحسب، بل أيضًا التفاصيل الصغيرة مثل حركات العين والتعبيرات الدقيقة وأسلوب التسليم.

ولتسليط الضوء على نطاق هذه الميزة، ذكرت الشركة في منشور مدونتها: “يحافظ النموذج على تعبيرات الوجه الواقعية ويترجم المظاهر بدقة إلى شخصيات بنسب مختلفة من الفيديو المصدر الأصلي. تفتح هذه المرونة إمكانيات جديدة لتصميم الشخصيات والرسوم المتحركة المبتكر.

والجدير بالذكر أنه في حين يمكن استخدام Act-One لشخصيات الرسوم المتحركة، فإنه يمكن استخدامه أيضًا لشخصيات الحركة الحية في التسلسلات السينمائية. علاوة على ذلك، يمكن لهذه الأداة أيضًا التقاط التفاصيل حتى لو كانت زاوية وجه الممثل مختلفة عن زاوية وجه شخصية الذكاء الاصطناعي.

يتم طرح هذه الميزة حاليًا لجميع المستخدمين على مراحل، ولكن نظرًا لأنها تعمل فقط على Gen-3 Alpha، سيحصل مستخدمو الطبقة المجانية على عدد محدود من الرموز المميزة لإنتاج مقاطع الفيديو باستخدام الأداة.



Fuente