تم إصدار Meta NotebookLlama AI Podcast Generator كأداة مفتوحة المصدر للتنافس مع NotebookLM من Google

أصدرت Meta أداة جديدة مفتوحة المصدر للذكاء الاصطناعي (AI) يوم الأحد والتي ستستخدم Google NotebookLM. الأداة التي يطلق عليها اسم NotebookLlama، عبارة عن مولد بودكاست مدعوم بالذكاء الاصطناعي حيث يمكن للمستخدمين تحميل ملف PDF وستقوم الأداة بتحويله إلى بودكاست صوتي مع حرفين من الذكاء الاصطناعي. تستخدم هذه الأداة ثلاثة نماذج مختلفة من Llama 3.1 AI لإكمال العملية بأكملها. تمامًا مثل أداة Google، يتبع بودكاست NotebookLlama أيضًا محادثة متدفقة ذهابًا وإيابًا بين مضيفين يعملان بالذكاء الاصطناعي.

تستخدم أداة Meta NotebookLlama AI ثلاثة نماذج لغوية كبيرة لإنشاء ملفات صوتية من كتل نصية. في الوقت الحالي، تقبل الأداة فقط ملفات PDF كمدخلات، لذلك سيتعين على المستخدمين تحويل أي تنسيق نص لديهم إلى PDF.

Meta NotebookLlama سير العمل
مصدر الصورة: ميتا

يستخدم NotebookLlama أولاً نموذج تعليمات Llama 3.2 1B لمعالجة ملفات PDF مسبقًا وحفظها في ملفات “.txt”. ثم تم استخدام نموذج تعليمات Llama 3.1 70B لكتابة نص البودكاست باستخدام مجموعة البيانات المصدر. تم بعد ذلك تمثيل النص باستخدام أداة إعادة كتابة باستخدام نموذج تعليمات Llama 3.1 8B. وأخيرًا، يتم استخدام أدوات خاصة لإضافة النسخ في سير عمل تحويل النص إلى كلام. لهذا، يستخدم Meta أداة Parler TTS. يمكن للأفراد المهتمين الوصول إلى جميع النماذج المطلوبة لإنتاج بودكاست من قائمة GitHub هنا.

ومع ذلك، فإن نماذج الذكاء الاصطناعي المذكورة أعلاه هي مجرد توصيات من المطورين. قد يختار المستخدمون استخدام نماذج أصغر لكل خطوة، ولكن النتائج قد تختلف. يسلط Meta الضوء على أنه لتشغيل نظام الذكاء الاصطناعي في الإعدادات الموصى بها، سيحتاج المستخدمون إلى وحدة معالجة رسومات (GPU) بذاكرة مدمجة تبلغ حوالي 140 جيجابايت.

المستخدم X (المعروف سابقًا باسم Twitter). نشر مثال على البودكاست الناتج. وبناءً على ذلك، يبدو أن جودة الصوت ليست بجودة Google NotebookLM، ويبدو حادًا وروبوتيًا. بالإضافة إلى ذلك، هناك أوقات يتم فيها تخطي الجزء الصوتي وينتهي الأمر بمضيفي الذكاء الاصطناعي بالتحدث مع بعضهم البعض.

تدرك Meta بعض المشكلات وتخطط لإصلاحها في منتج الذكاء الاصطناعي التالي. تسلط الشركة الضوء على أن “نموذج TTS هو الحد الأقصى لمدى طبيعية هذا الأمر. ربما يمكن إصلاح هذا من خلال سباكة أفضل ومساعدة شخص أكثر خبرة.

تخطط شركة التكنولوجيا العملاقة أيضًا لاستخدام درجتين مختلفتين من LLM لكتابة السيناريو، حيث سيتناقش كل نموذج مع بعضهما البعض لجعل البودكاست يبدو أكثر حوارية. وهذا أيضًا جزء من الخطط المستقبلية للمطور. بالإضافة إلى ذلك، تقوم الشركة أيضًا باختبار نموذج Llama 405B AI لكتابة النصوص بالإضافة إلى تحسين الدعم لمزيد من تنسيقات الإدخال والإخراج.

للحصول على أحدث أخبار ومراجعات التكنولوجيا، تابعونا على Gadgets 360 X, فيسبوك, ما هذا, خيط و أخبار جوجل. للحصول على أحدث مقاطع الفيديو حول الأدوات والتكنولوجيا، اشترك معنا قناة يوتيوب. إذا كنت تريد معرفة كل شيء عن كبار الشخصيات المؤثرة، فاتبع سبقنا الصحفي الداخلي من It360 على انستغرام و يوتيوب.

من المتوقع أن يأتي iPhone SE 4 بشاشة LTPS OLED مقاس 6.06 بوصة، وبطارية تبلغ 3279 مللي أمبير في الساعة، ومودم داخلي من Apple


تتعرض مبيعات سلسلة iPhone 16 في إندونيسيا للإعاقة بسبب عدم تلبية متطلبات الاستثمار



Fuente