تقدم Anthropic نموذج Sonnet Claude 3.5 AI المعزز مع القدرة على إكمال المهام على جهاز الكمبيوتر

قدمت Anthropic نموذجين جديدين للذكاء الاصطناعي (AI) وقدرات جديدة للذكاء الاصطناعي يوم الثلاثاء. أكبر مقدمة هي نسخة مطورة من Claude 3.5 Sonnet والتي يُزعم أنها تقدم نتائج قياسية محسنة في فئات مختلفة. يتمتع Sonnet 3.5 الجديد أيضًا بقدرة جديدة تسمى Computer Use، والتي تتيح له فهم أجهزة الكمبيوتر والتفاعل معها، مما يسمح له بشكل أساسي بالتحكم في المهام وإكمالها على جهاز الكمبيوتر. علاوة على ذلك، أعلنت شركة الذكاء الاصطناعي أيضًا عن كلود 3.5 هايكو، خليفة كلود 3 هايكو.

تم تقديم السوناتة Claude 3.5 المحسنة مع استخدام الكمبيوتر

في غرفة الأخبار بريدأعلنت Anthropic عن ترقية Claude 3.5 Sonnet، والتي تقدم تحسينات في الأداء مقارنة بنموذج الذكاء الاصطناعي الذي تم إصداره في يونيو. تدعي شركة الذكاء الاصطناعي أن النموذج الجديد يتفوق على ChatGPT-4o وGemini 1.5 Pro في معايير مثل Google-Proof Graduate Q&A (GPQA)، وMassive Multitask Language Concern (MMLU) Pro، وHumanEval الذي يركز على البرمجة.

ومع ذلك، فقد تمت المطالبة بالتحسينات الأكثر أهمية في معيارين محددين – معيار هندسة البرمجيات (SWE-bench)، الذي ارتفع من 33.4 بالمائة إلى 49 بالمائة، وأداة – وكيل – مستخدم (TAU-bench)، الذي ارتفع من 62 بالمائة ، 6 في المائة إلى 49 في المائة. 69.2 بالمائة. يرتبط كلا المعيارين بأداء وكيل الذكاء الاصطناعي.

تعتبر قدرة وكيل الذكاء الاصطناعي هذه ذات صلة منذ أن قدمت Anthropic إمكانات استخدام الكمبيوتر الجديدة التي تسمح لنماذج الذكاء الاصطناعي بالتحكم في المهام وإكمالها على جهاز الكمبيوتر. حاليًا، تتوفر هذه الإمكانية عبر واجهة برمجة التطبيقات (API) التي تعمل فقط على Claude 3.5 Sonnet.

مع استخدام الكمبيوتر، يتعلم كلود مهارات الكمبيوتر العامة. باستخدام برنامج خاص، يمكنه محاكاة ضغطات المفاتيح ونقرات الأزرار وحركات المؤشر. ومن خلال إضافته إلى إمكانات رؤية الكمبيوتر الحالية لنموذج الذكاء الاصطناعي، يستطيع Claude 3.5 Sonnet رؤية ما يحدث على الشاشة، ومعالجة المعلومات لتنفيذ مهام محددة. ستعمل هذه الميزة بناءً على الأوامر المعطاة للذكاء الاصطناعي.

على سبيل المثال، يمكن للمستخدمين أن يطلبوا من نموذج لغة كبير (LLM) حجز التذاكر على موقع ويب، أو ملء طلب، أو حتى تنزيل تطبيق وتثبيته. في حين أن الأدوات المتخصصة التي يمكنها أتمتة بعض مهام الكمبيوتر موجودة بالفعل، فإن الأدوات ذات الأغراض العامة التي تعمل بناءً على أوامر اللغة الطبيعية تعد علامة فارقة مهمة لتكنولوجيا الذكاء الاصطناعي التوليدية.

ومع ذلك، تعترف أنثروبيك بأن هذه القدرة لا تزال في مراحلها الأولى وأن هناك بعض القيود. وشددت الشركة على أن “بعض الإجراءات التي يقوم بها الأشخاص بسهولة – مثل التمرير والسحب والتكبير/التصغير – تمثل الآن تحديات أمام كلود”. في الوقت الحالي، يوصى بأن يستخدم المطورون هذه الإمكانية فقط للمهام منخفضة المخاطر.

ومع قوة التحكم الآلي بالكمبيوتر، هناك مخاوف بشأن ما إذا كان من الممكن تصميم نماذج الذكاء الاصطناعي لتنفيذ أنشطة خطيرة وغير قانونية. ولم تكشف الشركة عن أي تفاصيل حول أمان نموذج الذكاء الاصطناعي وسلامة المستخدم في الوقت الحالي. ومن الجدير بالذكر أن Claude 3.5 Sonnet المحسّن متاح لجميع المستخدمين ويمكن للمطورين بناء هذه القدرات من خلال Anthropic API وAmazon Bedrock وVertex AI من Google Cloud.

أعلن كلود 3.5 هايكو

إعلان كبير آخر كان إطلاق كلود 3.5 هايكو. للسياق، Haiku هي سلسلة نماذج الذكاء الاصطناعي الأرخص والأسرع التي تقدمها Anthropic. تدعي شركة الذكاء الاصطناعي الآن أن قدرات خليفة Claude 3 Haiku تتفوق على Claude 3 Opus، الطراز الرائد السابق للشركة. وهذا يعني أنه يمكن للمستخدمين الآن الوصول إلى نماذج الذكاء الاصطناعي القوية بسعر أرخص بكثير.

سيتم إصدار Claude 3.5 Haiku في وقت لاحق من هذا الشهر عبر منصات بما في ذلك API الخاصة بالشركة، وAmazon Bedrock، وVertex AI من Google Cloud. سيكون متاحًا في البداية كنموذج نصي فقط وسيتم تحديثه لاحقًا لقبول الصور كمدخلات.

Fuente