Anthropic تريد من وكيل الذكاء الاصطناعي الخاص بها إدارة جهاز الكمبيوتر الخاص بك

قد تبدو العروض التوضيحية لعملاء الذكاء الاصطناعي غريبة، ولكن جعل التكنولوجيا تعمل بشكل موثوق دون حدوث أخطاء مزعجة أو مكلفة في الحياة الواقعية قد يمثل تحديًا. يمكن للنماذج الحالية الإجابة على الأسئلة والدردشة بمهارات تشبه المهارات البشرية تقريبًا، وهي العمود الفقري لروبوتات الدردشة مثل ChatGPT من OpenAI وGemini من Google. يمكنهم أيضًا تنفيذ المهام على أجهزة الكمبيوتر عند إعطائهم أمرًا بسيطًا عن طريق الوصول إلى شاشة الكمبيوتر إلى جانب أجهزة الإدخال مثل لوحة المفاتيح ولوحة التتبع أو من خلال واجهات منخفضة المستوى.

تقول Anthropic أن كلود يتفوق على عملاء الذكاء الاصطناعي الآخرين في العديد من المعايير الرئيسية بما في ذلك مقعد SWEالذي يقيس القدرة على تحسين برامج الوكيل و OSWorldوالذي يقيس قدرة الوكيل على استخدام نظام تشغيل الكمبيوتر. ولم يتم التحقق من هذه المزاعم بشكل مستقل. يقول Anthropic أن كلود يؤدي المهام على OSWorld بشكل صحيح بنسبة 14.9 بالمائة من الوقت. وهذا أقل بكثير من البشر، الذين يسجلون في المتوسط ​​حوالي 75%، ولكنه أعلى بكثير من أفضل الوكلاء الحاليين، بما في ذلك OpenAI’s GPT-4، الذي حقق حوالي 7.7% من ذلك الوقت.

تفيد تقارير أنثروبيك أن العديد من الشركات تقوم بالفعل باختبار نسخة من وكيل كلود. وهذا يشمل قماشوالذي يستخدم التخطيط الذاتي وجدولة المهام و إجابةالذي يستخدم مثالا لكتابة الواجبات المنزلية. يشمل المتبنون الأوائل الآخرون شركة المتصفح, أسانا و الفكرة.

حول النقريقول باحث ما بعد الدكتوراه في جامعة برينستون والذي ساعد في تطوير مقعد SWE، إن وكالة الذكاء الاصطناعي تفتقر إلى القدرة على التخطيط للمستقبل وغالبًا ما تواجه صعوبة في التعافي من الأخطاء. ويقول: “لكي نظهر أنها مفيدة، علينا أن نحصل على أداء قوي وفقًا للمعايير الصعبة والحقيقية”، مثل التخطيط للعديد من الرحلات المختلفة للمستخدم وحجز جميع التذاكر اللازمة.

ويشير كابلان إلى أن كلود أصبح الآن قادرًا على حل بعض الأخطاء بطريقة مذهلة. عندما تواجه الخطأ الأخير عند محاولة تشغيل خادم الويب، على سبيل المثال، فإنك تعرف كيفية تحديث الأمر الخاص به لإصلاحه. ويعمل أيضًا على السماح بالنوافذ المنبثقة عندما يتعطل في متصفح ويب غير نشط.

تتسابق العديد من شركات التكنولوجيا الآن لتطوير عملاء الذكاء الاصطناعي في سعيها وراء حصتها في السوق وشعبيتها. في الواقع، قد لا يمر وقت طويل قبل أن يصبح لدى العديد من المستخدمين وكلاء بين أيديهم. وتقول مايكروسوفت، التي استثمرت أكثر من 13 مليار دولار في OpenAI، إنها وكيل اختبار يمكن تشغيله على أجهزة الكمبيوتر التي تعمل بنظام Windows. تستكشف أمازون، التي استثمرت بكثافة في Anthropic، كيف يمكن للوكلاء التوصية بالمنتجات لعملائها وشرائها في نهاية المطاف.

تقول سونيا هوانغ، الشريكة في شركة سيكويا الاستثمارية التي تركز على شركات الذكاء الاصطناعي، إنه على الرغم من كل الإثارة في عملاء الذكاء الاصطناعي، فإن العديد من الشركات تعمل في الواقع على تجديد الأجهزة التي تعمل بالذكاء الاصطناعي. وفي حديثه إلى WIRED قبل أخبار Anthropic، قال إن التكنولوجيا تعمل بشكل أفضل الآن عند استخدامها في مجالات ضيقة مثل أعمال البرمجة. ويقول: “عليك أن تختار مجالات المشاكل حيث إذا لم ينجح النموذج، فلا بأس. هذه هي مجالات المشاكل التي ستظهر فيها الشركات المحلية الحقيقية”.

التحدي الرئيسي الذي تواجهه وكالة الذكاء الاصطناعي هو أن الأخطاء يمكن أن تكون مشكلة أكثر من مجرد إجابة محادثة مشوهة. وقد وضعت شركة أنثروبيك بعض القيود على ما يمكن أن يفعله كلود، على سبيل المثال، الحد من قدرته على استخدام بطاقة الائتمان الخاصة بالشخص لإجراء عمليات الشراء.

إذا كان من الممكن تجنب الأخطاء بما فيه الكفاية، كما تقول مطبعة جامعة برينستون، فيمكن للمستخدمين أن يتعلموا رؤية الذكاء الاصطناعي – وأجهزة الكمبيوتر – بطريقة جديدة تمامًا. يقول: “أنا سعيد جدًا بهذا العصر الجديد.

Fuente