يقال إن أداة النسخ OpenAI تضيف محتوى الهلوسة في ملاحظات الاستشارة الطبية

أصدرت OpenAI أداة ذكاء اصطناعي (AI) تسمى Whisper في عام 2022، والتي يمكنها نسخ الكلام إلى نص. ومع ذلك، يدعي أحد التقارير أن أداة الذكاء الاصطناعي عرضة للهلوسة وتضيف نصًا وهميًا في النسخ. وهذا أمر مثير للقلق لأنه يقال إن الأداة تُستخدم في العديد من الصناعات عالية المخاطر مثل الأدوية وإمكانية الوصول. ويُقال إن القلق بشكل خاص يأتي من استخدام هذه الأداة في الاستشارات بين الطبيب والمريض، حيث يمكن للهلوسة أن تضيف معلومات قد تكون ضارة وتعرض حياة المريض للخطر.

يقال إن OpenAI Whisper عرضة للهلوسة

وكالة انباء ذكرت أن نظام التعرف التلقائي على الكلام (ASR) الخاص بـ OpenAI، Whisper، لديه إمكانات عالية في إنشاء نص هلوسة. نقلاً عن مقابلات مع العديد من مهندسي البرمجيات والمطورين والباحثين الأكاديميين، يزعم المنشور أن النصوص الخيالية تتضمن أوصافًا عنصرية وعنفًا ورعاية طبية وعلاجًا.

تعتبر الهلوسة، من حيث الذكاء الاصطناعي، مشكلة كبيرة تجعل أنظمة الذكاء الاصطناعي تنتج استجابات خاطئة أو مضللة. في حالة Whisper، يُقال إن الذكاء الاصطناعي يُنشئ نصًا لم يتحدثه أحد من قبل.

في مثال تم التحقق منه بواسطة المنشور، قال المتحدث: “هو، الصبي، سوف يأخذ المظلة، لست متأكدًا تمامًا من ذلك”. تم تغييره إلى “لقد أخذ قطعة كبيرة من الصليب، قطعة صغيرة، قطعة صغيرة… أنا متأكد من أنه لم يكن معه سكين إرهابي لذلك قتل عددًا من الأشخاص”. وفي حالة أخرى، ورد أن ويسبر أضاف معلومات عنصرية دون ذكرها.

على الرغم من أن الهلوسة ليست مشكلة جديدة في مجال الذكاء الاصطناعي، إلا أن مشكلة الأدوات هذه على وجه الخصوص أكثر تأثيرًا لأن التكنولوجيا مفتوحة المصدر تستخدم من قبل بعض الأدوات المستخدمة في الصناعات عالية المخاطر. على سبيل المثال، أنشأت شركة نابلا، ومقرها باريس، أداة تعتمد على نظام ويسبر، والتي يقال إن أكثر من 30 ألف طبيب و40 نظامًا صحيًا يستخدمونها.

تم استخدام أداة Nabla لتسجيل أكثر من سبعة ملايين زيارة طبية. وللحفاظ على أمن البيانات، تقوم الشركة أيضًا بحذف التسجيلات الأصلية من خوادمها. وهذا يعني أنه إذا كانت هناك نصوص هلوسة تم إنشاؤها في هذه النسخ السبعة ملايين، فسيكون من المستحيل التحقق منها وتصحيحها.

هناك مجال آخر يتم فيه استخدام هذه التكنولوجيا وهو إنشاء أدوات إمكانية الوصول لمجتمع الصم وضعاف السمع، حيث يكون التحقق من دقة هذه الأدوات أمرًا صعبًا للغاية مرة أخرى. ويقال إن معظم الهلوسة تنجم عن الضوضاء في الخلفية، والتوقف المفاجئ، والأصوات البيئية الأخرى.

حجم هذه المشكلة يثير القلق أيضًا. نقلاً عن أحد الباحثين، يزعم المنشور أن ثمانية من كل 10 نسخ صوتية تم العثور عليها تحتوي على نص هلوسة. أخبر أحد المطورين المنشور أن الهلوسة حدثت في “كل نسخة من النصوص الـ 26000 التي أنشأها باستخدام Whisper”.

على وجه التحديد، في يطلق من Whisper، تقول OpenAI أن Whisper يوفر مقاومة على المستوى البشري لللكنات، وضوضاء الخلفية، واللغة التقنية. صرح متحدث باسم الشركة للنشر أن شركة الذكاء الاصطناعي تواصل دراسة طرق تقليل الهلوسة ووعدت بدمج هذه التعليقات في تحديثات النموذج المستقبلية.

Fuente