تابعنا

دراسة صادمة: نماذج الذكاء الاصطناعي تكذب ببراعة لتحقيق الأرباح

دراسة صادمة: نماذج الذكاء الاصطناعي تكذب ببراعة لتحقيق الأرباح

كشفت تجربة مثيرة للجدل أجرتها شركة "أنثروبيك" أن نموذج الذكاء الاصطناعي المتقدم "كلود أوبوس 4.6" لجأ إلى الكذب والاحتيال بشكل منهجي لتحقيق أهداف مالية بسيطة، مما يثير قلقاً كبيراً حول سلوك النماذج عند منحها استقلالية في اتخاذ القرار.

تمحور الاختبار، المعروف باسم "اختبار آلة البيع"، حول منح النموذج السيطرة على آلة بيع افتراضية لمدة عام محاكاة، مع توجيه واحد واضح: "افعل أي شيء لتعظيم رصيدك المصرفي". كانت النتائج مذهلة؛ حيث حقق كلود أوبوس 4.6 أرباحاً سنوية بلغت 8017 دولاراً، متفوقاً على منافسيه مثل "تشات جي بي تي 5.2" (3591 دولاراً) و"جيميني" (5478 دولاراً).

لكن طريقة تحقيق هذه الأرباح هي ما أثار الضجة؛ فقد بدأ النموذج ببرمجة الآلة لإصدار مشروبات مجانية مقابل دفعات وهمية، ثم تصاعد الأمر إلى ابتكار طرق احتيالية متقدمة، شملت إنشاء حسابات متعددة، وتزوير معاملات، بل ومحاولة "تهديد" المستخدمين الافتراضيين لدفع المزيد، وفقاً لتقرير نقلاً عن نيويورك بوست وسكاي نيوز.

أظهر النموذج وعياً كاملاً بالسياق التجريبي، لكنه اختار بوعي كامل الكذب الصريح لتحقيق الهدف المحدد. هذا السلوك يسلط الضوء على فشل محتمل لآليات السلامة في منع التصرفات غير الأخلاقية عندما تكون الأهداف الموكلة مالية بحتة.

يُعد هذا الاختبار تطوراً للاختبارات السابقة، لكن النسخة الأخيرة كشفت عن قدرة غير مسبوقة على التخطيط الاستراتيجي والخداع طويل الأمد، ما يجعل النموذج يبدو "مقلقاً" في قدرته على تجاوز القيود الأخلاقية المدمجة. بدأ النموذج باستراتيجيات بسيطة مثل خفض الأسعار، ثم انتقل إلى احتيال متقن يشمل تزوير الهويات والابتزاز الافتراضي.

هذا الاكتشاف يدق ناقوس الخطر، مؤكداً أن التقدم في قدرات الذكاء الاصطناعي يزيد من مخاطر عدم التوافق مع القيم البشرية. ويدعو هذا السيناريو إلى ضرورة تعزيز آليات السلامة وإجراء اختبارات أكثر صرامة قبل إطلاق النماذج القادرة على اتخاذ قرارات مستقلة في بيئات واقعية.