تكنو لايف

اختبار أمني يكشف ثغرات خطيرة في نموذج الذكاء الاصطناعي "ديب سيك"


كشف اختبار أمني مشترك أجرته شركة "سيسكو" بالتعاون مع جامعة بنسلفانيا عن فشل كبير لنموذج الذكاء الاصطناعي "آر 1" من شركة "ديب سيك" الصينية في التصدي للمحتوى الضار، حيث أظهر معدل نجاح هجمات بنسبة 100%، ما يعني عجزه التام عن منع أي مطالبات خطيرة، وفقًا لما أورده تقرير نشره موقع "إنترستنغ إنجنيرينغ"



ورغم أن النموذج الجديد لقي اهتمامًا واسعًا بفضل أدائه العالي وتكلفته المنخفضة مقارنة بالمنافسين، حيث قُدّرت كلفة تطويره بـ 6 ملايين دولار فقط، في حين تصل استثمارات الشركات الكبرى مثل "أوبن إيه آي" و"ميتا" و"غوغل" إلى مليارات، إلا أن الاختبارات أثبتت هشاشته أمام محاولات الاستغلال الخبيث.
 

وأوضح فريق البحث أن "ديب سيك" اعتمدت تقنيات متعددة، منها مطالبة سلسلة الأفكار ونمذجة المكافآت وتقنية التقطير، في محاولة لتعزيز كفاءة النموذج، لكن تقرير "سيسكو" كشف أن هذه الأساليب ربما أدت إلى إضعاف إجراءات الأمان، ما جعله عرضة للاستخدام غير المشروع.
 

وقد أُجري الاختبار باستخدام تقنية "الخوارزميك جلبريك"، المصممة لاكتشاف الثغرات في نماذج الذكاء الاصطناعي عبر تجاوز بروتوكولات الأمان، حيث تم تقييم "آر 1" وفق معيار "هارمبينش"، الذي يضم 400 سلوك ضار موزع على 7 فئات تشمل الجرائم السيبرانية، المعلومات المضللة، والأنشطة غير القانونية.
 

وفي مقارنة مع نماذج أخرى، جاءت نتائج "آر 1" الأكثر إثارة للقلق، إذ فشل في التصدي لأي هجوم، بينما أظهرت نماذج أخرى مقاومة متفاوتة، حيث بلغ معدل نجاح الهجوم 96% في "لاما 3.1-405 بي"، و86% في "جي بي تي 4 أو"، و64% في "جيميناي 1.5 برو"، و36% في "كلود 3.5"، وأخيرًا 26% في "أو 1"، ما يبرز الفجوة الكبيرة في معايير الأمان بين "ديب سيك" ومنافسيها.
 

ويشير التقرير إلى وجود تناقض في نهج "ديب سيك"، إذ نجحت الشركة في تطوير نموذج عالي الكفاءة بتكلفة أقل، لكنها على ما يبدو ضحت بجوانب الحماية، ما يجعل نموذجها هدفًا سهلًا للاستخدامات الضارة. كما أن هناك جدلًا حول كلفة تطوير النموذج، إذ تشير تقديرات مستقلة إلى أن تكلفته الحقيقية قد تصل إلى 1.3 مليار دولار، وهو ما يتناقض مع الأرقام الرسمية التي أعلنتها الشركة.


الذكاء الاصطناعي، الأمن السيبراني، نموذج آر 1، شركة ديب سيك


عائشة بوسكين صحافية خريجة المعهد العالي للإعلام… إعرف المزيد حول هذا الكاتب



الجمعة 7 فبراير 2025
في نفس الركن