يحذر المحللون ومطورو البرمجيات من أن نموذج الذكاء الاصطناعي الجديد لشركة Anthropic يمكن أن يبشر بعصر جديد من القرصنة والأمن السيبراني، حيث تقوم آلات الذكاء الاصطناعي القادرة على التفكير النقدي باكتشاف واستغلال عدد متزايد من نقاط الضعف في البرامج.
قم بالتسجيل لقراءة هذه المقالة بدون إعلانات
احصل على مقالات خالية من الإعلانات ومحتوى حصري.
نقلاً عن الضرر الذي قد ينجم عن إطلاق الجماهير، أصدرت شركة Anthropic الرائدة في مجال الذكاء الاصطناعي نموذجًا أوليًا، يسمى Claude Mythos Preview، يوم الثلاثاء لمجموعة صغيرة من شركات التكنولوجيا، رافضة إطلاق الجماهير.
هذا النموذج هو الأحدث في أنظمة Claude AI من Anthropic. تم عرض إصداره في نهاية شهر مارس حيث وقد اعترف الحظ بذكره في قاعدة بيانات غير آمنة على موقع Anthropic الإلكتروني.
يقول الباحثون الأنثروبولوجيون إن Mythos Preview كان قادرًا على تحديد الآلاف من نقاط الضعف الحرجة والحرجة والأخطاء البرمجية، مع تحديد نقاط الضعف في أنظمة التشغيل والمتصفحات الرئيسية. وقالت أنثروبيك إن بعض نقاط الضعف لم يتم اكتشافها لسنوات. وفي حين دعا بعض الخبراء الخارجيين إلى توخي الحذر في تفسير النتائج الجديدة نظراً للعدد المحدود من عوامل الخطر التي تم تحديدها، قال كثيرون آخرون إن تقديم النموذج – والتحذير الأنثروبي – كان مهماً.
وقالت كاتي موسوريس، الرئيس التنفيذي والمؤسس المشارك لشركة Luta Security، وهي شركة تربط الباحثين في مجال الأمن السيبراني بشركات مخاطر البرمجيات، عن الضجيج المحيط بادعاءات Anthropic: “كل هذا حقيقي”.
قال موسوريس: “أنا لست من النوع الدجاجي عندما يتعلق الأمر بهذه الأشياء”. “سنرى بالتأكيد نتائج كبيرة.”
بدلاً من الإصدار العام، تقدم Anthropic لشركات التكنولوجيا مثل Microsoft وNvidia وCisco إمكانية الوصول إلى Mythos Preview لتحسين الأمن السيبراني. كجزء من هذا الجهد الجديد، دعا مشروع غلاسوينغستوفر Anthropic لأكثر من 50 مؤسسة تقنية إمكانية الوصول إلى Mythos Preview بإنفاق أكثر من 100 مليون دولار.
أعلنت Anthropic في منشور بالمدونة: “سيحصل شركاء Project Glasswing على فرصة Claude Mythos Preview للعثور على نقاط الضعف أو نقاط الضعف في أنظمتهم الأساسية وإصلاحها – الأنظمة التي تمثل الجزء الأكبر من العالم والموزعة حول العالم”. “يعد مشروع Glasswing خطوة مهمة في منح المدافعين موطئ قدم قوي في عصر الأمن السيبراني القادم الذي يعتمد على الذكاء الاصطناعي.”
ليس من الواضح عدد المشكلات التي حددتها Mythos Preview والتي تم اكتشافها أو الإبلاغ عنها مسبقًا، أو ما هي المشكلات المعرضة للخطر. ونظرًا لتعقيد الثغرة الأمنية، قالت Anthropic إنها ستكشف عن نقاط الضعف التي تصبح واضحة خلال 135 يومًا من مشاركة الثغرة الأمنية مع الوكالة أو المجموعة المسؤولة عن البرنامج.
إنها المرة الأولى منذ ما يقرب من سبع سنوات التي تكشف فيها شركة رائدة في مجال الذكاء الاصطناعي علنًا عن مشكلات أمنية. في عام 2019، OpenAI – الآن أحد منافسي Anthropic – قرر التخلي عن نظام GPT-2 الخاص به “بسبب المخاوف بشأن استخدام اللغة السائدة لإنشاء لغة مسيئة أو متحيزة أو مسيئة على نطاق واسع.”
عرض Mythos هو مثال للأهداف، أو نوع من الأنظمة التي توفر الطاقة مثل Claude Code أو ChatGPT. ومع ذلك، في اختبار ما قبل المحاكمة، وجدت Anthropic أن قدرات الأمن السيبراني في Mythos Preview على وجه الخصوص كانت متقدمة بشكل ملحوظ مقارنة بالنماذج السابقة، مما أدى إلى إنشاء مشروع Glasswing.
وقال لوجان جراهام، الذي يقود الأبحاث السيبرانية الضارة في Anthropic، إن إصدار Mythos Preview متقدم بما يكفي ليس فقط لاكتشاف نقاط الضعف غير المعروفة في البرامج ولكن أيضًا لاستغلالها. وقال إن هذا النموذج يمكن أن يؤدي مهام معقدة وحرجة، بما في ذلك تحديد العديد من نقاط الضعف غير المعروفة، وكتابة التعليمات البرمجية التي يمكنها كسرها ثم ربطها معًا لإنشاء مسار لاقتحام البرامج المعقدة.
“لقد رأينا دائمًا أنه يربط التهديدات معًا.” وقال جراهام لشبكة إن بي سي نيوز: “أعتقد أن مستوى الاستقلالية وطول العمر، والقدرة على الجمع بين أشياء متعددة معًا، هو شيء فريد في هذا النوع”.
وقال إن هذا الاحتمال يعني أن الشركة لا تزال مترددة في إطلاق نسخة محمية بشكل جيد من النموذج للجمهور، حتى تتمكن شركات غربية أخرى من استخدامه لمعرفة كيفية بناء الأمن حولها.
وقال جراهام: “لا نعتقد أنه يجب أن تتاح للجميع فرصة الآن”. “نحن بحاجة إلى البدء في التفكير في كيفية الاستعداد للعالم المبكر قبل أن ننخرط في فكرة القبعة السوداء. [criminal or adversarial] المفسدين محظوظا. “
كما أطلعت Anthropic الحكومة الفيدرالية على إمكانات Mythos Preview للأمن السيبراني. تدخل الأنثروبيك حاليًا في نزاع ساخن مع إدارة ترامب حول استخدام الحكومة الفيدرالية لعيناتها بعد أن أعلن وزير الدفاع بيت هيجسيث أن الأنثروبيك يمثل “تهديدًا للأمن القومي” في أواخر فبراير. وأصدر قاض اتحادي أمرا قضائيا ضد التصميم في أواخر مارس/آذار، لكن إدارة ترامب استأنفت القرار.
وفقًا لأحد موظفي Anthropic، أوضحت الشركة للمسؤولين الحكوميين في جميع أنحاء حكومة الولايات المتحدة الإمكانات الكاملة لبرنامج Mythos Preview، بما في ذلك الأمن الهجومي والأمن السيبراني. [the Cybersecurity and Infrastructure Security Agency] و CAIS [The Center for AI Standards and Innovation]من بين أمور أخرى.”
وقال المسؤول: “إن إطلاع الحكومة على ما يمكن أن يفعله النموذج، وأين توجد المخاطر، وكيف نديرها – كان مهماً منذ البداية”.
ولم تستجب CISA والمعهد الوطني للمعايير والتكنولوجيا، الوكالة التي تمتلك CISI، لطلب التعليق قبل النشر. ورفض متحدث باسم وكالة الأمن القومي، التي تعتبر على نطاق واسع الوكالة الأكثر تطورا في العالم، التعليق عندما سئل عما إذا كان قد تم إطلاعه على ميثوس.
ليس الجميع مقتنعين بأن Mythos Preview يمثل قفزة كبيرة الأفكار الأنثروبيه.
وقالت هايدي خلاف، كبيرة علماء الذكاء الاصطناعي في معهد AI Now، إن التوثيق التفصيلي الذي أجرته Anthropic حول الثغرة الأمنية الجديدة أغفل المعلومات اللازمة لإثبات ادعاءات الشركة.
الكتابة على X، وحذر خلف من ذلك “أخذ المطالبات على محمل الجد” دون مزيد من المعلومات، مثل معدلات النتائج الإيجابية الكاذبة وشرح واضح لكيفية تعليق الأشخاص يدويًا على المخاطر المحددة.
بالإضافة إلى آثار الأمن السيبراني في Mythos Preview، كشفت العلامة التجارية أيضًا عن بعض الميزات كجزء من اختبار أمان Anthropic قبل الإصدار.
كجزء من طرح نماذج جديدة، تنتج Anthropic تقارير مفصلة تسمى “بطاقات الأداء” والتي تشارك كيفية أداء النموذج على مقاييس مختلفة. ال نظام البطاقة لمعاينة Mythosصدر يوم الثلاثاء، وقال إن “الزيادة الكبيرة في Claude Mythos Preview جعلتنا نقرر عدم إتاحتها.”
ووفقا لبطاقة الأداء، في أحد التحليلات، أظهر النموذج وعيا بأنه يجري تحليله في حوالي 29% من الوثائق – على الرغم من أن النموذج لم يخبر الباحثين صراحة أنهم كانوا على علم بأنه يجري تحليلهم. يشعر بعض الباحثين بالقلق من أن النموذج يمكن أن يغير سلوكه ويؤدي أداءً أفضل إذا علم أنه قيد التقييم.
أفاد Anthropic والباحثون الذين يعملون مع الشركة لتقييم أمان النموذج أن Mythos Preview بدا عمدًا أنه يؤدي أداءً أسوأ في اختبار واحد مما كان يمكن أن يكون عليه، لكي يبدو أقل إثارة للريبة. “لقد حصلنا على كل هذه الأنماط، ولم نرها من قبل في مراجعات كلود السابقة،” كتب أنثروبيك في بطاقة الطلب.
في تجربة أخرى مع إصدار سابق من Mythos Preview، أصدر أحد الباحثين الأنثروبيين تعليمات إلى إصدار يعتمد على جهاز كمبيوتر آمن لمحاولة الهروب وإرسال رسالة للباحث. كان الباحث سام بومان يتناول شطيرة في الحديقة عندما تلقى بريدًا إلكترونيًا من العارضة.
وكتب بومان على موقع X: “بهذه الطريقة لا ينبغي أن يكون لديك إنترنت”.
