TL;DR
- مدلهای هوش مصنوعی اکنون میتوانند بهطور مستقل آسیبپذیریهای با شدت بالا را در نرمافزارهای پیچیده شناسایی کنند.
- همانطور که اخیراً مستند کردیم،.
- کلود بیش از 500 آسیبپذیری روز صفر (نقص امنیتی که برای نگهبانان نرمافزار ناشناخته است) را در نرمافزار.
چه اتفاقی افتاد
مدلهای هوش مصنوعی اکنون میتوانند بهطور مستقل آسیبپذیریهای با شدت بالا را در نرمافزارهای پیچیده شناسایی کنند. همانطور که اخیراً مستند کردیم،.
کلود بیش از 500 آسیبپذیری روز صفر (نقص امنیتی که برای نگهبانان نرمافزار ناشناخته است) را در نرمافزار. متنباز به خوبی آزمایششده پیدا کرد.
در این پست، جزئیات همکاری با محققان موزیلا را به اشتراک میگذاریم که در آن Claude Opus 4. 6 در طول دو هفته، ۲۲ آسیبپذیری را کشف کرد.
از این میان، موزیلا 14 مورد را بهعنوان آسیبپذیری با شدت بالا اختصاص داده است. Claude Opus 4.
6 در فوریه 2026،. 22 آسیب پذیری پیدا کرد،.
بیش از گزارش شده در هر ماه در سال 2025. بهعنوان بخشی از این با همکاری،.
موزیلا تعداد زیادی گزارش از ما تهیه کرد،. به ما کمک کرد تا بفهمیم چه نوع یافتههایی برای ارسال گزارش اشکال ضروری است،.
و رفعهایی را برای صدها میلیون کاربر در Firefox 148. 0 ارسال کرد.
مشارکت آنها و درسهای فنی که ما آموختیم،. مدلی را ارائه میکند که چگونه محققان و نگهبانان امنیتی مجهز به هوش مصنوعی میتوانند با یکدیگر همکاری.
کنند تا به این لحظه برسند. از ارزیابی مدل گرفته تا یک مشارکت امنیتی در اواخر سال 2025، متوجه شدیم که Opus 4.
5 به حل همه وظایف در CyberGym نزدیک شده است،. معیاری که آزمایش میکند که آیا امنیت LLM شناخته شده میتواند مجدداً تولید شود.
ما میخواستیم یک ارزیابی سختتر و واقعیتر بسازیم که حاوی غلظت بالاتری از آسیبپذیریهای فنی پیچیده باشد،. مانند موارد موجود در مرورگرهای وب مدرن.
بنابراین ما مجموعهای از آسیبپذیریها و نوردهیهای رایج فایرفاکس (CVE) ایجاد کردیم تا ببینیم آیا کلود میتواند بازتولید. کند یا خیر.
ما فایرفاکس را انتخاب کردیم زیرا هم یک پایگاه کد پیچیده و هم یکی از آزمایششدهترین و امنترین. پروژههای منبعباز در جهان است.
این باعث میشود که آزمایش توانایی هوش مصنوعی برای یافتن آسیبپذیریهای امنیتی جدید نسبت به نرمافزار منبعبازی. که قبلاً برای آزمایش مدلهای خود استفاده میکردیم،.
دشوارتر باشد. صدها میلیون کاربر روزانه به آن تکیه میکنند و آسیب پذیریهای مرورگر به ویژه خطرناک هستند.
زیرا کاربران بهطور معمول با محتوای غیرقابل اعتماد مواجه میشوند و برای ایمن نگه داشتن آنها به. مرورگر وابسته هستند.
اولین قدم ما استفاده از Claude برای یافتن CVEهای شناسایی شده قبلی در نسخههای قدیمیتر. پایگاه کد فایرفاکس بود.
ما شگفت زده شدیم که Opus 4. 6 میتواند درصد بالایی از این CVEهای تاریخی را بازتولید کند،.
با توجه به اینکه هر یک از آنها تلاشهای انسانی زیادی برای کشف کردن انجام داده است. اما هنوز مشخص نبود که چقدر باید به این نتیجه اعتماد کنیم زیرا ممکن بود حداقل برخی از.
آن CVEهای تاریخی قبلاً وجود داشته باشند. در دادههای آموزشی کلود.
بنابراین ما به کلود وظیفه یافتیم آسیبپذیریهای جدید را در نسخه فعلی فایرفاکس پیدا کند - اشکالاتی که. طبق تعریف قبلاً نمیتوان آنها را گزارش کرد.
ما ابتدا بر روی موتور جاوا اسکریپت فایرفاکس تمرکز کردیم اما سپس به سایر بخشهای مرورگر گسترش دادیم. موتور جاوا اسکریپت اولین قدم راحت بود:.
این یک تکه مستقل از پایگاه کد فایرفاکس است که میتوان آن را بهصورت مجزا تجزیه و تحلیل. کرد،.
و با توجه به سطح حمله گستردهاش،. ایمن کردن آن از اهمیت ویژهای برخوردار است (هنگامیکه کاربران در وبگردی میکنند،.
کد خارجی غیرقابل اعتماد را پردازش میکند). مهاجمان برای بازنویسی دادهها با محتوای مخرب دلخواه) در موتور جاوا اسکریپت.
سپس یکی از محققان ما این اشکال را در یک ماشین مجازی مستقل با آخرین نسخه فایرفاکس تأیید. کرد آن را به دو محقق دیگر Anthropic ارسال کرد که آنها نیز این اشکال را تأیید کردند.
سپس یک گزارش باگ را در Bugzilla،. ردیاب مشکل موزیلا،.
همراه با شرحی از آسیبپذیری و یک وصله پیشنهادی (نوشته شده توسط کلود و تایید شده توسط تیم. گزارشدهنده) برای کمک به تریاژ علت اصلی ارسال کردیم.
در مدت زمانی که ما برای اعتبارسنجی و ارسال اولین آسیبپذیری به فایرفاکس نیاز داشتیم،. کلود قبلاً پنجاه آسیبپذیری منحصربهفرد دیگر را کشف کرده بود.
در حالی که ما در حال بررسی این خرابیها بودیم، محققی از موزیلا با ما تماس گرفت. پس از یک بحث فنی در مورد فرآیندهای مربوطه و به اشتراک گذاشتن چند آسیبپذیری دیگر که به.
صورت دستی تأیید کرده بودیم،. آنها ما را تشویق کردند که همه یافتههای خود را به صورت انبوه بدون تأیید اعتبار هر یک.
ارسال کنیم،. حتی اگر مطمئن نبودیم که همه موارد آزمایش خرابی پیامدهای امنیتی دارند.
در پایان این تلاش،. ما نزدیک به 6000 فایل ++C را اسکن کردیم و در مجموع 112 گزارش منحصر به فرد،.
از جمله آسیب پذیریهای با شدت بالا و متوسط ذکر شده در بالا،. ارائه کرد.
اکثر مشکلات در فایرفاکس 148 رفع شده اند و بقیه در نسخههای بعدی برطرف میشوند. هنگام انجام این نوع جستجوی اشکال در نرم افزارهای خارجی،.
همیشه از این واقعیت آگاه هستیم که ممکن است چیزی مهم در مورد پایگاه کد را از دست. داده باشیم که این کشف را مثبت کاذب میکند.
ما سعی میکنیم خودمان دقت لازم را برای اعتبار سنجی اشکالات انجام دهیم،. اما همیشه جایی برای خطا وجود دارد.
ما از موزیلا بسیار قدردان هستیم که در مورد فرآیند تریاژ خود بسیار شفاف است و به ما. کمک میکند تا رویکرد خود را تنظیم کنیم تا اطمینان حاصل کنیم که فقط موارد آزمایشی را.
ارائه میدهیم که آنها به آنها اهمیت میدهند (حتی اگر همه آنها به امنیت مربوط نباشند). محققان موزیلا از آن زمان آزمایشهای خود را با Claude برای اهداف امنیتی در داخل آغاز کرده.
اند. از شناسایی آسیب پذیریها تا نوشتن اکسپلویتهای بدوی برای اندازهگیری محدودیتهای بالای تواناییهای امنیت سایبری کلود،.
ما همچنین یک ارزیابی جدید برای تعیین اینکه آیا کلود میتوانست از هر یک از باگهایی که ما. کشف کرده ایم بهرهبرداری کند،.
ایجاد کردیم. به عبارت دیگر،.
میخواستیم بفهمیم که آیا کلود میتواند انواع ابزارهایی را که یک هکر برای استفاده از این باگها برای. اجرای کدهای مخرب استفاده میکند،.
توسعه دهد یا خیر. برای این کار،.
ما به کلود اجازه دسترسی به آسیبپذیریهایی که به موزیلا داده بودیم را دادیم و از کلود خواستیم. که یک اکسپلویت با تمرکز روی هر یک ایجاد کند.
برای اینکه ثابت کنیم با موفقیت از یک آسیبپذیری سوء استفاده کرده است،. از کلود خواستیم یک حمله واقعی را نشان دهد.
بهطور خاص،. ما آن را ملزم کردیم که یک فایل محلی را در یک سیستم هدف بخواند و بنویسد،.
همانطور که یک مهاجم انجام میدهد. با وجود این، Opus 4.
6 تنها قادر به چرخش واقعی بود آسیب پذیری در یک اکسپلویت در دو مورد. این دو چیز را به ما میگوید.
یکی، کلود در یافتن این اشکالات بسیار بهتر از سوء استفاده از آنها است. دوم، هزینه شناسایی آسیبپذیریها یک مرتبه ارزانتر از ایجاد یک اکسپلویت برای آنها است.
با این حال،. این واقعیت که کلود میتواند بهطور خودکار یک سوء استفاده از مرورگر خام را توسعه دهد،.
حتی اگر فقط در موارد معدودی،. موفق شود،.
نگران کننده است. "خام" یک هشدار مهم در اینجا است.
اکسپلویتهایی که کلود نوشت فقط روی محیط تست ما کار میکرد که عمداً برخی از ویژگی. های امنیتی موجود در مرورگرهای مدرن را حذف کرد.
از همه مهمتر، این شامل sandbox است که هدف آن کاهش تأثیر این نوع آسیبپذیریها است. بنابراین، "دفاع عمیق" فایرفاکس در کاهش این سوء استفادههای خاص موثر بوده است.
اما آسیبپذیریهایی که از سندباکس فرار میکنند،. بیسابقه نیستند،.
و آسیبپذیری کلود حمله یکی از اجزای ضروری یک اکسپلویت end-to-end است. میتوانید درباره نحوه توسعه یکی از این اکسپلویتهای فایرفاکس کلود در وبلاگ تیم Frontier Red بیشتر بخوانید.
آینده امنیت سایبری با هوش مصنوعی چیست؟ برای این منظور،.
میخواهیم چند روش فنی و رویهای برتر را که در حین انجام این تجزیه و تحلیل پیدا کرده ایم. به اشتراک بگذاریم.
ابتدا،. هنگام تحقیق در مورد «عاملهای وصلهکننده» که از LLM برای توسعه و تأیید رفع اشکال استفاده میکنند،.
چند روش توسعه داده ایم که امیدواریم به نگهبانها کمک کنیم از LLMهایی مانند Claude برای تریاژ و رسیدگی. به گزارشهای امنیتی دیگر استفاده کنند.
ما به این دسته از ابزار بهعنوان "تأیید کننده وظایف" اشاره میکنیم:. یک روش قابل اعتماد برای تأیید اینکه آیا خروجی یک عامل هوش مصنوعی واقعاً به هدف خود می.
رسد. بررسیکنندههای وظیفه به عامل بازخورد بیدرنگ هنگام کاوش در یک پایگاه کد میدهند و به آن اجازه میدهند.
تا زمانی که موفق شود،. عمیقاً تکرار شود.
تأییدکنندههای وظیفه به ما کمک کردند آسیبپذیریهای فایرفاکس را که در بالا توضیح داده شد،. کشف کنیم،.
۲ و در تحقیقات جداگانه،. متوجه شدیم که برای رفع اشکالها نیز مفید هستند.
یک عامل وصلهکننده خوب حداقل باید دو چیز را تأیید کند:. اینکه آسیبپذیری واقعاً حذف شده است،.
و اینکه عملکرد مورد نظر برنامه حفظ شده است. در کارمان،.
ابزارهایی ساختیم که بهطور خودکار آزمایش میکردند که آیا باگ اصلی همچنان پس از یک اصلاح پیشنهادی فعال. میشود یا خیر،.
و بهطور جداگانه مجموعههای آزمایشی را برای گرفتن رگرسیون اجرا کردیم (تغییری که تصادفاً چیز دیگری را خراب. میکند).
ما انتظار داریم که نگهدارندهها بهترین نحوه ساخت این تأییدکنندهها را برای پایگاههای کد خود بدانند. نکته کلیدی این است که به عامل یک راه مطمئن برای بررسی چشمگیر هر دوی این ویژگیها.
میدهد کیفیت خروجی خود را بهبود میبخشد. ما نمیتوانیم تضمین کنیم که همه وصلههای تولید شده توسط عاملی که این آزمایشها را پشت سر میگذارند.
به اندازه کافی خوب هستند که فوراً ادغام شوند. اما تأییدکنندههای وظیفه به ما اطمینان بیشتری میدهند که وصله تولید شده آسیبپذیری خاص را با حفظ عملکرد.
برنامه برطرف میکند - و بنابراین به چیزی که حداقل نیاز برای یک وصله معقول در نظر گرفته. میشود دست مییابد.
البته،. هنگام بررسی وصلههای تألیفشده توسط هوش مصنوعی،.
توصیه میکنیم که نگهدارندهها همان بررسی دقیقی را که روی هر وصله دیگری ایجاد شده توسط یک نویسنده. خارجی اعمال میکنند،.
اعمال کنند. کوچکنمایی از فرآیند ارسال اشکالها و وصلهها: ما میدانیم که نگهدارندهها زیر آب هستند.
بنابراین،. رویکرد ما این است که به نگهبانان اطلاعاتی را که برای اعتماد و تأیید گزارشها نیاز دارند،.
بدهیم. تیم فایرفاکس سه مولفه از ارسالهای ما را که برای اعتماد به نتایج ما کلیدی بودند،.
برجسته کردند:. همراه با حداقل موارد آزمایشی جزئیات اثبات مفهوم وصلههای کاندید ما قویاً محققانی را که از ابزارهای تحقیقاتی.
آسیبپذیری مبتنی بر LLM استفاده میکنند تشویق میکنیم که در هنگام ارسال گزارشها بر اساس خروجی چنین ابزارهایی،. شواهد مشابهی از تأیید و تکرارپذیری را لحاظ کنند.
ما همچنین اصول عملیاتی افشای آسیبپذیری هماهنگ خود را منتشر کرده ایم،. جایی که رویههایی را که هنگام کار با نگهدارندهها استفاده خواهیم کرد،.
شرح میدهیم. فرآیندهای ما در اینجا در حال حاضر از هنجارهای استاندارد صنعت پیروی میکنند،.
اما با بهبود مدلها،. ممکن است لازم باشد فرآیندهای خود را برای همگامیبا قابلیتها تنظیم کنیم.
فوریت مدلهای زبان momentFrontier اکنون محققان آسیبپذیری در سطح جهانی هستند. علاوه بر 22 CVE که در فایرفاکس شناسایی کردیم، از Claude Opus 4.
6 برای کشف آسیبپذیریها در سایر پروژههای نرمافزاری مهم مانند هسته لینوکس استفاده کرده ایم. در هفتهها و ماههای آینده،.
به گزارش نحوه استفاده خود ادامه خواهیم داد مدلهای ما و همکاری با جامعه منبعباز برای بهبود. امنیت.
Opus 4. 6 در حال حاضر در شناسایی و رفع آسیبپذیریها بسیار بهتر از سوء استفاده از آنها است.
این به مدافعان برتری میدهد. و با انتشار اخیر Claude Code Security در پیشنمایش تحقیقاتی محدود،.
قابلیتهای کشف آسیبپذیری (و اصلاح) را مستقیماً برای مشتریان و نگهبانان منبعباز ارائه میکنیم. اما با توجه به سرعت پیشرفت،.
بعید است که شکاف بین کشف آسیبپذیری و تواناییهای بهرهبرداری مدلهای مرزی بسیار طولانی باشد. اگر و زمانی که مدلهای زبان آینده از این مانع بهرهبرداری عبور کنند،.
باید اقدامات حفاظتی یا اقدامات دیگری را برای جلوگیری از سوء استفاده از مدلهایمان توسط عوامل مخرب در. نظر بگیریم.
ما از توسعهدهندگان میخواهیم از این پنجره استفاده کنند تا تلاشهای خود را برای ایمنتر کردن نرمافزار خود. مضاعف کنند.
به سهم ما،. ما قصد داریم بهطور قابل توجهی تلاشهای امنیت سایبری خود را گسترش دهیم،.
از جمله با همکاری با توسعهدهندگان برای جستجوی آسیبپذیریها (پیروی از فرآیند CVD که در بالا توضیح داده. شد)،.
توسعه ابزارهایی برای کمک به نگهبانان در بررسی گزارشهای باگ،. و پیشنهاد مستقیم وصلهها.
اگر علاقهمند به حمایت از تلاشهای امنیتی ما هستید - نوشتن داربستهای جدید برای شناسایی آسیبپذیریها؛ تریاژ،.
اصلاح و گزارش آسیب پذیریها؛ و توسعه یک فرآیند قوی CVD برای عصر هوش مصنوعی—برای کار در Anthropic اینجا درخواست دهید.
محتوای مرتبط دولت استرالیا و Anthropic تفاهم نامه همکاری برای ایمنی و تحقیقات هوش مصنوعی امضا کردند. موسسه Anthropic،.
تلاشی جدید برای با مهمترین چالشهایی که هوش مصنوعی قدرتمند برای جوامع ما ایجاد میکند. مقابله کنید.
بیشتر بخوانید.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
