TL;DR
- v1 نوع اعلام:.
- جدید چکیده:.
- سیستمهای تشخیص الگوی قابل اعتماد باید در ورودیهای مشابه رفتار ثابتی از خود نشان دهند و توضیحات آنها.
چه اتفاقی افتاد
v1 نوع اعلام:. جدید چکیده:.
سیستمهای تشخیص الگوی قابل اعتماد باید در ورودیهای مشابه رفتار ثابتی از خود نشان دهند و توضیحات آنها. باید ثابت بماند.
با این حال،. بیشتر ارزیابیهای هوش مصنوعی توضیحپذیر بر روی نمونهها متمرکز میشوند و به صراحت مشخص نمیکنند که آیا الگوهای.
اسناد در بین نمونههایی که کلاس مشابهی دارند یا نشاندهنده تغییرات کوچک ورودی یکسان هستند،. سازگار هستند یا خیر.
در این کار،. ما یک معیار جدید با هدف ارزیابی سازگاری توضیحات مدل پیشنهاد میکنیم،.
و اطمینان حاصل میکنیم که مدلها بهطور مداوم اهداف مورد نظر و سازگاری را تحت اختلالات حفظ برچسب. منعکس میکنند.
ما این متریک را با استفاده از یک مدل BERT از پیشآموزشدیده بر روی مجموعه داده تحلیل. احساسات SST-2،.
با تستهای استحکام اضافی روی RoBERTa،. DistilBERT،.
و IMDB پیادهسازی میکنیم،. و از SHAP برای محاسبه اهمیت ویژگی برای نمونههای آزمایشی مختلف استفاده میکنیم.
متریک پیشنهادی کمیت میکند شباهت کسینوس مقادیر SHAP برای ورودیهای با برچسب یکسان،. با هدف شناسایی رفتارهای متناقض،.
مانند اتکای مغرضانه به ویژگیهای خاص یا عدم حفظ استدلال ثابت برای پیشبینیهای مشابه. از طریق یک سری آزمایش،.
ما توانایی این معیار را برای شناسایی پیشبینیهای ناهماهنگ و ناسازگاری در توضیحات مدل ارزیابی میکنیم. این آزمایشها با معیارهای استاندارد وفاداری مقایسه میشوند تا ارزیابی کنند که آیا معیار جدید میتواند بهطور موثر.
تشخیص دهد که رفتار یک مدل از اهداف مورد نظر منحرف میشود. چارچوب پیشنهادی درک عمیقتری از رفتار مدل را با امکان تأیید دقیقتر پایداری منطقی،.
که برای ساختن سیستمهای هوش مصنوعی قابل اعتماد حیاتی است،. ارائه میکند.
با تعیین اینکه آیا مدلها برای ورودیهای مشابه به الگوهای اسناد ثابت متکی هستند یا خیر،. رویکرد پیشنهادی از ارزیابی قویتری از مدل پشتیبانی میکند.
رفتار در خطوط لوله تشخیص الگوی عملی کد ما به صورت عمومیدر https: //github. com/anmspro/ESS-XAI-Stability در دسترس است.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
