TL;DR
- مشاهده PDF HTML (تجربی) چکیده: بازرسی بینایی خودکار اهمیت قابل توجهی در بازرسی صنعت دارد.
- در حالی که مدلهای زبان بزرگ چندوجهی (MLLMs) قابلیتهای درک زبان قوی را نشان میدهند و نویدبخش این.
- کار هستند،.
چه اتفاقی افتاد
مشاهده PDF HTML (تجربی) چکیده: بازرسی بینایی خودکار اهمیت قابل توجهی در بازرسی صنعت دارد. در حالی که مدلهای زبان بزرگ چندوجهی (MLLMs) قابلیتهای درک زبان قوی را نشان میدهند و نویدبخش این.
کار هستند،. عملکرد آنها به طور قابلتوجهی پایینتر از متخصصان انسانی است.
در این زمینه،. ما دو چالش کلیدی را شناسایی میکنیم:.
(1) ادغام ناکافی دانش تشخیص ناهنجاری (AD) در طول آموزش،. و (ب) فقدان تولید زبان از لحاظ فنی دقیق و آگاه از زمینه برای استدلال ناهنجاری.
برای پرداختن به این مسائل،. ما ADSeeker را پیشنهاد می کنیم،.
یک دستیار کار ناهنجار که برای بهبود عملکرد بازرسی از طریق استدلال مبتنی بر دانش طراحی شده است. ADSeeker ابتدا از یک پایگاه دانش اسناد بصری مدیریت شده،.
SEEK-M&V استفاده می کند،. که ما آن را برای رفع محدودیت های منابع موجود که صرفاً بر ساختار غیرساختاری تکیه دارند،.
می سازیم. متن SEEK-M\&V شامل توصیفهای غنی از معنایی و جفتهای تصویر- سند است که درک ناهنجاری جامعتری را امکانپذیر.
میکند. برای بازیابی و استفاده مؤثر از این دانش،.
چارچوب Query Image-Knowledge Retrieval-Augmented Generation Q2K RAG را معرفی می کنیم. برای افزایش بیشتر عملکرد در تشخیص ناهنجاری شات صفر (ZSAD)،.
ADSeeker از مکانیسم سلسله مراتبی Sparse Prompt و ویژگیهای سطح نوع برای استخراج موثر الگوهای ناهنجاری استفاده میکند. علاوه بر این،.
برای مقابله با چالش دادههای تشخیص ناهنجاری صنعتی محدود (IAD)،. مجموعه دادههای AD در مقیاس بزرگ،.
Multi-type Anomaly MulA را معرفی میکنیم که شامل 72 نوع نقص چند مقیاسی در 26 دسته است. آزمایشهای گسترده نشان میدهد که چارچوب plug-and-play ما،.
ADSeeker،. به عملکرد پیشرفتهای در چند مجموعه داده معیار دست یافته است.
موضوعات:. بازیابی اطلاعات (cs.IR) استناد به عنوان:.
arXiv:. 2508.03088 [cs.IR] (یا arXiv:.
2508.03088v2 [cs.IR] برای این نسخه) https:. //doi.org/10.48550/arXiv.2508.03088 DOI صادر شده توسط arXiv از طریق DataCite تاریخچه ارسال از:.
Kai Zhang [مشاهده ایمیل] [v1] سه شنبه،. 5 اوت 2025،.
05:. 05:.
06 UTC (3,. 871 KB) [v2] جمعه،.
3 آوریل 2026،. 07:.
52:. 22 UTC (2,.
686 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
