TL;DR
- چکیده:.
- شناسایی کلمات کلیدی تعریف شده توسط کاربر (KWS) بدون توسل به دادههای آموزشی از پیش برچسبگذاریشده مخصوص دامنه،.
- در ساخت رابطهای صوتی سازگار و شخصیشده از اهمیت اساسی برخوردار است.
چه اتفاقی افتاد
چکیده:. شناسایی کلمات کلیدی تعریف شده توسط کاربر (KWS) بدون توسل به دادههای آموزشی از پیش برچسبگذاریشده مخصوص دامنه،.
در ساخت رابطهای صوتی سازگار و شخصیشده از اهمیت اساسی برخوردار است. با این حال،.
چنین سیستمهایی هنوز با چالشهای سختی از جمله منابع محاسباتی محدود و دادههای آموزشی مشروح محدود مواجه هستند. روشهای موجود همچنین برای تشخیص کلمات کلیدی مشابه از نظر صوتی با مشکل مواجه هستند که اغلب منجر.
به نرخ هشدار نادرست مزاحم (FAR) در استقرار در دنیای واقعی میشود. برای کاهش این محدودیتها،.
ما MALEFA را ارائه کردیم،. یک چارچوب جدید KWS بدون شات که بهطور مشترک هم ترازیهای گفتار و سطح واج را از طریق توجه.
متقاطع و یک هدف یادگیری متضاد چند دانهریزی یاد میگیرد. ارزیابیها بر روی چهار مجموعه داده معیار عمومینشان میدهد که MALEFA به دقت بالای 90 درصد دست.
مییابد که بهطور قابلتوجهی FAR را به 0. 007 درصد در AMI کاهش میدهد.
مجموعه داده فراتر از عملکرد قوی،. MALEFA کارایی محاسباتی بالایی را نشان میدهد و میتواند به آسانی از استقرار بلادرنگ در دستگاههای با محدودیت.
منابع پشتیبانی کند. پذیرفته شده توسط ICASSP 2026.
5 صفحه، 4 شکل پردازش صدا و گفتار (eess. AS) استناد بهعنوان: (یا v1 [eess.
AS] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) مرجع مجله:.
Proc. کنفرانس بین المللی IEEE در آکوستیک،.
پردازش گفتار و سیگنال (ICASSP)،. 2026 تاریخچه ارسال از:.
Lo-Ya Li [مشاهده ایمیل] [v1] شنبه،. 4 آوریل 2026،.
11:. 22:.
49 UTC (905 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
