TL;DR
- چکیده:.
- علیرغم پیشرفت قابل توجه،.
- سیستمهای تأیید خودکار بلندگو (ASV) معمولاً فاقد شفافیت مورد نیاز برای برنامههای کاربردی با مسئولیت پذیری.
چه اتفاقی افتاد
چکیده:. علیرغم پیشرفت قابل توجه،.
سیستمهای تأیید خودکار بلندگو (ASV) معمولاً فاقد شفافیت مورد نیاز برای برنامههای کاربردی با مسئولیت پذیری. بالا هستند.
با انگیزه نحوه انجام مقایسه سخنرانان پزشکی قانونی (FSC) توسط کارشناسان انسانی،. ما یک شبکه تأیید سخنران با قابلیت تفسیر آوایی،.
PhiNet را پیشنهاد میکنیم،. که برای تقویت تفسیر محلی و جهانی با استفاده از شواهد آوایی در تصمیمگیری طراحی شده است.
برای کاربران،. PhiNet مقایسههای دقیق سطح آوایی را فراهم میکند که بازرسی دستی ویژگیهای خاص بلندگو را امکانپذیر میکند و.
ارزیابی انتقادیتر از نتایج تأیید را تسهیل میکند. برای توسعهدهندگان، استدلال صریح در پشت تصمیمهای تأیید، سادهسازی ردیابی خطا و اطلاعرسانی انتخاب فراپارامتر ارائه میدهد.
در آزمایشهای خود،. تفسیرپذیری PhiNet را با مثالهای عملی،.
از جمله آن،. نشان میدهیم کاربرد در تحلیل تاثیر فراپارامترهای مختلف ما ارزیابیهای کمیو کیفی روشهای تفسیرپذیری پیشنهادی را انجام.
میدهیم و عملکرد راستیآزمایی گوینده را در مجموعه دادههای معیار چندگانه،. از جمله VoxCeleb،.
SITW،. و LibriSpeech ارزیابی میکنیم.
نتایج نشان میدهد که PhiNet به عملکردی قابل مقایسه با مدلهای سنتی ASV جعبه سیاه دست مییابد در. حالی که توضیحات معنادار و قابل تفسیری برای تصمیمهای خود ارائه میدهد و شکاف بین ASV و تجزیه.
و تحلیل پزشکی قانونی را پر میکند. پذیرفته شده توسط IEEE Transactions در زمینه پردازش صدا، گفتار و زبان.
کدها: این آدرس https پردازش صدا و گفتار (eess. AS)؛ صدا (cs.
SD) استناد بهعنوان: (یا v2 [eess. AS] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite تاریخچه ارسال از:. Yi Ma [مشاهده ایمیل] [v1] پنجشنبه،.
2 آوریل 2026،. 04:.
01:. 50 UTC (6,.
987 KB) [v2] شنبه،. 4 آوریل 2026،.
12:. 13:.
25 UTC (6,. 988 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
