TL;DR
- چکیده:.
- پذیرش سریع محاسبات با دقت پایین در هوش مصنوعی و محاسبات لبه،.
- تقاضای زیادی برای واحدهای چند برابر انباشته ممیز شناور (MAC) با انرژی کارآمد و انعطاف پذیر ایجاد کرده.
چه اتفاقی افتاد
چکیده:. پذیرش سریع محاسبات با دقت پایین در هوش مصنوعی و محاسبات لبه،.
تقاضای زیادی برای واحدهای چند برابر انباشته ممیز شناور (MAC) با انرژی کارآمد و انعطاف پذیر ایجاد کرده. است.
این مقاله یک موتور پردازش MAC نقطه شناور با دقت دوگانه را ارائه میکند که از فرمتهای FP8. (E4M3،.
E5M2) و فرمتهای FP4 (E2M1،. E1M2) پشتیبانی میکند،.
که بهطور خاص برای بارهای کاری هوش مصنوعی کم مصرف و توان عملیاتی بالا بهینهسازی شدهاند. معماری پیشنهادی از یک تکنیک پارتیشن بندی بیت جدید استفاده میکند که یک ضریب واحد 4 بیتی.
را قادر میسازد تا بهعنوان یک ضرب کننده استاندارد 4x4 برای FP8 یا بهعنوان دو ضرب کننده. موازی 2x2 برای عملوندهای 2 بیتی عمل کند و به 100 درصد استفاده از سخت افزار بدون منطق.
تکراری دست یابد. موتور پردازش پیشنهادی با استفاده از فناوری 28 نانومتر به فرکانس کاری 1.
94 گیگاهرتز با مساحت 0. 00396 میلیمتر^2 دست مییابد.
و مصرف برق 2. 13 مگاوات، که منجر به کاهش 60.
4 درصدی مساحت و 86. 6 درصد صرفه جویی در مصرف برق در مقایسه با طراحیهای پیشرفته میشود.
پذیرفته شده در دومین کنفرانس بین المللی نسل بعدی الکترونیک تحت حمایت ANRF (NEleX-2026) معماری سخت افزار (cs. AR)؛ رباتیک (cs.
RO)؛ پردازش صدا و گفتار (eess. AS)؛ پردازش تصویر و ویدئو (eess.
IV) استناد بهعنوان: (یا v1 [cs. AR] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Vijay Pratap Sharma [مشاهده ایمیل] [v1] دوشنبه،.
6 آوریل 2026،. 08:.
17:. 14 UTC (398 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
