TL;DR
- چکیده: این مقاله به بررسی تعادل نش توزیع شده مبتنی بر جابجایی تصادفی (RR) برای بازیهای غیرهمکاری میپردازد.
- این بازی بهعنوان یک تقریب متوسط نمونه از یک بازی تصادفی با ارزش مورد انتظار زیربنایی انگیزه دارد،.
- در حالی که تمرکز الگوریتمیروی مسئله تعادل مجموع محدود حاصل شده است.
چه اتفاقی افتاد
چکیده: این مقاله به بررسی تعادل نش توزیع شده مبتنی بر جابجایی تصادفی (RR) برای بازیهای غیرهمکاری میپردازد. این بازی بهعنوان یک تقریب متوسط نمونه از یک بازی تصادفی با ارزش مورد انتظار زیربنایی انگیزه دارد،.
در حالی که تمرکز الگوریتمیروی مسئله تعادل مجموع محدود حاصل شده است. برخلاف روشهای تعادل تصادفی نش توزیعشده موجود که عمدتاً به نمونهگیری با جایگزینی تکیه میکنند،.
رویکرد پیشنهادی بهروزرسانیهای مؤلفه بدون جایگزینی را در محاسبات تعادلی روی شبکهها ترکیب میکند. ما ابتدا یک معیار اطلاعات کامل را در نظر میگیریم،.
که برای آن یک مسیر مرجع متوسط و یک واریانس درهمرفتن برای مشخص کردن دینامیک عصر عاقلانه ناشی. از RR معرفی میشوند.
سپس این روش به تنظیمات عملیتر اطلاعات جزئی-تصمیمگیری گسترش مییابد،. جایی که هر بازیکن اقدام خود را با استفاده از محلی بهروزرسانی میکند.
برآورد نمایه اقدام مشترک برای مورد اطلاعات کامل،. یک کران از نوع فرود برای تکرارهای RR ایجاد میشود.
برای مورد توزیع جزئی تصمیم-اطلاعات،. نشان داده شده است که،.
تحت پارامترهای ثابت،. الگوریتم پیشنهادی به صورت خطی به یک همسایگی از تعادل نش همگرا میشود،.
در حالی که تحت پارامترهای کاهشی،. دقیقاً به تعادل نش تقریباً بهطور قطعی و در مجذور میانگین همگرا میشود.
آزمایشهای عددی روی یک بازی شارژ EV و یک بازی پذیرش منبع لبههای غیر درجه دوم نشان میدهد. که RR بهطور مداوم از خط پایه SGD با جایگزینی معمولی در دقت حالت پایدار و عملکرد افق.
بلند بهتر عمل میکند. بهینهسازی و کنترل (math.
OC) استناد بهعنوان: (یا v1 [math. OC] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Jun Hu [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. 08:.
25:. 16 UTC (1,.
276 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
