TL;DR
- چکیده:.
- مدلهای زبان بزرگ (LLM) برای تعمیر خودکار برنامهها مؤثر هستند،.
- اما وصلههای قابل قبولی که مجموعه آزمایشی کامل را پشت سر میگذارند،.
چه اتفاقی افتاد
چکیده:. مدلهای زبان بزرگ (LLM) برای تعمیر خودکار برنامهها مؤثر هستند،.
اما وصلههای قابل قبولی که مجموعه آزمایشی کامل را پشت سر میگذارند،. اغلب کدهای بیشتری از حد لازم را بازنویسی میکنند و هزینههای بازبینی و نگهداری را افزایش میدهند.
این ویرایش بیش از حد معمول است زیرا اکثر اشکالات محلی هستند،. در حالی که تنظیم دقیق نظارت شده استاندارد هیچ سیگنال واضحی در مورد اینکه کدام نشانهها باید.
حفظ شوند و کدام یک باید تغییر کنند ارائه نمیدهد. ما PAFT را پیشنهاد میکنیم، یک روش تنظیم دقیق برای تعمیر برنامه با حداقل ویرایش.
PAFT سیگنالهای حفظ سطح رمز را با هم تراز کردن کدهای باگ و ثابت به دست میآورد،. آنها را با پوششدهی کامل توالی ترکیب میکند و برنامه درسی سختی ویرایش را اعمال میکند.
در Defects4J و HumanEval-Java، PAFT pass@1 را تا 65. 6 ٪ نسبت به تنظیم دقیق نظارت شده استاندارد (StdFT) بهبود میبخشد در حالی که میانگین فاصله.
ویرایش (AED) را تا 32. 6 ٪ کاهش میدهد.
در Defects4J با DeepSeek-Coder-6. 7B،.
PAFT همچنین بهتر از AdaPatcher،. یک خط پایه تعمیر مبتنی بر اولویت قوی است،.
و pass@1 را از 5. 9 ٪ به 10.
1 ٪ بهبود میبخشد در حالی که میانه AED را از 61. 0 به 42.
0 کاهش میدهد. بهطور کلی،.
PAFT زمینه پایدار را حفظ میکند و ویرایشها را روی مناطق معیوب متمرکز میکند،. وصلههای کوچکتر،.
محلیتر و قابل قبولتر را بدون جستجوی زمان استنتاج،. رتبهبندی مجدد یا پس پردازش به دست میدهد.
مهندسی نرم افزار (cs. SE) استناد بهعنوان: (یا v1 [cs.
SE] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Boyang Yang [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
15:. 35:.
47 UTC (808 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
