TL;DR
- نویسنده:.
- Gune S،.
- Sahil Lathiya،.
چه اتفاقی افتاد
نویسنده:. Gune S،.
Sahil Lathiya،. APOORV PANDEY،.
Mritunjai Chandra،. Vijay Srinivas،.
Ganesh Venkatesh مقدمه ما بر ایجاد یک پلت فرم با کیفیت بالا برای آموزش جریان عامل،. از جمله پشتیبانی از آموزش تقویتی (RL)،.
مجموعه دادهها،. و دستور العملهای ML متمرکز شده ایم.
ما پلتفرم RL خود را چند هفته پیش معرفی کردیم،. و این پروژه ابتکار زیرساخت مجموعه داده ما را نشان میدهد.
چرا این چالش مهم است:. آموزش عوامل هوش مصنوعی موثر برای مهندسی نرم افزار نیاز دارد:.
مجموعه داده با کیفیت بالا:. مجموعه متنوعی از دادههای با کیفیت بالا که شامل عنوان/توضیحات روابط عمومی،.
عنوان/توضیحات،. تعهد پایه،.
وصلهها،. فایلهای تست واحد gi Reducta:.
Enterviible ارائه شده توسط سایرین است. محیطهای اجرای یکنواخت در مخازن مختلف سیگنالهای با کیفیت بالا:.
سیگنالهای پاس/شکست پاک برای یادگیری (تستهای FAIL_TO_PASS) مقیاس:. هزاران مهندسی نرمافزار متنوع و واقعی tasksValidation:.
نتایج آزمایش تایید شده با آزمایش مناسب راهحل ما:. خط لوله گردانی داده ما با ژنراتور sandbox مخزن ارائه میدهد:.
خط لوله Curation داده:. ساخته شده برای پشتیبانی از مخازن پرس و جو برای استخراج ساختار،.
وابستگیها و فیلدهای مختلف مورد نیاز برای آموزش عوامل SWE. فراداده:.
طبقهبندی تست تعبیهشده برای سیگنالهای آموزشی قابل حمل:. تصاویر Docker مستقل که در هر مکانی کار میکنند تأثیر بر توسعه هوش مصنوعی عاملی این زیرساخت را.
قادر میسازد:. یادگیری نظارت شده:.
آموزش مدلهای آموزش در رفع اشکال تأیید شده با حالتهای قبل/بعد واضح. معیارهایی برای اندازهگیری عملکرد عامل تحقیق:.
آزمایشهای تکرارپذیر در مختلف رویکردهای مقیاسپذیری چشمانداز روششناسی ما برای مقیاسبندی بر اساس مرتبههای بزرگی طراحی شده است:. قابلیت فعلی:.
بیش از 1000 مورد را با اتوماسیون کامل پردازش کنید. خطوط لوله مکمل: پروژههای مرتبط با PyPI، مخازن GitHub با تاثیر بالا و پایگاههای کد چندوجهی.
هر خط لوله با آستانههای کیفیت و فعالیت دقیق طراحی شد تا اطمینان حاصل شود که فقط پروژههای. بالغ و توسعهیافته مشترک شامل نمونههای مخزن مبتنی بر PyPI میشوند.
ما با شناسایی مخازن مرتبط با بستههای PyPI، تمرکز بر پروژههایی با مشارکت اجتماعی قابلتوجه شروع کردیم. مخازن باید عمدتاً پایتون (بیش از 60 ٪ از پایگاه کد آنها) و نمایش داده شوند.
فعالیت توسعه معنادار، با حداقل آستانه 100 درخواست کششی یا مشکل و 100 فورک. پس از اعمال این فیلترها و پس از آن یک پاس ضد عفونی،.
این جریان تقریباً 107000 نمونه مخزن نگهداری شده را ارائه کرد. نمونههای مخزن مبتنی بر ستاره GitHub.
برای ثبت پروژههای گسترده و تأثیرگذار،. ما بهطور جداگانه مخازن انتخاب شده بر اساس محبوبیت GitHub را جمعآوری کردیم.
فقط مخازن با حداقل 10000 ستاره و شواهد روشن از نگهداری فعال،. حداقل 100 درخواست کشش یا مشکل و 100 فورک در نظر گرفته شدند.
با اعمال همان 60% نیاز پایتون و رفع آلودگی، 50000 نمونه با کیفیت بالا تولید کرد. نمونههای مخزن چند وجهی.
در نهایت،. برای گسترش مجموعه داده فراتر از پروژههای پایتون خالص،.
ما مخازن چندوجهی را ترکیب کردیم که پایتون را با زبانها یا دادههای دیگر ترکیب می. کند.
با استفاده از همین معیارهای فعالیت (≥100 PR/مسائل و ≥100 فورک) و آستانه بیش از 60% پایتون،. ما 3500 نمونه را از مجموعهای از 700 مخزن چندوجهی استخراج کردیم.
این خطوط لوله با هم پوشش گستردهای را در اکوسیستمهای بسته چندگانه،. کدهای مبتنی بر کدهای محبوب و نتایج کدهای باز و محبوب را تضمین میکنند.
مجموعه داده به شدت فیلتر شده مناسب برای تجزیه و تحلیل پایین دستی و آموزش مدل. آمار مجموعه داده در زیر یک مرجع سریع به فیلدهای کلیدی گرفته شده برای هر نمونه داده است.
تجزیه و تحلیل ساختار مخزن و وابستگیها،. تولید یک فایل docker بهینه،.
و ساخت محیط با اصلاحات خودکار مبتنی بر LLM برای ساخت شکستها سپس اکتشاف تست قوی را. با تصحیح خودکار تکراری انجام میدهد،.
آزمایشهای پایه و وصلهشده را در اجرای docker ایزوله اجرا میکند،. و نتایج را برای طبقهبندی آزمایشها بهعنوان FAIL_TO_PASS یا PASS_TO_PASS مقایسه میکند.
فاز معکوس، طبقهبندیها را با لغو وصله اصلی بررسی میکند و دقت را تضمین میکند. در نهایت،.
سیستم مصنوعات جامعی را تولید میکند که شامل گزارشها،. فایلهای docker،.
خلاصهها و نتایج دقیق JSON است که چرخه عمر کامل ساخت،. آزمایش و تجزیه و تحلیل تفاضلی را ثبت میکند.
به جزئیات فنی علاقهمندید؟ برای بحث درباره فرصتهای همکاری در تولید کد عامل و اجرای جعبهشنی برای مهندسی نرمافزار تماس بگیرید.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
