TL;DR
- arXiv:.
- 2604.03057v1 نوع اعلام:.
- جدید چکیده:.
چه اتفاقی افتاد
arXiv:. 2604.03057v1 نوع اعلام:.
جدید چکیده:. این مقاله یک روش منبع باز ارائه می دهد که به کاربران اجازه می دهد مجموعه داده های.
ساختاریافته غیر متنی را از طریق زبان طبیعی پرس و جو کنند،. بر خلاف Retrieval Augmented Generation RAG که با اطلاعات عددی و بسیار ساختاریافته مبارزه می کند،.
رویکرد ما یک LLM را آموزش می دهد تا از این خط لوله آموزشی قابل اجرا پشتیبانی کند. تولید جفتهای پاسخ سؤال متنوع که هم هدف کاربر و هم معنایی مجموعه دادههای زیربنایی را به تصویر.
میکشد،. ما یک مدل فشرده DeepSeek R1 Distill 8B را با استفاده از QLoRA با کوانتیزهسازی 4 بیتی تنظیم.
کردیم و سیستم را برای استقرار روی سختافزار کالا مناسب میکنیم. چند زبانه و سناریوهای مکان غیرقابل مشاهده که هم تعمیم قوی و هم تولید پرس و جو قابل.
اعتماد را نشان میدهند نتایج ما نشان میدهد که مدلهای خاص دامنه کوچک میتوانند به دقت بالایی برای. این کار دست یابند بدون تکیه بر LLMهای اختصاصی بزرگ و این روششناسی را برای محیطهای محدود منابع.
مناسب و سازگار با سیستمهای داده چندگانه گستردهتر میکند. سناریوهای موقعیت مکانی چندزبانه و نادیده تک زبانه که هم تعمیم قوی و هم تولید پرس و جو.
قابل اعتماد را نشان می دهد نتایج ما نشان می دهد که مدل های خاص دامنه کوچک می. توانند به دقت بالایی برای این کار دست یابند بدون اتکا به LLM های اختصاصی بزرگ و این.
روش را برای محیط های محدود منابع مناسب و سازگار با مجموعه داده های چندگانه گسترده تر می. کنند.
سیستم ها.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
