TL;DR
- چکیده:.
- اسناد بدون ساختار بر دادههای ی و وب تسلط دارند،.
- اما عدم دهی صریح آنها مانع بازیابی دقیق اطلاعات میشود.
چه اتفاقی افتاد
چکیده:. اسناد بدون ساختار بر دادههای ی و وب تسلط دارند،.
اما عدم دهی صریح آنها مانع بازیابی دقیق اطلاعات میشود. روشهای بازیابی جریان اصلی کنونی،.
بهویژه جستجوی برداری مبتنی بر تعبیه،. بر تشابه معنایی درشت دانه تکیه میکنند،.
هزینه محاسباتی بالا و درخواستهای مکرر LLM برای پس پردازش را متحمل میشوند. برای پرداختن به این مسئله مهم،.
AnnoRetrieve را پیشنهاد میکنیم،. یک الگوی بازیابی جدید که از تعبیهها به حاشیهنویسی ساختاریافته تغییر میکند و امکان بازیابی معنایی دقیق و.
مبتنی بر حاشیهنویسی را فراهم میکند. سیستم ما مقایسههای برداری گران قیمت را با جستارهای ساختاری سبک وزن در طرحوارههای القا شده خودکار جایگزین.
میکند و بهطور چشمگیری استفاده از LLM و هزینه کلی را کاهش میدهد. این سیستم دو نوآوری هستهای هم افزایی را ادغام میکند:.
SchemaBoot،. که بهطور خودکار طرحهای حاشیه نویسی سند را از طریق الگوی چند دانه بندی تولید میکند.
بهینهسازی مبتنی بر اکتشاف و محدودیت،. پایهگذاری برای بازیابی مبتنی بر حاشیهنویسی و حذف طراحی طرحواره دستی،.
و بازیابی معنایی ساختاریافته (SSR)،. موتور بازیابی هسته،.
که درک معنایی را با اجرای پرسوجوی ساختیافته یکسان میکند. با استفاده از ساختار مشروح به جای تعبیههای برداری،.
SSR به تطابق معنایی دقیق دست مییابد،. استخراج ویژگی-مقدار،.
تولید جدول و استدلال پیشرو مبتنی بر SQL را بدون تکیه بر مداخلات LLM بهطور یکپارچه تکمیل میکند. این الگوی حاشیهنویسی بر محدودیتهای روشهای مبتنی بر بردار سنتی با تطبیق درشت دانه و وابستگی سنگین LLM.
و روشهای مبتنی بر نمودار با سربار محاسباتی غلبه میکند. آزمایشها بر روی سه مجموعه داده واقعی تأیید میکنند که AnnoRetrieve بهطور قابلتوجهی فرکانس تماس و هزینه بازیابی.
LLM را کاهش میدهد و در عین حال دقت بالایی را حفظ میکند. AnnoRetrieve پارادایم جدیدی را برای تجزیه و تحلیل اسناد مقرون به صرفه،.
دقیق و مقیاس پذیر از طریق ساختاردهی هوشمند ایجاد میکند. بازیابی اطلاعات (cs.
IR) بهعنوان: (یا v1 [cs. IR] برای این نسخه) استناد کنید:.
https:. // تاریخچه ارسال از:.
Teng Lin [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
03:. 34:.
19 UTC (635 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
