TL;DR
- چکیده:.
- نمایههای مبتنی بر نمودار روی دیسک برای جستجوی تقریبی نزدیکترین همسایه (ANNS) در مقیاس میلیاردی به دلیل کارایی.
- بالا و کارایی مقرونبهصرفه مورد علاقه هستند.
چه اتفاقی افتاد
چکیده:. نمایههای مبتنی بر نمودار روی دیسک برای جستجوی تقریبی نزدیکترین همسایه (ANNS) در مقیاس میلیاردی به دلیل کارایی.
بالا و کارایی مقرونبهصرفه مورد علاقه هستند. با این حال،.
سیستمهای موجود معمولاً بر یک معماری ذخیرهسازی جفتی تکیه میکنند که بردارها و توپولوژی گراف را با هم. قرار میدهد،.
که I/O اضافی قابل توجهی را در طول بهروزرسانی فهرست معرفی میکند و در نتیجه قابلیت استفاده در. بارهای کاری پویا را کاهش میدهد.
در این مقاله،. ما یک معماری ذخیرهسازی جداشده را پیشنهاد میکنیم که از نظر فیزیکی بردارهای سنگین را از توپولوژی گراف.
سبک جدا میکند. این طراحی بهطور قابل ملاحظهای عملکرد به روز رسانی را با کاهش ورودی/خروجی اضافی در طول به.
روز رسانی بهبود میبخشد. با این حال،.
تقویت I/O را در طول ANNS معرفی میکند،. که منجر به پرسوجوی کاهشیافته این URL http،.
عملکرد پرسوجو را در معماری مناسب بهروزرسانی بهبود میبخشد،. ما دو تکنیک را پیشنهاد میکنیم که با فضای ذخیرهسازی جداشده طراحی شدهاند.
ما a را توسعه میدهیم طرحبندی پویا آگاه از تشابه که قرار دادن دادهها را به صورت. آنلاین بهینه میکند،.
بهطوری که دادههای واکشی اضافی را میتوان در مراحل جستجوی بعدی مجدداً مورد استفاده قرار داد،. و بهطور مؤثر تقویت خواندن را به واکشی اولیه مفید تبدیل میکند.
علاوه بر این،. ما یک مکانیسم پرسوجو دو مرحلهای را پیشنهاد میکنیم که توسط PQ سلسله مراتبی بهبود یافته است،.
که از PQ سلسله مراتبی برای شناسایی سریع و دقیق نامزدهای امیدوارکننده استفاده میکند و اصلاح دقیق بردارهای. خام را تنها برای تعداد کمیاز کاندیداها انجام میدهد.
این طراحی بهطور قابل توجهی هم هزینه I/O و هم هزینه محاسباتی مرحله پالایش را کاهش میدهد. بهطور کلی، DGAI بهروزرسانیهای با منابع کارآمد و پرسوجوهایی با تأخیر کم را بهطور همزمان به دست میآورد.
نتایج تجربی نشان میدهد که \oursys سرعت بهروزرسانی را 8. 17 برابر برای درجها و 8.
16 برابر برای حذف بهبود میبخشد،. در حالی که اوج تأخیر پرس و جو را تحت بارهای کاری مختلط تا 67 درصد در مقایسه.
با خطوط پایه پیشرفته کاهش میدهد. صفحه پایگاههای داده (cs.
DB)؛ بازیابی اطلاعات (cs. IR) ارجاع بهعنوان: (یا v4 [cs.
DB] برای این نسخه) https: // [cs. DB] Jiahao Lou [مشاهده ایمیل] [v1] چهارشنبه،.
29 اکتبر 2025،. 11:.
20:. 10 UTC (1,.
139 KB) [v2] Thu,. 11 Dec 2025 21:.
14:. 45 UTC (196 KB) [v3] Thu,.
2 B 151 KB,. 2 Apr 2020 [v4] جمعه،.
3 آوریل 2026،. 02:.
01:. 12 UTC (1,.
218 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
