FlagOpen / BAAIخانواده مدلمتن‌بازبازبینی: 2026-04-22

خانواده BGE / FlagEmbedding

BGE برای تیم‌هایی مهم است که retrieval stack را کاملاً open و self-host می‌خواهند؛ از embedding تا reranker.

بهترین کاربرد

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

مسیر اجرا

کاملاً self-host

ملاحظه مهم

بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.

دسترسی سریع

پوشش صفحه مرور آموزش مسیر عملی سازگارسازی مقایسه ارزیابی منابع

لایسنس

Open-source / MIT variants

پیچیدگی

retrieval engineering جدی

تسک‌ها

جست‌وجوی معنایی • RAG و دانش سازمانی

مودالیته‌ها

Embedding / بردارسازی • Reranking / بازرتبه‌بندی • چندوجهی

پوشش واقعی

این صفحه چه packهایی را واقعاً پوشش می‌دهد؟

مرور مدل

کامل

این صفحه باید اول به‌عنوان مرجع شناخت، fit و boundary تصمیم‌گیری قابل اتکا باشد.

آموزش عملی

کامل

سناریوی شروع و مسیر استفاده اولیه روی همین صفحه آمده است.

نصب و راه‌اندازی

خلاصه روی همین صفحه

روی family page فقط مسیرهای recommended و trade-offها آمده تا browse و selection تمیز بماند.

راهنمای شروع local روی ویندوز، مک و لینوکس

serving و runtime

خلاصه روی همین صفحه

این pack در سطح family/reference خلاصه شده تا انتخاب مسیر اجرا سریع‌تر شود.

راهنمای شروع local روی ویندوز، مک و لینوکس راه اندازي self-host براي LLM در production

پیاده‌سازی

خلاصه روی همین صفحه

روی family page فقط patternها و بلوک‌های معماری اصلی برای انتخاب سریع آمده است.

راهنمای integration برای RAG

سازگارسازی

خلاصه روی همین صفحه

روی family page فقط fit و caveatهای tuning گفته می‌شود؛ playbook عمیق باید جداگانه دنبال شود.

استقرار

خلاصه روی همین صفحه

روی family/reference page فقط deployment fit، cost و caveatهای اصلی آمده است.

مقايسه stackهاي serving و inference راه اندازي self-host براي LLM در production

مقایسه

کامل

این صفحه باید به تصمیم‌گیری بین گزینه‌ها کمک کند، نه صرفاً معرفی.

مقايسه stackهاي serving و inference مقایسه embedding و reranking

ارزیابی

کامل

بدون eval و quality gate این hub نباید overclaim کند؛ بنابراین checklist ارزیابی روی صفحه آمده است.

منابع رسمی

کامل

منابع رسمی و مسیر مطالعه بیشتر باید روی هر صفحه کامل و شفاف باشد.

مرور مدل

این مدل چیست و کجا می‌درخشد؟

BGE و FlagEmbedding را باید یک toolkit واقعی برای retrieval دانست، نه صرفاً یک مدل.

اگر می‌خواهید embedding، reranking و حتی بخشی از ارزیابی retrieval را self-host نگه دارید، این خانواده اهمیت زیادی پیدا می‌کند.

نقاط قوت

embedding و reranker open
مناسب برای VPC/on-prem search stack
برای تیم‌های retrieval-first ابزار و اسناد خوبی دارد

محدودیت‌ها

نیازمند eval discipline و ops maturity
برای تیم‌های API-first شاید سنگین باشد

تفاوت کلیدی

سه نکته‌ای که این خانواده را از گزینه‌های هم‌رده جدا می‌کند.

نکته 1

در برابر OpenAI/Voyage/Jina، آزادی کامل استقرار و tuning می‌دهد.

برای چه مناسب است

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.
وقتی self-host و open retrieval stack می‌خواهید
وقتی embedding و reranking هر دو باید داخل VPC بمانند

برای چه مناسب نیست

بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.
وقتی تیم شما retrieval engineering بلد نیست

آموزش عملی

RAG self-host با BGE

ساخت یک retrieval stack داخلی بدون وابستگی API

مرحله 1

embedding model و reranker مناسب را انتخاب کنید.

مرحله 2

vector DB و pipeline ingestion را راه بیندازید.

مرحله 3

query-document ground truth بسازید.

مرحله 4

top-k retrieval و reranked top-n را جدا بسنجید.

نمونه ورودی

سوال کاربر از اسناد داخلی

خروجی مورد انتظار

retrieved chunks و reranked shortlist

خطاهای رایج

اشتباه‌هایی که معمولاً باعث می‌شوند pilot یا implementation شکست بخورد.

نکته 1

بدون reranker، embedding تنها در بعضی corpusها کافی نیست.

مسیر عملی

setup، runtime، integration و deployment در این family

مسیرهای setup

pilot محلی: discovery، prompt testing و single-user evaluation
self-host عملیاتی: data residency، volume پایدار، customization یا economics قابل‌پیش‌بینی

انتخاب runtime و serving path

local run: pilot محلی، prompt workshop و team evaluation
self-host: data residency، workload پایدار، custom serving و optimization اقتصادی در scale

مسیرهای integration

backend integration: اکثر appها و workflowهای جدی که باید provider/runtime را پشت backend پنهان کنند
RAG / document integration: دانش سازمانی، policy assistant و workflowهای سندمحور
enterprise workflow: محصولات چندتیمی، taskهای حساس و rollout مرحله‌ای

یادداشت deployment

embedding service
reranker service
dataset drift را جدی بگیرید
evaluation دوره‌ای ضروری است
در self-host retrieval، هزینه اصلی در index build، reranking و نگهداری pipeline پخش می‌شود.

production و ریسک

offline eval و success criteria
staging با tracing و feature flag
artifact trust، network policy و access control را قبل از launch روشن کنید.
بدون reranker، embedding تنها در بعضی corpusها کافی نیست.
بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.

guideهای مکمل برای عمق بیشتر

روی family page فقط decision layer آمده است. برای playbook عمیق‌تر یکی از مسیرهای زیر را باز کنید.

setup و onboarding

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

integration و implementation

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

deployment و serving

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

سازگارسازی

Fine-tuning

وضعیت پشتیبانی

برای تیم‌های retrieval engineering جدی قابل انجام است

مسیرهای پیشنهادی

embedding fine-tune
reranker fine-tune
domain adaptation

یادداشت‌های عملیاتی

اگر benchmark ندارید، fine-tuning انجام ندهید.

مقایسه

چه زمانی BGE مناسب است؟

وقتی این مدل انتخاب خوبی است

وقتی self-host و open retrieval stack می‌خواهید
وقتی embedding و reranking هر دو باید داخل VPC بمانند

وقتی باید سراغ گزینه دیگر رفت

وقتی تیم شما retrieval engineering بلد نیست

نقشه تصمیم

اگر هنوز بین این خانواده و گزینه‌های رقیب مردد هستید، از این trade-off path شروع کنید.

بلوک 1

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

بلوک 2

کاملاً self-host

بلوک 3

بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.

Voyage

چه زمانی خانواده BGE / FlagEmbedding بهتر است

برای self-host و customization، BGE مزیت دارد.

چه زمانی گزینه مقابل بهتر است

برای API simplicity و سریع‌شدن پروژه، Voyage بهتر است.

Cohere Rerank

چه زمانی خانواده BGE / FlagEmbedding بهتر است

اگر همه چیز باید self-host بماند، BGE بهتر است.

چه زمانی گزینه مقابل بهتر است

برای API-based reranking ساده، Cohere راه کوتاه‌تری است.

ارزیابی

Checklist ارزیابی

مرحله 1

ground-truth retrieval set

مرحله 2

embedding vs rerank ablation

مرحله 3

periodic re-eval

منابع رسمی

منابع رسمی و مسیر مطالعه بیشتر

FlagEmbedding GitHub

https://github.com/FlagOpen/FlagEmbedding

FlagOpen GitHub org

https://github.com/FlagOpen