Hooshgate Models Hub

دایرکتوری حرفه‌ای مدل‌ها، ابزارها و راهنماهای راه‌اندازی

این hub فقط فهرست اسم‌ها نیست. اینجا باید بتوانید خانواده‌های مهم را کنار هم ببینید، بین open-source و proprietary تصمیم بگیرید، مسیر local/API/self-host را بفهمید و برای setup، integration و deployment به guide درست برسید.

catalog + guideopen-source / open-weightproprietarytext / image / video / audio / embedding
کل صفحه‌های پذیرفته‌شده
۱۰۲
خانواده مدل
۶۴
guide و ecosystem
۳۸
queue غیرقابل‌نمایش
۲

مرز انتشار

سطح عملیاتی پذیرفته‌شده

فقط چیزهایی public هستند که taxonomy روشن، فارسی قابل‌اتکا و surface contract مشخص داشته باشند.

family pageها قرار نیست وانمود کنند همه‌چیز را عمیق پوشش می‌دهند. این صفحه‌ها بیشتر برای browse، selection و boundary decision هستند.

guide pageها و ecosystem pageها جایی هستند که setup، runtime، integration و deployment با عمق بیشتر باز می‌شوند.

مدل‌ها و guideهای queue فقط در ادمین می‌مانند تا قبل از تکمیل pack محتوایی، فارسی، source و review وارد public surface نشوند.

خانواده مدل: ۶۴اکوسیستم / ابزار: ۲۰راهنمای نصب: ۵راهنمای integration: ۴راهنمای deployment: ۳مقایسه تصمیم‌یار: ۳پیاده‌سازی use-case: ۳family page = reference + decision layerguide page = setup / integration / deployment depth

فهرست عمومی

۵۶ صفحه مرجع

هر کارت یا family reference است، یا ecosystem/tooling page، یا guide عملی برای setup، integration و deployment.

Hugging Face

راهنماهای D3

ورود سریع به مسیرهای عملی

اگر دنبال جواب اجرایی هستید، از یکی از guideهای زیر شروع کنید؛ این‌ها برای تصمیم deployment و integration ساخته شده‌اند.

راهنمای نصب

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

راهنمای integration

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

مقایسه تصمیم‌یار

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

راهنمای integration

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

راهنمای deployment

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

راهنمای deployment

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

اکوسیستم / ابزار

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

اکوسیستم / ابزار

اکوسیستم vLLM

vLLM یکی از جدی‌ترین انتخاب‌ها برای serving مدل‌های open-weight در production است؛ مخصوصاً وقتی throughput، OpenAI-compatible API و batching برایتان مهم است.

نوع صفحه

اگر از قبل می‌دانید دنبال مدل هستید یا guide deployment و tooling می‌خواهید، از اینجا شروع کنید.

مرور بر اساس مودالیته

اول از modality شروع کن، بعد با deployment و vendor فهرست را باریک کن.

Vendorهای شاخص

برای مقایسه خانواده‌های بزرگ و proprietary/open-weight از vendor filter شروع کن.

Ecosystemهای کلیدی

برای انتخاب runtime، toolchain و stack serving از روی ecosystem وارد شوید.

Collection Browse

مسیرهای پیشنهادی برای شروع

اگر هنوز vendor یا مدل مشخصی در ذهن ندارید، از یکی از collectionهای زیر شروع کنید تا hub سریع‌تر قابل‌فهم شود.

Hooshgate Reference

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

۹۸
راهنمای deploymentاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر اجرا

ops and safety layer

استقرار

API • self-host

پیچیدگی

foundation for trust

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

vLLM Project

اکوسیستم vLLM

vLLM یکی از جدی‌ترین انتخاب‌ها برای serving مدل‌های open-weight در production است؛ مخصوصاً وقتی throughput، OpenAI-compatible API و batching برایتان مهم است.

۹۷
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

LLM serving سازمانی، endpointهای چندکاربره، self-host در مقیاس متوسط تا بالا، embedding service و migration از pilot local به production.

مسیر اجرا

self-host production-grade

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

قوی برای serving، نیازمند infra discipline

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hugging Face

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

۹۶
اکوسیستم / ابزارمتن‌بازترکیبی / متغیرمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌هایی که می‌خواهند مدل‌ها را مقایسه، weightها را مدیریت، dataset و adapter را منتشر و از یک ecosystem منسجم برای open model workflow استفاده کنند.

مسیر اجرا

ecosystem backbone

استقرار

API • محیط محلی

پیچیدگی

مرجع اصلی open modelها

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Meta

خانواده Llama

Llama یکی از مهم‌ترین خانواده‌های open-weight برای self-host، سفارشی‌سازی و ساخت stack مستقل سازمانی است.

۹۵
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

تیم‌هایی که می‌خواهند مدل را داخل زیرساخت خودشان اجرا کنند، quantize کنند، LoRA بزنند و control بیشتری روی داده و serving داشته باشند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

عملیاتی‌تر از API مدل‌ها

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Ollama

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

۹۵
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

prototype محلی، ارزیابی اولیه مدل‌های open-weight، demo داخلی، RAG سبک و backendهایی که OpenAI-compatible local endpoint می‌خواهند.

مسیر اجرا

local-first و self-host سبک

استقرار

محیط محلی • self-host

پیچیدگی

ساده برای شروع، محدود برای scale

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

macOS • Linux | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

پیاده‌سازی document AI و سندمحور

document AI فقط OCR یا chat با PDF نیست. این guide نشان می‌دهد برای ingestion، extraction، validation، citation و human review چطور یک pipeline سندمحور قابل‌اعتماد بسازید.

۹۵
پیاده‌سازی use-caseوزن‌بازCommunity / Open-weightچندوجهیمتن و چتتحلیل سندRAG و دانش سازمانی

workflowهای قرارداد، فاکتور، policy، proposal review و هر use-case که سند source-of-truth است.

مسیر اجرا

use-case implementation

استقرار

API • self-host

پیچیدگی

document-centric and validation-heavy

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۳ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: پردازش سند • محیط‌های حساس

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen Team

خانواده Qwen

Qwen یکی از خانواده‌های open-weight مهم برای تیم‌هایی است که هم multilingual support می‌خواهند و هم self-host و fine-tuning.

۹۴
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

محصولات چندزبانه، assistantهای self-host، coding workflowها و تیم‌هایی که stack open-weight اما مدرن می‌خواهند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

open-weight منعطف

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Windows | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Pixtral

Pixtral برای تیم‌هایی مناسب است که vision + text را با امکان self-host می‌خواهند و نمی‌خواهند برای OCR، سندخوانی و VLM صرفاً به APIهای بسته متکی بمانند.

۹۴
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیچت و دستیارتحلیل سند

document AI، تحلیل تصویر و PDF، بازرسی کیفیت محتوای تصویری و workflowهای چندوجهی که باید روی زیرساخت خودتان هم قابل اجرا باشند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

VLM عملیاتی با نیاز GPU

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

ggml-org / llama.cpp

اکوسیستم llama.cpp

llama.cpp برای وقتی مناسب است که کنترل دقیق روی GGUF، اجرای CPU-friendly، edge deployment یا بسته‌بندی محلی برایتان مهم‌تر از سادگی UX باشد.

۹۴
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

GGUF، edge، inference روی CPU یا GPUهای کوچک، embedded apps و تیم‌هایی که می‌خواهند behavior runtime را دقیق‌تر کنترل کنند.

مسیر اجرا

local و edge-oriented

استقرار

محیط محلی • self-host

پیچیدگی

کنترل زیاد، setup فنی‌تر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

مرور اکوسیستم fine-tuning

همه مسائل با fine-tuning حل نمی‌شود. این صفحه کمک می‌کند بفهمید چه زمانی tuning واقعاً ارزش دارد، چه زمانی retrieval یا prompt بهتر است و کدام ecosystem برای LoRA یا full training مناسب‌تر است.

۹۴
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌هایی که بعد از رسیدن به baseline خوب، به adaptation جدی فکر می‌کنند و نمی‌خواهند زودتر از موعد وارد training pipeline پرهزینه شوند.

مسیر اجرا

adaptation decision guide

استقرار

محیط محلی • self-host

پیچیدگی

high leverage, high risk

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۱۰ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: ابزار توسعه • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen

Qwen Embedding و Reranker

خانواده Qwen Embedding/Reranker برای تیم‌هایی مهم است که retrieval چندزبانه، RAG جدی و کنترل بیشتر روی embedding stack می‌خواهند.

۹۳
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG چندزبانه، semantic search، reranking روی corpus سازمانی و pipelineهایی که کیفیت retrieval برایشان حیاتی‌تر از chat model است.

مسیر اجرا

self-host یا API

استقرار

API • self-host

پیچیدگی

retrieval stack تخصصی

راهنمای مرتبط

۷ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Codestral

Codestral برای code completion، FIM و سناریوهای coding assistant مناسب است؛ مخصوصاً وقتی می‌خواهید latency بهتر و کنترل بیشتر از مدل‌های chat عمومی بگیرید.

۹۳
خانواده مدلوزن‌بازOpen model termsمتن و چتکدنویسیworkflow عامل‌محور

IDE completion، fill-in-the-middle، code generation، code editing و ابزارهای توسعه که باید روی codebase واقعی کار کنند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

کدنویسی تخصصی

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

Transformers stack

Transformers stack زمانی مناسب است که می‌خواهید روی اجرای مدل، pre/post-processing و training/inference workflow کنترل عمیق داشته باشید و حاضر باشید از سادگی runtimeهای turnkey صرف‌نظر کنید.

۹۳
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌های فنی، سرویس‌های سفارشی Python، inference با منطق اختصاصی، training/fine-tuning و کار با مدل‌هایی که runtime آماده برایشان کافی نیست.

مسیر اجرا

custom Python stack

استقرار

محیط محلی • self-host

پیچیدگی

انعطاف بالا، boilerplate بیشتر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Mistral AI

خانواده Mistral

Mistral برای تیم‌هایی جذاب است که هم self-host می‌خواهند و هم سبدی از مدل‌های تخصصی‌تر مثل coding، multimodal و document AI را در یک خانواده ببینند.

۹۲
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

سازمان‌هایی که بین API و self-host جابه‌جا می‌شوند و می‌خواهند از مدل‌های متنوع این خانواده برای code، vision و enterprise search استفاده کنند.

مسیر اجرا

API + self-host

استقرار

API • محیط محلی

پیچیدگی

خانواده متنوع، نیازمند governance

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Devstral

Devstral برای workflowهای agentic در توسعه نرم‌افزار ساخته شده است؛ جایی که model فقط کد تولید نمی‌کند، بلکه باید ابزار و context را هم درست به‌کار بگیرد.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveمتن و چتکدنویسیworkflow عامل‌محور

coding agents، tool use در توسعه، repository workflows و تیم‌هایی که code generation را در مسیر task-based می‌خواهند.

مسیر اجرا

self-host مناسب

استقرار

API • self-host

پیچیدگی

agentic coding stack

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Alibaba / Qwen

Qwen Coder

Qwen Coder برای تیم‌هایی جذاب است که coding مدل باز با ecosystem قوی Qwen، vLLM، Ollama و GGUF می‌خواهند.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveمتن و چتکدنویسیworkflow عامل‌محور

code generation، repo-aware workflows سبک، local coding assistants و self-host روی stackهای رایج.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

coding family باز

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

Diffusers stack

Diffusers بهترین انتخاب برای تیم‌هایی است که می‌خواهند image/video generation را با pipelineهای سفارشی، LoRA، control و experimentation مهندسی کنند.

۹۲
اکوسیستم / ابزارمتن‌بازOpen-source permissiveتولید تصویرویدئوتولید تصویرتولید ویدئو

تیم‌های تولید تصویر، پژوهش، pipelineهای visual generation، custom workflows و integration با adapterها و controlهای متنوع.

مسیر اجرا

custom generation stack

استقرار

محیط محلی • self-host

پیچیدگی

قوی برای experimentation و custom pipelines

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen

Qwen VL

Qwen VL خانواده‌ای است برای تیم‌هایی که VLM باز، قوی در document understanding و قابل self-host می‌خواهند و نمی‌خواهند همه چیز را به APIهای بسته بسپارند.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیچت و دستیارتحلیل سند

OCR-aware workflows، document AI، visual QA، agentهای چندوجهی و محیط‌هایی که latency و data boundary باید داخل infra خودتان کنترل شود.

مسیر اجرا

self-host یا managed endpoint

استقرار

محیط محلی • self-host

پیچیدگی

VLM باز با نیاز GPU

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Hugging Face

Text Embeddings Inference

TEI یکی از مهم‌ترین runtimeهای hub برای embedding و reranking است؛ چون self-host retrieval را از مرحله notebook به سرویس production نزدیک می‌کند.

۹۲
اکوسیستم / ابزارمتن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

embedding و reranking service، RAG داخلی، search production و تیم‌هایی که می‌خواهند open models را با runtime مخصوص retrieval بالا بیاورند.

مسیر اجرا

serving تخصصی retrieval

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

runtime ویژه embedding/reranking

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

DeepSeek

خانواده DeepSeek

DeepSeek برای تیم‌هایی مهم است که reasoning و coding را با رویکرد open-weight یا API اقتصادی‌تر بررسی می‌کنند.

۹۱
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچت و دستیاراستدلال و تحلیل

ارزیابی‌های comparative، code-heavy workloads و سازمان‌هایی که می‌خواهند بین API و self-host انعطاف داشته باشند.

مسیر اجرا

API + self-host

استقرار

API • محیط محلی

پیچیدگی

reasoning/coding محور

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Voxtral

Voxtral خانواده صوتی Mistral است برای تیم‌هایی که voice workflow می‌خواهند اما همچنان self-host و کنترل استقرار برایشان مهم است.

۹۱
خانواده مدلوزن‌بازCommunity / Open-weightصوت و گفتارتبدیل گفتار به متندستیار صوتی

speech workflows، transcript، voice agents و تیم‌هایی که می‌خواهند بین API راحت و مدل صوتی قابل‌کنترل تعادل داشته باشند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

audio pipeline عملیاتی

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

IBM

Granite 4

Granite 4 برای سناریوهای enterprise و cost-efficient جذاب است؛ مخصوصاً وقتی transparency، memory efficiency و governance برای شما مهم است.

۹۱
خانواده مدلمتن‌بازOpen-source permissiveمتن و چتچت و دستیاراستدلال و تحلیل

RAG سازمانی، agent workflowهای کنترل‌شده، edge و deploymentهای حساس که نمی‌خواهند به frontier APIهای بسته وابسته باشند.

مسیر اجرا

local / self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

SLM/LLM سازمانی

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • محیط‌های حساس

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

NVIDIA

Nemotron

Nemotron برای تیم‌هایی مناسب است که reasoning و agent workflows می‌خواهند و هم‌زمان می‌خواهند deployment را در اکوسیستم NVIDIA و NIM نگه دارند.

۹۱
خانواده مدلوزن‌بازOpen model termsمتن و چتچت و دستیاراستدلال و تحلیل

reasoning، long-context workflows، coding و serving روی GPUهای NVIDIA با NIM، vLLM یا stackهای محلی.

مسیر اجرا

NIM / vLLM / local

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

GPU-centric reasoning stack

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

Text Generation Inference (TGI)

TGI سرور inference مربوط به Hugging Face است و برای تیم‌هایی معنا دارد که stack آن‌ها از قبل حول artifactهای Hugging Face، containerized serving و الگوهای سازمانی آن شکل گرفته است.

۹۱
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

سازمان‌هایی که از قبل روی Hugging Face ecosystem سرمایه‌گذاری کرده‌اند، container-based serving می‌خواهند و deployment inference را با artifact management رسمی HF می‌بینند.

مسیر اجرا

HF-oriented self-host

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

container serving با fit سازمانی

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen

Qwen Omni

Qwen Omni برای تیم‌هایی مهم است که مدل باز چندوجهی با ورودی متن، تصویر و صدا می‌خواهند و می‌خواهند آن را در stack خودشان ادغام کنند.

۹۰
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیصوت و گفتارچت و دستیارتحلیل سند

multimodal chat، voice-enabled assistant، image + text workflows و تجربه‌های unified که نمی‌خواهند کاملاً وابسته به API بسته باشند.

مسیر اجرا

self-host ممکن

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

omni workflow

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: دستیار عمومی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Tencent Hunyuan

HunyuanVideo

HunyuanVideo برای تیم‌هایی مهم است که text-to-video یا image-to-video باز می‌خواهند و حاضرند complexity GPU و pipeline ویدئویی را مدیریت کنند.

۹۰
خانواده مدلوزن‌بازCommunity / Open-weightویدئوتولید ویدئو

video generation باز، تحقیق و توسعه روی ویدئو، pipelineهای image-to-video و تیم‌هایی که باید stack را self-host کنند.

مسیر اجرا

self-host

استقرار

self-host • محیط محلی

پیچیدگی

video generation سنگین

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

DeepSeek

DeepSeek Coder

DeepSeek Coder برای تیم‌هایی مهم است که coding model باز می‌خواهند و می‌خواهند code completion، refactor و repo Q&A را داخل infra خودشان جلو ببرند.

۹۰
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتکدنویسیچت و دستیار

IDE assistant داخلی، code review helper، generation روی repo خصوصی و pipelineهایی که self-host و cost control مهم است.

مسیر اجرا

local یا self-host

استقرار

محیط محلی • self-host

پیچیدگی

مدل کدنویسی باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

FlagOpen / BAAI

BGE Reranker

BGE Reranker برای تیم‌هایی مهم است که retrieval را فقط با embedding متوقف نمی‌کنند و می‌خواهند مرحله دوم ranking را هم دقیق و self-host جلو ببرند.

۹۰
خانواده مدلوزن‌بازOpen-source permissiveRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG دقیق‌تر، legal or policy retrieval، search pipelineهای چندمرحله‌ای و تیم‌هایی که top-k اولیه را با reranker پالایش می‌کنند.

مسیر اجرا

self-host retrieval stage

استقرار

محیط محلی • self-host

پیچیدگی

مرحله دوم retrieval

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

OpenAI

Whisper Large v3

Whisper Large v3 هنوز یکی از reference pageهای مهم برای STT باز است: ساده برای baseline، قابل self-host و مناسب برای تیمی که نمی‌خواهد transcription را فقط از API بگیرد.

۹۰
خانواده مدلمتن‌بازOpen-source permissiveصوت و گفتارتبدیل گفتار به متن

baseline transcription، archive indexing، meeting search و هر جایی که self-host STT یا cost control مهم باشد.

مسیر اجرا

local و self-host

استقرار

محیط محلی • self-host

پیچیدگی

baseline STT باز

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Hugging Face

اکوسیستم PEFT

PEFT در hub به این خاطر مهم است که لایه adaptation عملی برای modelهای باز را پوشش می‌دهد؛ یعنی جایی بین prompt-only و full fine-tuning.

۹۰
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

LoRA، adapter-based tuning، domain adaptation کم‌هزینه و تیم‌هایی که می‌خواهند experimentation را بدون full training شروع کنند.

مسیر اجرا

training-adaptation toolkit

استقرار

محیط محلی • self-host

پیچیدگی

adapter training برای مدل‌های باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Google

خانواده Gemma

Gemma برای تیم‌هایی مناسب است که مدل باز و سبک‌تر می‌خواهند، اما همچنان می‌خواهند از lineage و tooling گوگل بهره ببرند.

۸۹
خانواده مدلوزن‌بازOpen model termsمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

edge و local AI، prototypeهای self-host و تیم‌هایی که مدل بازتر اما manageable می‌خواهند.

مسیر اجرا

local / edge friendly

استقرار

محیط محلی • self-host

پیچیدگی

سبک‌تر و منعطف

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

FlagOpen / BAAI

خانواده BGE / FlagEmbedding

BGE برای تیم‌هایی مهم است که retrieval stack را کاملاً open و self-host می‌خواهند؛ از embedding تا reranker.

۸۹
خانواده مدلمتن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

مسیر اجرا

کاملاً self-host

استقرار

محیط محلی • self-host

پیچیدگی

retrieval engineering جدی

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

IBM

Granite Code

Granite Code یک خانواده باز و enterprise-friendly برای code generation است که برای تیم‌های حساس به license و governance گزینه جالبی می‌شود.

۸۹
خانواده مدلمتن‌بازOpen-source permissiveمتن و چتکدنویسی

code generation، explanation، bug fixing و ابزارهای توسعه‌ای که باید روی زیرساخت داخلی و license روشن کار کنند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

code LLM باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

AllenAI

Molmo

Molmo یک family چندوجهی باز از Ai2 است که برای تیم‌هایی جذاب می‌شود که VLM باز و پژوهش‌پذیر برای سند، تصویر و reasoning می‌خواهند.

۸۹
خانواده مدلوزن‌بازCommunity / Open-weightچندوجهیتحلیل سندچت و دستیار

visual question answering، document reading، تحلیل تصویر و پژوهش/محصولاتی که می‌خواهند روی VLM باز کار کنند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

open VLM research-to-product

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Lightricks

LTX-Video

LTX-Video برای تیم‌هایی جالب است که open video generation با سرعت بهتر و workflowهای image-to-video یا controlled generation می‌خواهند.

۸۹
خانواده مدلوزن‌بازترکیبی / متغیرویدئوتولید ویدئو

image-to-video، controlled video generation، creative tooling و تیم‌هایی که به دنبال open stack چابک‌تر از بعضی خانواده‌های سنگین‌تر هستند.

مسیر اجرا

self-host / desktop

استقرار

self-host • محیط محلی

پیچیدگی

ویدئوی باز با کنترل بیشتر

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

اکوسیستم TRL

TRL برای تیم‌هایی مهم است که از adaptation ساده عبور کرده‌اند و به SFT، DPO یا post-training جدی‌تر فکر می‌کنند.

۸۹
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

SFT، preference optimization، reward modeling و تیم‌هایی که می‌خواهند post-training را reproducible و scriptable جلو ببرند.

مسیر اجرا

post-training toolkit

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

پیچیده‌تر از adapter-only

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

مقایسه embedding و reranking

این comparison guide برای تیم‌هایی است که می‌خواهند retrieval stack را جدی انتخاب کنند: فقط embedding، embedding + reranker، یا managed retrieval API.

۸۹
مقایسه تصمیم‌یاروزن‌بازCommunity / Open-weightEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG system design، enterprise search selection و تیم‌هایی که retrieval quality برایشان KPI واقعی است.

مسیر اجرا

self-host یا managed retrieval

استقرار

محیط محلی • self-host

پیچیدگی

تصمیم‌گیری روی search stack

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۴ pack کامل • ۱ pack خلاصه • ۴ pack لینک‌شده

fit عملیاتی

Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

Stability AI ecosystem

Stable Diffusion

Stable Diffusion هنوز هم reference مهمی برای self-host، LoRA، style adaptation و freedom در generation تصویری است.

۸۸
خانواده مدلمتن‌بازترکیبی / متغیرتولید تصویرتولید تصویر

تیم‌هایی که می‌خواهند image generation را خودشان host و tune کنند یا pipeline خلاقه داخلی بسازند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

creative ops سنگین

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Windows | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

PaliGemma

PaliGemma خانواده سبک‌تر vision-language از Google است که برای captioning، visual QA و use-caseهای image understanding باز مناسب است.

۸۸
خانواده مدلوزن‌بازOpen model termsچندوجهیتحلیل سندچت و دستیار

captioning، visual question answering، image understanding و سناریوهایی که VLM باز و نسبتاً سبک می‌خواهند.

مسیر اجرا

local / managed cloud

استقرار

محیط محلی • self-host

پیچیدگی

VLM سبک‌تر

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Nomic

Nomic Embed

Nomic Embed برای تیم‌هایی مناسب است که embedding باز، compact و قابل‌استفاده در search و RAG محلی می‌خواهند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

semantic search، retrieval سبک‌تر، RAG محلی و سناریوهایی که embedding باز با footprint معقول می‌خواهند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

retrieval ساده‌تر

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

NVIDIA

Sana

Sana برای تیم‌هایی مهم است که text-to-image باز با کیفیت بالا و مسیر self-host می‌خواهند و در stack تصویری باز فعال‌اند.

۸۸
خانواده مدلوزن‌بازCommunity / Open-weightتولید تصویرتولید تصویر

text-to-image، experimentation تصویری، تولید محتوای خلاق و تیم‌هایی که diffusion باز را در کنار Stable Diffusion و FLUX می‌سنجند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

diffusion image stack

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

CodeGemma

CodeGemma برای تیم‌هایی مهم است که coding model سبک‌تر و باز می‌خواهند و ترجیح می‌دهند روی همان ecosystem Gemma/Google باقی بمانند.

۸۸
خانواده مدلوزن‌بازOpen model termsمتن و چتکدنویسیچت و دستیار

code completion سبک، local experimentation، IDE prototype و تیم‌هایی که می‌خواهند code model باز را با footprint معقول‌تر امتحان کنند.

مسیر اجرا

local-friendly

استقرار

محیط محلی • self-host

پیچیدگی

نسبتاً سبک برای code experimentation

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Mixedbread AI

mxbai Embed

mxbai Embed برای تیم‌هایی مهم است که embedding باز، سبک‌تر و مناسب self-host می‌خواهند و می‌خواهند retrieval را بدون vendor API جلو ببرند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

semantic search، RAG داخلی، workstation-friendly retrieval و تیم‌هایی که embedding باز را با TEI یا HF stack می‌خواهند.

مسیر اجرا

self-host embedding

استقرار

محیط محلی • self-host

پیچیدگی

retrieval باز و سبک

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Snowflake

Snowflake Arctic Embed

Arctic Embed برای تیم‌هایی مهم است که embedding باز با positioning سازمانی می‌خواهند و می‌خواهند retrieval stack را روی infra خود نگه دارند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

enterprise retrieval، warehouse-adjacent search، corpusهای بزرگ و تیم‌هایی که embedding باز اما سازمانی‌تر می‌خواهند.

مسیر اجرا

self-host enterprise retrieval

استقرار

محیط محلی • self-host

پیچیدگی

embedding باز برای search

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Open WebUI

اکوسیستم Open WebUI

Open WebUI برای تیم‌هایی مهم است که UI و control plane برای local یا self-host مدل‌ها می‌خواهند، نه فقط یک inference server خام.

۸۸
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

chat UI داخلی، RAG demo، تیم‌های غیرزیرساختی که می‌خواهند model access، user-facing interface و tooling را سریع ببینند.

مسیر اجرا

UI + orchestration layer

استقرار

محیط محلی • self-host

پیچیدگی

ساده برای demo، محدود برای ops سنگین

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: دستیار عمومی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

LangChain

راهنمای RAG با LangChain

این guide برای تیم‌هایی است که RAG را واقعاً implement می‌کنند و دنبال wiring بین retriever، prompt، model و evaluation هستند.

۸۸
راهنمای integrationمتن‌بازOpen-source permissiveمتن و چتEmbeddingRAG و دانش سازمانیجست‌وجوی معنایی

prototype تا implementation RAG، document pipeline، retrieval orchestration و تیم‌هایی که chain-level composition می‌خواهند.

مسیر اجرا

orchestration-first

استقرار

محیط محلی • self-host

پیچیدگی

پیاده‌سازی RAG کاربردی

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

مقایسه مدل‌های کدنویسی

این comparison guide برای تیم‌هایی است که بین GPT، Qwen Coder، DeepSeek Coder، Codestral و code modelهای مشابه گیر کرده‌اند و می‌خواهند trade-off عملی را ببینند.

۸۸
مقایسه تصمیم‌یاروزن‌بازCommunity / Open-weightمتن و چتکدنویسیworkflow عامل‌محور

انتخاب coding assistant، تعیین build-vs-buy، و تصمیم بین API proprietary و self-host code modelها.

مسیر اجرا

API یا self-host

استقرار

API • محیط محلی

پیچیدگی

تصمیم‌گیری میان چند family

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۴ pack کامل • ۱ pack خلاصه • ۴ pack لینک‌شده

fit عملیاتی

macOS | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Microsoft

خانواده Phi

Phi بیشتر وقتی مهم می‌شود که مدل کوچک‌تر، deployment سبک و integration با اکوسیستم مایکروسافت برایتان مهم باشد.

۸۷
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

copilotهای داخلی سبک، edge deployment و تیم‌هایی که Azure و Windows/ONNX مسیر مهمشان است.

مسیر اجرا

edge / local

استقرار

محیط محلی • self-host

پیچیدگی

مدل کوچک و کارآمد

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Windows • Linux | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Jina AI

Jina Reranker

Jina Reranker برای تیم‌هایی مهم است که retrieval multilingual و stage دوم ranking می‌خواهند و ترجیح می‌دهند آن را داخل stack باز یا hybrid نگه دارند.

۸۷
خانواده مدلوزن‌بازترکیبی / متغیرRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG چندزبانه، search ranking، corpusهای متنوع و pipelineهایی که precision مرحله دوم برایشان مهم است.

مسیر اجرا

self-host ranking stage

استقرار

محیط محلی • self-host

پیچیدگی

رتبه‌بندی مرحله دوم

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Apple MLX community

اکوسیستم MLX / mlx-lm

MLX / mlx-lm برای تیم‌هایی مهم است که macOS و Apple Silicon را به‌عنوان مسیر واقعی local AI می‌بینند، نه فقط fallback development machine.

۸۷
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

local inference روی مک، developer workflow، ارزیابی مدل‌های باز روی Apple Silicon و تیم‌هایی که pilot را روی لپ‌تاپ‌های مک جلو می‌برند.

مسیر اجرا

macOS local-native

استقرار

محیط محلی

پیچیدگی

بهترین fit روی Apple Silicon

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

Meta

SAM 2

SAM 2 برای تیم‌هایی مهم است که segmentation و visual prompting را به‌عنوان capability مستقل می‌خواهند، نه صرفاً یک VLM chat response.

۸۶
خانواده مدلوزن‌بازCommunity / Open-weightچندوجهیتحلیل سندworkflow عامل‌محور

image and video segmentation، annotation workflow، inspection pipeline و محصولاتی که mask و region-level output لازم دارند.

مسیر اجرا

self-host vision component

استقرار

محیط محلی • self-host

پیچیدگی

vision primitive برای segmentation

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Edge / Device | مناسب برای: پردازش سند • تحلیل ویدئو

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

NVIDIA

Parakeet

Parakeet برای تیم‌هایی مهم است که STT باز می‌خواهند اما در عین حال به performance-aware deployment و ecosystem انویدیا هم نگاه می‌کنند.

۸۶
خانواده مدلوزن‌بازOpen model termsصوت و گفتارتبدیل گفتار به متن

speech pipelineهای GPU-centric، batch or near-realtime transcription و تیم‌هایی که already روی stack انویدیا هستند.

مسیر اجرا

GPU-centric self-host

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

speech مدل باز در stack انویدیا

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

SGLang Project

اکوسیستم SGLang

SGLang برای تیم‌هایی مهم است که inference و serving را performance-first می‌بینند و می‌خواهند beyond simple vLLM-style setup به scheduling و execution توجه کنند.

۸۶
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

serving مدل‌های باز، performance-sensitive inference و تیم‌هایی که throughput و latency را جدی‌تر optimize می‌کنند.

مسیر اجرا

performance-oriented serving

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

stack inference پیشرفته‌تر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

deepset

راهنمای RAG با Haystack

این guide Haystack را به‌عنوان implementation route برای search و RAG پوشش می‌دهد؛ مخصوص تیم‌هایی که pipelineهای retrieval را structured می‌خواهند.

۸۶
راهنمای integrationمتن‌بازOpen-source permissiveمتن و چتEmbeddingRAG و دانش سازمانیجست‌وجوی معنایی

pipelineهای retrieval، document-centric systems و تیم‌هایی که Haystack-style component model را ترجیح می‌دهند.

مسیر اجرا

component-based RAG

استقرار

self-host • API

پیچیدگی

retrieval pipeline implementation

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

AI21

خانواده Jamba

Jamba برای تیم‌هایی جالب است که long-context، private deployment و enterprise workflow را در یک خانواده open model می‌خواهند.

۸۵
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچت و دستیاراستدلال و تحلیل

long-context RAG، grounded QA و سازمان‌هایی که private deployment برایشان حیاتی است.

مسیر اجرا

private deploy friendly

استقرار

API • self-host

پیچیدگی

enterprise self-host

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Alibaba / Qwen

Qwen Audio

Qwen Audio برای تیم‌هایی مهم است که مدل صوتی باز در همان ecosystem Qwen می‌خواهند و می‌خواهند voice understanding را کنار familyهای دیگر Qwen جلو ببرند.

۸۵
خانواده مدلوزن‌بازOpen-source permissiveصوت و گفتارچندوجهیتبدیل گفتار به متندستیار صوتی

voice assistant آزمایشی، multimodal audio workflows و تیم‌هایی که می‌خواهند audio understanding را self-host یا hybrid جلو ببرند.

مسیر اجرا

audio understanding باز

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

voice-capable model family

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: محصول صوتی • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

ورود سریع

ورود سریع بر اساس سناریو

اگر هنوز مطمئن نیستی دنبال چه خانواده‌ای بگردی، از shortcutهای زیر شروع کن.