Hooshgate Models Hub

دایرکتوری حرفه‌ای مدل‌ها، ابزارها و راهنماهای راه‌اندازی

این hub فقط فهرست اسم‌ها نیست. اینجا باید بتوانید خانواده‌های مهم را کنار هم ببینید، بین open-source و proprietary تصمیم بگیرید، مسیر local/API/self-host را بفهمید و برای setup، integration و deployment به guide درست برسید.

catalog + guideopen-source / open-weightproprietarytext / image / video / audio / embedding
کل صفحه‌های پذیرفته‌شده
۱۰۲
خانواده مدل
۶۴
guide و ecosystem
۳۸
queue غیرقابل‌نمایش
۲

مرز انتشار

سطح عملیاتی پذیرفته‌شده

فقط چیزهایی public هستند که taxonomy روشن، فارسی قابل‌اتکا و surface contract مشخص داشته باشند.

family pageها قرار نیست وانمود کنند همه‌چیز را عمیق پوشش می‌دهند. این صفحه‌ها بیشتر برای browse، selection و boundary decision هستند.

guide pageها و ecosystem pageها جایی هستند که setup، runtime، integration و deployment با عمق بیشتر باز می‌شوند.

مدل‌ها و guideهای queue فقط در ادمین می‌مانند تا قبل از تکمیل pack محتوایی، فارسی، source و review وارد public surface نشوند.

خانواده مدل: ۶۴اکوسیستم / ابزار: ۲۰راهنمای نصب: ۵راهنمای integration: ۴راهنمای deployment: ۳مقایسه تصمیم‌یار: ۳پیاده‌سازی use-case: ۳family page = reference + decision layerguide page = setup / integration / deployment depth

فهرست عمومی

۱۰۲ صفحه مرجع

هر کارت یا family reference است، یا ecosystem/tooling page، یا guide عملی برای setup، integration و deployment.

همه مدل‌های پذیرفته‌شده

راهنماهای D3

ورود سریع به مسیرهای عملی

اگر دنبال جواب اجرایی هستید، از یکی از guideهای زیر شروع کنید؛ این‌ها برای تصمیم deployment و integration ساخته شده‌اند.

راهنمای نصب

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

راهنمای integration

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

مقایسه تصمیم‌یار

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

راهنمای integration

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

راهنمای deployment

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

راهنمای deployment

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

اکوسیستم / ابزار

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

اکوسیستم / ابزار

اکوسیستم vLLM

vLLM یکی از جدی‌ترین انتخاب‌ها برای serving مدل‌های open-weight در production است؛ مخصوصاً وقتی throughput، OpenAI-compatible API و batching برایتان مهم است.

نوع صفحه

اگر از قبل می‌دانید دنبال مدل هستید یا guide deployment و tooling می‌خواهید، از اینجا شروع کنید.

مرور بر اساس مودالیته

اول از modality شروع کن، بعد با deployment و vendor فهرست را باریک کن.

Vendorهای شاخص

برای مقایسه خانواده‌های بزرگ و proprietary/open-weight از vendor filter شروع کن.

Ecosystemهای کلیدی

برای انتخاب runtime، toolchain و stack serving از روی ecosystem وارد شوید.

Collection Browse

مسیرهای پیشنهادی برای شروع

اگر هنوز vendor یا مدل مشخصی در ذهن ندارید، از یکی از collectionهای زیر شروع کنید تا hub سریع‌تر قابل‌فهم شود.

OpenAI

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

۹۹
خانواده مدلاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

محصولات agentic، backofficeهای سندمحور، workflowهای کدنویسی و تیم‌هایی که می‌خواهند عملیات inference را برون‌سپاری کنند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

پیاده‌سازی سریع، governance مهم

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hooshgate Reference

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

۹۹
مقایسه تصمیم‌یاروزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌های product، infra و enterprise که باید تصمیم deployment بگیرند و نمی‌خواهند تحت‌تأثیر hype یک مسیر اشتباه انتخاب کنند.

مسیر اجرا

decision framework

استقرار

محیط محلی • API

پیچیدگی

راهنمای تصمیم‌یار

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۴ pack کامل • ۱ pack خلاصه • ۴ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

۹۸
راهنمای integrationوزن‌بازCommunity / Open-weightمتن و چتEmbeddingRAG و دانش سازمانیجست‌وجوی معنایی

تیم‌هایی که می‌خواهند روی اسناد داخلی، دانش سازمانی، policy و document assistant یک RAG قابل‌نگهداری بسازند.

مسیر اجرا

integration-focused

استقرار

API • self-host

پیچیدگی

چندلایه و evaluation-heavy

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

۹۸
راهنمای deploymentاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر اجرا

ops and safety layer

استقرار

API • self-host

پیچیدگی

foundation for trust

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Anthropic

خانواده Claude

Claude برای تیم‌هایی مناسب است که long-context، کیفیت نوشتار و رفتار پایدار در workflowهای document-heavy می‌خواهند.

۹۷
خانواده مدلاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

تحلیل سند، agentهای دانشی، بازنویسی حرفه‌ای و تیم‌هایی که روی Bedrock یا Vertex AI نیز deployment می‌خواهند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

پیاده‌سازی متوسط، کنترل tone قوی

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

vLLM Project

اکوسیستم vLLM

vLLM یکی از جدی‌ترین انتخاب‌ها برای serving مدل‌های open-weight در production است؛ مخصوصاً وقتی throughput، OpenAI-compatible API و batching برایتان مهم است.

۹۷
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

LLM serving سازمانی، endpointهای چندکاربره، self-host در مقیاس متوسط تا بالا، embedding service و migration از pilot local به production.

مسیر اجرا

self-host production-grade

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

قوی برای serving، نیازمند infra discipline

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

۹۷
راهنمای deploymentاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

tech leadها، infra leadها و product ownerهایی که باید یک AI feature را به‌شکل production-grade وارد سیستم واقعی کنند.

مسیر اجرا

production operations

استقرار

API • self-host

پیچیدگی

ops-heavy و governance-driven

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Google

خانواده Gemini

Gemini برای تیم‌هایی جذاب است که از ورودی‌های چندوجهی، PDF، ویدئو یا Google stack استفاده می‌کنند و می‌خواهند API و cloud-native workflow یکپارچه باشد.

۹۶
خانواده مدلاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

محصولات multimodal، تحلیل PDF و ویدئو، RAGهای اسنادی و تیم‌هایی که روی Google Cloud یا Vertex AI کار می‌کنند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

multimodal قوی، cloud fit بالا

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

۹۶
اکوسیستم / ابزارمتن‌بازترکیبی / متغیرمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌هایی که می‌خواهند مدل‌ها را مقایسه، weightها را مدیریت، dataset و adapter را منتشر و از یک ecosystem منسجم برای open model workflow استفاده کنند.

مسیر اجرا

ecosystem backbone

استقرار

API • محیط محلی

پیچیدگی

مرجع اصلی open modelها

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

۹۶
راهنمای نصبمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌ها و افرادی که می‌خواهند با حداقل friction اولین local run را انجام دهند و فرق بین desktop evaluation و local API را بفهمند.

مسیر اجرا

desktop و workstation

استقرار

محیط محلی

پیچیدگی

راهنمای onboarding عملی

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۲ pack خلاصه • ۲ pack لینک‌شده

fit عملیاتی

Windows • macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

۹۶
راهنمای integrationاختصاصیترکیبی / متغیرمتن و چتچندوجهیچت و دستیارکدنویسی

محصولات agentic، document AI، multimodal appها و تیم‌هایی که زیرساخت inference را نمی‌خواهند خودشان نگه دارند.

مسیر اجرا

API-managed path

استقرار

API • ابر مدیریت‌شده

پیچیدگی

پیاده‌سازی سریع، governance حیاتی

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Meta

خانواده Llama

Llama یکی از مهم‌ترین خانواده‌های open-weight برای self-host، سفارشی‌سازی و ساخت stack مستقل سازمانی است.

۹۵
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

تیم‌هایی که می‌خواهند مدل را داخل زیرساخت خودشان اجرا کنند، quantize کنند، LoRA بزنند و control بیشتری روی داده و serving داشته باشند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

عملیاتی‌تر از API مدل‌ها

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Ollama

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

۹۵
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

prototype محلی، ارزیابی اولیه مدل‌های open-weight، demo داخلی، RAG سبک و backendهایی که OpenAI-compatible local endpoint می‌خواهند.

مسیر اجرا

local-first و self-host سبک

استقرار

محیط محلی • self-host

پیچیدگی

ساده برای شروع، محدود برای scale

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

macOS • Linux | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

پیاده‌سازی document AI و سندمحور

document AI فقط OCR یا chat با PDF نیست. این guide نشان می‌دهد برای ingestion، extraction، validation، citation و human review چطور یک pipeline سندمحور قابل‌اعتماد بسازید.

۹۵
پیاده‌سازی use-caseوزن‌بازCommunity / Open-weightچندوجهیمتن و چتتحلیل سندRAG و دانش سازمانی

workflowهای قرارداد، فاکتور، policy، proposal review و هر use-case که سند source-of-truth است.

مسیر اجرا

use-case implementation

استقرار

API • self-host

پیچیدگی

document-centric and validation-heavy

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۳ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: پردازش سند • محیط‌های حساس

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen Team

خانواده Qwen

Qwen یکی از خانواده‌های open-weight مهم برای تیم‌هایی است که هم multilingual support می‌خواهند و هم self-host و fine-tuning.

۹۴
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

محصولات چندزبانه، assistantهای self-host، coding workflowها و تیم‌هایی که stack open-weight اما مدرن می‌خواهند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

open-weight منعطف

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Windows | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Pixtral

Pixtral برای تیم‌هایی مناسب است که vision + text را با امکان self-host می‌خواهند و نمی‌خواهند برای OCR، سندخوانی و VLM صرفاً به APIهای بسته متکی بمانند.

۹۴
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیچت و دستیارتحلیل سند

document AI، تحلیل تصویر و PDF، بازرسی کیفیت محتوای تصویری و workflowهای چندوجهی که باید روی زیرساخت خودتان هم قابل اجرا باشند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

VLM عملیاتی با نیاز GPU

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

ggml-org / llama.cpp

اکوسیستم llama.cpp

llama.cpp برای وقتی مناسب است که کنترل دقیق روی GGUF، اجرای CPU-friendly، edge deployment یا بسته‌بندی محلی برایتان مهم‌تر از سادگی UX باشد.

۹۴
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

GGUF، edge، inference روی CPU یا GPUهای کوچک، embedded apps و تیم‌هایی که می‌خواهند behavior runtime را دقیق‌تر کنترل کنند.

مسیر اجرا

local و edge-oriented

استقرار

محیط محلی • self-host

پیچیدگی

کنترل زیاد، setup فنی‌تر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

مرور اکوسیستم fine-tuning

همه مسائل با fine-tuning حل نمی‌شود. این صفحه کمک می‌کند بفهمید چه زمانی tuning واقعاً ارزش دارد، چه زمانی retrieval یا prompt بهتر است و کدام ecosystem برای LoRA یا full training مناسب‌تر است.

۹۴
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌هایی که بعد از رسیدن به baseline خوب، به adaptation جدی فکر می‌کنند و نمی‌خواهند زودتر از موعد وارد training pipeline پرهزینه شوند.

مسیر اجرا

adaptation decision guide

استقرار

محیط محلی • self-host

پیچیدگی

high leverage, high risk

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۱۰ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: ابزار توسعه • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen

Qwen Embedding و Reranker

خانواده Qwen Embedding/Reranker برای تیم‌هایی مهم است که retrieval چندزبانه، RAG جدی و کنترل بیشتر روی embedding stack می‌خواهند.

۹۳
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG چندزبانه، semantic search، reranking روی corpus سازمانی و pipelineهایی که کیفیت retrieval برایشان حیاتی‌تر از chat model است.

مسیر اجرا

self-host یا API

استقرار

API • self-host

پیچیدگی

retrieval stack تخصصی

راهنمای مرتبط

۷ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Codestral

Codestral برای code completion، FIM و سناریوهای coding assistant مناسب است؛ مخصوصاً وقتی می‌خواهید latency بهتر و کنترل بیشتر از مدل‌های chat عمومی بگیرید.

۹۳
خانواده مدلوزن‌بازOpen model termsمتن و چتکدنویسیworkflow عامل‌محور

IDE completion، fill-in-the-middle، code generation، code editing و ابزارهای توسعه که باید روی codebase واقعی کار کنند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

کدنویسی تخصصی

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Deepgram

Deepgram

Deepgram برای تیم‌هایی مناسب است که STT/TTS/voice-agent stack می‌خواهند و به‌جای چسباندن چند سرویس جدا، یک platform صوتی متمرکز ترجیح می‌دهند.

۹۳
خانواده مدلاختصاصیترکیبی / متغیرصوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

realtime voice agents، transcription، multilingual speech apps و محصولاتی که کیفیت، latency و turn handling در آن‌ها مهم است.

مسیر اجرا

API-first با self-host option

استقرار

API • ابر مدیریت‌شده

پیچیدگی

voice platform

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

Transformers stack

Transformers stack زمانی مناسب است که می‌خواهید روی اجرای مدل، pre/post-processing و training/inference workflow کنترل عمیق داشته باشید و حاضر باشید از سادگی runtimeهای turnkey صرف‌نظر کنید.

۹۳
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

تیم‌های فنی، سرویس‌های سفارشی Python، inference با منطق اختصاصی، training/fine-tuning و کار با مدل‌هایی که runtime آماده برایشان کافی نیست.

مسیر اجرا

custom Python stack

استقرار

محیط محلی • self-host

پیچیدگی

انعطاف بالا، boilerplate بیشتر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

راهنمای GGUF و بسته‌بندی local

GGUF برای local AI فقط یک فرمت فایل نیست؛ تصمیمی است درباره portability، quantization و trade-off کیفیت در برابر resource. این صفحه می‌گوید چه زمانی GGUF منطقی است و چه زمانی نه.

۹۳
راهنمای نصبمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

local deployment، edge، laptop inference و تیم‌هایی که می‌خواهند مدل را با footprint کوچک‌تر اجرا و جابه‌جا کنند.

مسیر اجرا

portable local packaging

استقرار

محیط محلی • لبه / روی دستگاه

پیچیدگی

به ظاهر ساده، در عمل نیازمند benchmark

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۲ pack خلاصه • ۲ pack لینک‌شده

fit عملیاتی

Edge / Device | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hooshgate Reference

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

۹۳
پیاده‌سازی use-caseاختصاصیCommercial APIصوت و گفتارمتن و چتتبدیل گفتار به متنتبدیل متن به گفتار

تیم‌هایی که می‌خواهند voice assistant، call automation یا spoken UI بسازند و نیاز دارند کل زنجیره STT → reasoning → TTS را حرفه‌ای طراحی کنند.

مسیر اجرا

voice workflow guide

استقرار

API • self-host

پیچیدگی

latency-sensitive

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۳ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به راهنما

OpenAI

GPT Image

GPT Image برای تیم‌هایی مهم است که مسیر text-to-image را داخل همان stack API-first و policy-aware می‌خواهند، نه در یک workflow جدا و disconnected.

۹۳
خانواده مدلاختصاصیCommercial APIتولید تصویرتولید تصویر

محصولات content automation، asset generation با guardrail، workflowهای marketing و تیم‌هایی که می‌خواهند تصویر را کنار text و agents از یک provider بگیرند.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

یکپارچه با stack proprietary

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed • Serverless | مناسب برای: تولید رسانه • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Mistral AI

خانواده Mistral

Mistral برای تیم‌هایی جذاب است که هم self-host می‌خواهند و هم سبدی از مدل‌های تخصصی‌تر مثل coding، multimodal و document AI را در یک خانواده ببینند.

۹۲
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

سازمان‌هایی که بین API و self-host جابه‌جا می‌شوند و می‌خواهند از مدل‌های متنوع این خانواده برای code، vision و enterprise search استفاده کنند.

مسیر اجرا

API + self-host

استقرار

API • محیط محلی

پیچیدگی

خانواده متنوع، نیازمند governance

راهنمای مرتبط

۸ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Devstral

Devstral برای workflowهای agentic در توسعه نرم‌افزار ساخته شده است؛ جایی که model فقط کد تولید نمی‌کند، بلکه باید ابزار و context را هم درست به‌کار بگیرد.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveمتن و چتکدنویسیworkflow عامل‌محور

coding agents، tool use در توسعه، repository workflows و تیم‌هایی که code generation را در مسیر task-based می‌خواهند.

مسیر اجرا

self-host مناسب

استقرار

API • self-host

پیچیدگی

agentic coding stack

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Alibaba / Qwen

Qwen Coder

Qwen Coder برای تیم‌هایی جذاب است که coding مدل باز با ecosystem قوی Qwen، vLLM، Ollama و GGUF می‌خواهند.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveمتن و چتکدنویسیworkflow عامل‌محور

code generation، repo-aware workflows سبک، local coding assistants و self-host روی stackهای رایج.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

coding family باز

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Runway

Runway

Runway برای تیم‌هایی مهم است که video generation managed می‌خواهند و ترجیح می‌دهند به‌جای نگه‌داری stack باز، از API و workflow آماده استفاده کنند.

۹۲
خانواده مدلاختصاصیCommercial APIویدئوتولید تصویرتولید ویدئوتولید تصویر

text-to-video و image-to-video محصولی، creative automation و تیم‌هایی که time-to-market برایشان مهم‌تر از self-host است.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

managed video platform

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed • Serverless | مناسب برای: تولید رسانه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Speechmatics

Speechmatics

Speechmatics برای تیم‌هایی مهم است که speech platform می‌خواهند اما data sovereignty، on-prem یا privacy-heavy deployments برایشان اولویت دارد.

۹۲
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

transcription، realtime captions، voice agents و سازمان‌هایی که cloud-only برایشان کافی نیست و on-prem یا container option می‌خواهند.

مسیر اجرا

API + on-prem

استقرار

API • ابر مدیریت‌شده

پیچیدگی

speech platform enterprise

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed • Container / Docker | مناسب برای: محصول صوتی • محیط‌های حساس

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

LM Studio

LM Studio و runtimeهای desktop

LM Studio برای تیم‌هایی مناسب است که می‌خواهند بدون درگیری با CLI و serving stack، مدل محلی را روی desktop اجرا، مقایسه و برای demo یا evaluation آماده کنند.

۹۲
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

product discovery، مقایسه سریع مدل‌های محلی، demo برای غیرتوسعه‌دهنده‌ها و تیم‌هایی که GUI desktop می‌خواهند.

مسیر اجرا

desktop local GUI

استقرار

محیط محلی

پیچیدگی

خیلی ساده برای ارزیابی، محدود برای production

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Windows • macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Hugging Face

Diffusers stack

Diffusers بهترین انتخاب برای تیم‌هایی است که می‌خواهند image/video generation را با pipelineهای سفارشی، LoRA، control و experimentation مهندسی کنند.

۹۲
اکوسیستم / ابزارمتن‌بازOpen-source permissiveتولید تصویرویدئوتولید تصویرتولید ویدئو

تیم‌های تولید تصویر، پژوهش، pipelineهای visual generation، custom workflows و integration با adapterها و controlهای متنوع.

مسیر اجرا

custom generation stack

استقرار

محیط محلی • self-host

پیچیدگی

قوی برای experimentation و custom pipelines

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به راهنما

Alibaba / Qwen

Qwen VL

Qwen VL خانواده‌ای است برای تیم‌هایی که VLM باز، قوی در document understanding و قابل self-host می‌خواهند و نمی‌خواهند همه چیز را به APIهای بسته بسپارند.

۹۲
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیچت و دستیارتحلیل سند

OCR-aware workflows، document AI، visual QA، agentهای چندوجهی و محیط‌هایی که latency و data boundary باید داخل infra خودتان کنترل شود.

مسیر اجرا

self-host یا managed endpoint

استقرار

محیط محلی • self-host

پیچیدگی

VLM باز با نیاز GPU

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Hugging Face

Text Embeddings Inference

TEI یکی از مهم‌ترین runtimeهای hub برای embedding و reranking است؛ چون self-host retrieval را از مرحله notebook به سرویس production نزدیک می‌کند.

۹۲
اکوسیستم / ابزارمتن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

embedding و reranking service، RAG داخلی، search production و تیم‌هایی که می‌خواهند open models را با runtime مخصوص retrieval بالا بیاورند.

مسیر اجرا

serving تخصصی retrieval

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

runtime ویژه embedding/reranking

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

DeepSeek

خانواده DeepSeek

DeepSeek برای تیم‌هایی مهم است که reasoning و coding را با رویکرد open-weight یا API اقتصادی‌تر بررسی می‌کنند.

۹۱
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچت و دستیاراستدلال و تحلیل

ارزیابی‌های comparative، code-heavy workloads و سازمان‌هایی که می‌خواهند بین API و self-host انعطاف داشته باشند.

مسیر اجرا

API + self-host

استقرار

API • محیط محلی

پیچیدگی

reasoning/coding محور

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Voyage AI

Voyage Embeddings

Voyage برای تیم‌هایی مهم است که embedding و retrieval را به‌صورت تخصصی نگاه می‌کنند، نه صرفاً به‌عنوان feature فرعی.

۹۱
خانواده مدلاختصاصیCommercial APIEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

semantic search، RAGهای retrieval-heavy و use-caseهای تخصصی مثل code، legal یا finance retrieval.

مسیر اجرا

API-only

استقرار

API

پیچیدگی

retrieval تخصصی

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Mistral AI

Voxtral

Voxtral خانواده صوتی Mistral است برای تیم‌هایی که voice workflow می‌خواهند اما همچنان self-host و کنترل استقرار برایشان مهم است.

۹۱
خانواده مدلوزن‌بازCommunity / Open-weightصوت و گفتارتبدیل گفتار به متندستیار صوتی

speech workflows، transcript، voice agents و تیم‌هایی که می‌خواهند بین API راحت و مدل صوتی قابل‌کنترل تعادل داشته باشند.

مسیر اجرا

API یا self-host

استقرار

API • self-host

پیچیدگی

audio pipeline عملیاتی

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

IBM

Granite 4

Granite 4 برای سناریوهای enterprise و cost-efficient جذاب است؛ مخصوصاً وقتی transparency، memory efficiency و governance برای شما مهم است.

۹۱
خانواده مدلمتن‌بازOpen-source permissiveمتن و چتچت و دستیاراستدلال و تحلیل

RAG سازمانی، agent workflowهای کنترل‌شده، edge و deploymentهای حساس که نمی‌خواهند به frontier APIهای بسته وابسته باشند.

مسیر اجرا

local / self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

SLM/LLM سازمانی

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • محیط‌های حساس

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

NVIDIA

Nemotron

Nemotron برای تیم‌هایی مناسب است که reasoning و agent workflows می‌خواهند و هم‌زمان می‌خواهند deployment را در اکوسیستم NVIDIA و NIM نگه دارند.

۹۱
خانواده مدلوزن‌بازOpen model termsمتن و چتچت و دستیاراستدلال و تحلیل

reasoning، long-context workflows، coding و serving روی GPUهای NVIDIA با NIM، vLLM یا stackهای محلی.

مسیر اجرا

NIM / vLLM / local

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

GPU-centric reasoning stack

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Recraft

Recraft

Recraft برای تیم‌هایی مناسب است که تولید تصویر و vector را در یک API design-centric می‌خواهند و کیفیت «کاربردی برای طراح» برایشان مهم است.

۹۱
خانواده مدلاختصاصیCommercial APIتولید تصویرتولید تصویر

design workflows، vector generation، brand-consistent assets و ابزارهای تصویری محصولی که باید فراتر از صرفاً عکس باشند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

design-first image platform

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: تولید رسانه • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

AssemblyAI

AssemblyAI

AssemblyAI برای تیم‌هایی مهم است که transcription و speech intelligence managed می‌خواهند و تمرکزشان بیشتر روی STT با کیفیت و features تحلیلی است.

۹۱
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل گفتار به متندستیار صوتی

speech-to-text، transcript analytics، multilingual transcription و voice features محصولی که نمی‌خواهند self-host شوند.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

transcription platform

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Hugging Face

Text Generation Inference (TGI)

TGI سرور inference مربوط به Hugging Face است و برای تیم‌هایی معنا دارد که stack آن‌ها از قبل حول artifactهای Hugging Face، containerized serving و الگوهای سازمانی آن شکل گرفته است.

۹۱
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

سازمان‌هایی که از قبل روی Hugging Face ecosystem سرمایه‌گذاری کرده‌اند، container-based serving می‌خواهند و deployment inference را با artifact management رسمی HF می‌بینند.

مسیر اجرا

HF-oriented self-host

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

container serving با fit سازمانی

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به راهنما

OpenAI

OpenAI Embeddings

اگر به embedding API ساده، پایدار و کم‌دردسر نیاز دارید، خانواده text-embedding-3 یکی از baselineهای حرفه‌ای بازار است.

۹۰
خانواده مدلاختصاصیCommercial APIEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

RAG، semantic search، deduplication و هر جایی که می‌خواهید embedding به‌عنوان سرویس مدیریت شود.

مسیر اجرا

API-only

استقرار

API

پیچیدگی

پیاده‌سازی ساده

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Jina AI

Jina Embeddings

Jina Embeddings مخصوص تیم‌هایی است که retrieval اسناد تصویری، PDF و محتوای visually-rich برایشان مهم است.

۹۰
خانواده مدلاختصاصیCommercial APIEmbeddingچندوجهیجست‌وجوی معناییRAG و دانش سازمانی

RAG اسنادی، visually rich retrieval و pipelineهایی که text-only retrieval کافی نیست.

مسیر اجرا

API + private hosting options

استقرار

API • ابر مدیریت‌شده

پیچیدگی

multimodal retrieval

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Black Forest Labs

خانواده FLUX

FLUX برای تیم‌هایی مهم است که کیفیت تصویر، prompt following و control روی generation / editing برایشان KPI اصلی است.

۹۰
خانواده مدلاختصاصیCommercial APIتولید تصویرتولید تصویر

asset generation، marketing creative، creative tooling و image editing workflowهای حرفه‌ای.

مسیر اجرا

API-focused

استقرار

API

پیچیدگی

creative production

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: تولید رسانه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Alibaba / Qwen

Qwen Omni

Qwen Omni برای تیم‌هایی مهم است که مدل باز چندوجهی با ورودی متن، تصویر و صدا می‌خواهند و می‌خواهند آن را در stack خودشان ادغام کنند.

۹۰
خانواده مدلوزن‌بازOpen-source permissiveچندوجهیصوت و گفتارچت و دستیارتحلیل سند

multimodal chat، voice-enabled assistant، image + text workflows و تجربه‌های unified که نمی‌خواهند کاملاً وابسته به API بسته باشند.

مسیر اجرا

self-host ممکن

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

omni workflow

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: دستیار عمومی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Tencent Hunyuan

HunyuanVideo

HunyuanVideo برای تیم‌هایی مهم است که text-to-video یا image-to-video باز می‌خواهند و حاضرند complexity GPU و pipeline ویدئویی را مدیریت کنند.

۹۰
خانواده مدلوزن‌بازCommunity / Open-weightویدئوتولید ویدئو

video generation باز، تحقیق و توسعه روی ویدئو، pipelineهای image-to-video و تیم‌هایی که باید stack را self-host کنند.

مسیر اجرا

self-host

استقرار

self-host • محیط محلی

پیچیدگی

video generation سنگین

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Ideogram

Ideogram

Ideogram برای تیم‌هایی مهم است که API text-to-image با کیفیت خوب، style presets و توانایی بهتر در text rendering می‌خواهند.

۹۰
خانواده مدلاختصاصیCommercial APIتولید تصویرتولید تصویر

marketing visuals، image generation محصولی، character consistency و تیم‌هایی که می‌خواهند سریع‌تر از open stack وارد تولید تصویر شوند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

تصویر managed

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Serverless • Cloud managed | مناسب برای: تولید رسانه • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Cartesia

Cartesia

Cartesia برای تیم‌هایی جذاب است که TTS بسیار سریع و expressive برای realtime experiences می‌خواهند و voice quality برایشان KPI اصلی است.

۹۰
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل متن به گفتارتبدیل گفتار به متن

realtime TTS، conversational AI، dubbing و محصولاتی که زمان تا first-byte و حس طبیعی صدا در آن‌ها مهم است.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

realtime voice platform

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

DeepSeek

DeepSeek Coder

DeepSeek Coder برای تیم‌هایی مهم است که coding model باز می‌خواهند و می‌خواهند code completion، refactor و repo Q&A را داخل infra خودشان جلو ببرند.

۹۰
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتکدنویسیچت و دستیار

IDE assistant داخلی، code review helper، generation روی repo خصوصی و pipelineهایی که self-host و cost control مهم است.

مسیر اجرا

local یا self-host

استقرار

محیط محلی • self-host

پیچیدگی

مدل کدنویسی باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

FlagOpen / BAAI

BGE Reranker

BGE Reranker برای تیم‌هایی مهم است که retrieval را فقط با embedding متوقف نمی‌کنند و می‌خواهند مرحله دوم ranking را هم دقیق و self-host جلو ببرند.

۹۰
خانواده مدلوزن‌بازOpen-source permissiveRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG دقیق‌تر، legal or policy retrieval، search pipelineهای چندمرحله‌ای و تیم‌هایی که top-k اولیه را با reranker پالایش می‌کنند.

مسیر اجرا

self-host retrieval stage

استقرار

محیط محلی • self-host

پیچیدگی

مرحله دوم retrieval

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

OpenAI

Whisper Large v3

Whisper Large v3 هنوز یکی از reference pageهای مهم برای STT باز است: ساده برای baseline، قابل self-host و مناسب برای تیمی که نمی‌خواهد transcription را فقط از API بگیرد.

۹۰
خانواده مدلمتن‌بازOpen-source permissiveصوت و گفتارتبدیل گفتار به متن

baseline transcription، archive indexing، meeting search و هر جایی که self-host STT یا cost control مهم باشد.

مسیر اجرا

local و self-host

استقرار

محیط محلی • self-host

پیچیدگی

baseline STT باز

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Hugging Face

اکوسیستم PEFT

PEFT در hub به این خاطر مهم است که لایه adaptation عملی برای modelهای باز را پوشش می‌دهد؛ یعنی جایی بین prompt-only و full fine-tuning.

۹۰
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

LoRA، adapter-based tuning، domain adaptation کم‌هزینه و تیم‌هایی که می‌خواهند experimentation را بدون full training شروع کنند.

مسیر اجرا

training-adaptation toolkit

استقرار

محیط محلی • self-host

پیچیدگی

adapter training برای مدل‌های باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

راهنمای self-host روی لینوکس

این guide برای تیمی است که واقعاً می‌خواهد روی Linux self-host کند: انتخاب بین vLLM، TGI، GGUF، container و incident path.

۹۰
راهنمای نصبمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

stack self-host، private infra، rollout مدل‌های باز و تیم‌هایی که production serving را روی Linux جلو می‌برند.

مسیر اجرا

Linux production-minded

استقرار

self-host

پیچیدگی

مسیر واقعی infra و serving

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۲ pack خلاصه • ۲ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

Google

خانواده Gemma

Gemma برای تیم‌هایی مناسب است که مدل باز و سبک‌تر می‌خواهند، اما همچنان می‌خواهند از lineage و tooling گوگل بهره ببرند.

۸۹
خانواده مدلوزن‌بازOpen model termsمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

edge و local AI، prototypeهای self-host و تیم‌هایی که مدل بازتر اما manageable می‌خواهند.

مسیر اجرا

local / edge friendly

استقرار

محیط محلی • self-host

پیچیدگی

سبک‌تر و منعطف

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

FlagOpen / BAAI

خانواده BGE / FlagEmbedding

BGE برای تیم‌هایی مهم است که retrieval stack را کاملاً open و self-host می‌خواهند؛ از embedding تا reranker.

۸۹
خانواده مدلمتن‌بازOpen-source permissiveEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

مسیر اجرا

کاملاً self-host

استقرار

محیط محلی • self-host

پیچیدگی

retrieval engineering جدی

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

Imagen

Imagen برای تیم‌هایی مناسب است که generation تصویری را در Google ecosystem و با managed safety/watermarking می‌خواهند.

۸۹
خانواده مدلاختصاصیCommercial APIتولید تصویرتولید تصویر

asset generation روی Google stack، campaign automation و تیم‌هایی که می‌خواهند image generation را managed مصرف کنند.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

managed image generation

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: تولید رسانه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

ElevenLabs

ElevenLabs

ElevenLabs برای تیم‌هایی مهم است که voice quality، TTS حرفه‌ای و STT/voice-agent workflow را به‌صورت یکپارچه می‌خواهند.

۸۹
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل متن به گفتارتبدیل گفتار به متن

voice interfaces، audiobook-like narration، realtime agents و pipelineهای صوتی محصولی.

مسیر اجرا

API-only

استقرار

API

پیچیدگی

voice platform

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

IBM

Granite Code

Granite Code یک خانواده باز و enterprise-friendly برای code generation است که برای تیم‌های حساس به license و governance گزینه جالبی می‌شود.

۸۹
خانواده مدلمتن‌بازOpen-source permissiveمتن و چتکدنویسی

code generation، explanation، bug fixing و ابزارهای توسعه‌ای که باید روی زیرساخت داخلی و license روشن کار کنند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

code LLM باز

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

AllenAI

Molmo

Molmo یک family چندوجهی باز از Ai2 است که برای تیم‌هایی جذاب می‌شود که VLM باز و پژوهش‌پذیر برای سند، تصویر و reasoning می‌خواهند.

۸۹
خانواده مدلوزن‌بازCommunity / Open-weightچندوجهیتحلیل سندچت و دستیار

visual question answering، document reading، تحلیل تصویر و پژوهش/محصولاتی که می‌خواهند روی VLM باز کار کنند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

open VLM research-to-product

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Lightricks

LTX-Video

LTX-Video برای تیم‌هایی جالب است که open video generation با سرعت بهتر و workflowهای image-to-video یا controlled generation می‌خواهند.

۸۹
خانواده مدلوزن‌بازترکیبی / متغیرویدئوتولید ویدئو

image-to-video، controlled video generation، creative tooling و تیم‌هایی که به دنبال open stack چابک‌تر از بعضی خانواده‌های سنگین‌تر هستند.

مسیر اجرا

self-host / desktop

استقرار

self-host • محیط محلی

پیچیدگی

ویدئوی باز با کنترل بیشتر

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Coqui

Coqui XTTS

XTTS برای تیم‌هایی مهم است که TTS چندزبانه و voice cloning می‌خواهند و حاضرند آن را روی زیرساخت خودشان اجرا یا شخصی‌سازی کنند.

۸۹
خانواده مدلمتن‌بازOpen-source permissiveصوت و گفتارتبدیل متن به گفتار

voice cloning، multilingual TTS، narration، dubbing و محصولاتی که کیفیت صدا برایشان مهم‌تر از سادگی API است.

مسیر اجرا

self-host

استقرار

محیط محلی • self-host

پیچیدگی

TTS چندزبانه / cloning

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: محصول صوتی • تولید رسانه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Cohere

Cohere Embed

Cohere Embed برای تیم‌هایی مهم است که embedding API سازمانی می‌خواهند و ترجیح می‌دهند retrieval stack را بدون self-host و model ops سنگین جلو ببرند.

۸۹
خانواده مدلاختصاصیCommercial APIEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

enterprise search، RAG با data pipeline کنترل‌شده و تیم‌هایی که retrieval را با managed API می‌خواهند.

مسیر اجرا

API-first

استقرار

API • ابر مدیریت‌شده

پیچیدگی

managed retrieval path

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed • Serverless | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Hugging Face

اکوسیستم TRL

TRL برای تیم‌هایی مهم است که از adaptation ساده عبور کرده‌اند و به SFT، DPO یا post-training جدی‌تر فکر می‌کنند.

۸۹
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

SFT، preference optimization، reward modeling و تیم‌هایی که می‌خواهند post-training را reproducible و scriptable جلو ببرند.

مسیر اجرا

post-training toolkit

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

پیچیده‌تر از adapter-only

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

AWS / Amazon

اکوسیستم Amazon Bedrock

Amazon Bedrock برای تیم‌هایی مهم است که multi-model access را در بستر AWS و با دغدغه enterprise governance می‌خواهند.

۸۹
اکوسیستم / ابزاراختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

سازمان‌هایی که already در AWS هستند، policy و governance برایشان مهم است و می‌خواهند model access را داخل همان cloud plane نگه دارند.

مسیر اجرا

managed cloud platform

استقرار

API • ابر مدیریت‌شده

پیچیدگی

cloud-native enterprise path

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed • Serverless | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Google

اکوسیستم Vertex AI Model Garden

Vertex AI Model Garden برای تیم‌هایی مهم است که در Google Cloud هستند و می‌خواهند هم مدل‌های گوگل و هم بعضی model familyهای third-party را از یک cloud plane ببینند.

۸۹
اکوسیستم / ابزاراختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

Google Cloud-native teams، managed AI platform، teamهای data/ML که already روی Vertex و GCP workflow دارند.

مسیر اجرا

managed cloud platform

استقرار

API • ابر مدیریت‌شده

پیچیدگی

cloud-native model catalog

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

مقایسه embedding و reranking

این comparison guide برای تیم‌هایی است که می‌خواهند retrieval stack را جدی انتخاب کنند: فقط embedding، embedding + reranker، یا managed retrieval API.

۸۹
مقایسه تصمیم‌یاروزن‌بازCommunity / Open-weightEmbeddingRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG system design، enterprise search selection و تیم‌هایی که retrieval quality برایشان KPI واقعی است.

مسیر اجرا

self-host یا managed retrieval

استقرار

محیط محلی • self-host

پیچیدگی

تصمیم‌گیری روی search stack

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۴ pack کامل • ۱ pack خلاصه • ۴ pack لینک‌شده

fit عملیاتی

Container / Docker | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

xAI

خانواده Grok

Grok گزینه‌ای برای تیم‌هایی است که می‌خواهند از مدل xAI در سناریوهای API-based، tool use و long-context استفاده کنند.

۸۸
خانواده مدلاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

تیم‌هایی که به مدل جدید API-first با context بزرگ، function calling و workflowهای agentic علاقه دارند و می‌خواهند گزینه جایگزین جدی در سبد proprietary داشته باشند.

مسیر اجرا

API-only

استقرار

API

پیچیدگی

جدیدتر، نیازمند pilot دقیق

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

Gemini Embedding

Gemini Embedding برای تیم‌هایی مناسب است که retrieval stack خود را روی Google ecosystem نگه می‌دارند.

۸۸
خانواده مدلاختصاصیCommercial APIEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

RAG، semantic retrieval و pipelineهایی که هم generation و هم embedding را در Google stack می‌خواهند.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

Google-native retrieval

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Stability AI ecosystem

Stable Diffusion

Stable Diffusion هنوز هم reference مهمی برای self-host، LoRA، style adaptation و freedom در generation تصویری است.

۸۸
خانواده مدلمتن‌بازترکیبی / متغیرتولید تصویرتولید تصویر

تیم‌هایی که می‌خواهند image generation را خودشان host و tune کنند یا pipeline خلاقه داخلی بسازند.

مسیر اجرا

self-host قوی

استقرار

محیط محلی • self-host

پیچیدگی

creative ops سنگین

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Windows | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

Veo

Veo برای تیم‌هایی است که text/image-to-video را به‌صورت managed و در بستر Google می‌خواهند.

۸۸
خانواده مدلاختصاصیCommercial APIویدئوتولید ویدئو

creative prototyping، social video experimentation و pipelineهای ویدئویی که نمی‌خواهند زیرساخت inference خودشان را مدیریت کنند.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

ویدئوی managed

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: تولید رسانه • تحلیل ویدئو

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

PaliGemma

PaliGemma خانواده سبک‌تر vision-language از Google است که برای captioning، visual QA و use-caseهای image understanding باز مناسب است.

۸۸
خانواده مدلوزن‌بازOpen model termsچندوجهیتحلیل سندچت و دستیار

captioning، visual question answering، image understanding و سناریوهایی که VLM باز و نسبتاً سبک می‌خواهند.

مسیر اجرا

local / managed cloud

استقرار

محیط محلی • self-host

پیچیدگی

VLM سبک‌تر

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: پردازش سند • دستیار عمومی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Nomic

Nomic Embed

Nomic Embed برای تیم‌هایی مناسب است که embedding باز، compact و قابل‌استفاده در search و RAG محلی می‌خواهند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

semantic search، retrieval سبک‌تر، RAG محلی و سناریوهایی که embedding باز با footprint معقول می‌خواهند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

retrieval ساده‌تر

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

NVIDIA

Sana

Sana برای تیم‌هایی مهم است که text-to-image باز با کیفیت بالا و مسیر self-host می‌خواهند و در stack تصویری باز فعال‌اند.

۸۸
خانواده مدلوزن‌بازCommunity / Open-weightتولید تصویرتولید تصویر

text-to-image، experimentation تصویری، تولید محتوای خلاق و تیم‌هایی که diffusion باز را در کنار Stable Diffusion و FLUX می‌سنجند.

مسیر اجرا

local / self-host

استقرار

محیط محلی • self-host

پیچیدگی

diffusion image stack

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux | مناسب برای: تولید رسانه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Google

CodeGemma

CodeGemma برای تیم‌هایی مهم است که coding model سبک‌تر و باز می‌خواهند و ترجیح می‌دهند روی همان ecosystem Gemma/Google باقی بمانند.

۸۸
خانواده مدلوزن‌بازOpen model termsمتن و چتکدنویسیچت و دستیار

code completion سبک، local experimentation، IDE prototype و تیم‌هایی که می‌خواهند code model باز را با footprint معقول‌تر امتحان کنند.

مسیر اجرا

local-friendly

استقرار

محیط محلی • self-host

پیچیدگی

نسبتاً سبک برای code experimentation

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Cloud managed | مناسب برای: ابزار توسعه • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Mixedbread AI

mxbai Embed

mxbai Embed برای تیم‌هایی مهم است که embedding باز، سبک‌تر و مناسب self-host می‌خواهند و می‌خواهند retrieval را بدون vendor API جلو ببرند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

semantic search، RAG داخلی، workstation-friendly retrieval و تیم‌هایی که embedding باز را با TEI یا HF stack می‌خواهند.

مسیر اجرا

self-host embedding

استقرار

محیط محلی • self-host

پیچیدگی

retrieval باز و سبک

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: جست‌وجوی سازمانی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Snowflake

Snowflake Arctic Embed

Arctic Embed برای تیم‌هایی مهم است که embedding باز با positioning سازمانی می‌خواهند و می‌خواهند retrieval stack را روی infra خود نگه دارند.

۸۸
خانواده مدلوزن‌بازOpen-source permissiveEmbeddingجست‌وجوی معناییRAG و دانش سازمانی

enterprise retrieval، warehouse-adjacent search، corpusهای بزرگ و تیم‌هایی که embedding باز اما سازمانی‌تر می‌خواهند.

مسیر اجرا

self-host enterprise retrieval

استقرار

محیط محلی • self-host

پیچیدگی

embedding باز برای search

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Open WebUI

اکوسیستم Open WebUI

Open WebUI برای تیم‌هایی مهم است که UI و control plane برای local یا self-host مدل‌ها می‌خواهند، نه فقط یک inference server خام.

۸۸
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

chat UI داخلی، RAG demo، تیم‌های غیرزیرساختی که می‌خواهند model access، user-facing interface و tooling را سریع ببینند.

مسیر اجرا

UI + orchestration layer

استقرار

محیط محلی • self-host

پیچیدگی

ساده برای demo، محدود برای ops سنگین

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: دستیار عمومی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Microsoft

اکوسیستم Azure AI Foundry

Azure AI Foundry برای سازمان‌هایی مهم است که enterprise controls مایکروسافتی و model access را در یک platform واحد می‌خواهند.

۸۸
اکوسیستم / ابزاراختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

Azure-centric organizations، enterprise governance، app teams که می‌خواهند model access و security controls را داخل Azure نگه دارند.

مسیر اجرا

managed enterprise platform

استقرار

API • ابر مدیریت‌شده

پیچیدگی

cloud governance path

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-23

ورود به راهنما

LangChain

راهنمای RAG با LangChain

این guide برای تیم‌هایی است که RAG را واقعاً implement می‌کنند و دنبال wiring بین retriever، prompt، model و evaluation هستند.

۸۸
راهنمای integrationمتن‌بازOpen-source permissiveمتن و چتEmbeddingRAG و دانش سازمانیجست‌وجوی معنایی

prototype تا implementation RAG، document pipeline، retrieval orchestration و تیم‌هایی که chain-level composition می‌خواهند.

مسیر اجرا

orchestration-first

استقرار

محیط محلی • self-host

پیچیدگی

پیاده‌سازی RAG کاربردی

راهنمای مرتبط

۶ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

مقایسه مدل‌های کدنویسی

این comparison guide برای تیم‌هایی است که بین GPT، Qwen Coder، DeepSeek Coder، Codestral و code modelهای مشابه گیر کرده‌اند و می‌خواهند trade-off عملی را ببینند.

۸۸
مقایسه تصمیم‌یاروزن‌بازCommunity / Open-weightمتن و چتکدنویسیworkflow عامل‌محور

انتخاب coding assistant، تعیین build-vs-buy، و تصمیم بین API proprietary و self-host code modelها.

مسیر اجرا

API یا self-host

استقرار

API • محیط محلی

پیچیدگی

تصمیم‌گیری میان چند family

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۴ pack کامل • ۱ pack خلاصه • ۴ pack لینک‌شده

fit عملیاتی

macOS | مناسب برای: ابزار توسعه • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Microsoft

خانواده Phi

Phi بیشتر وقتی مهم می‌شود که مدل کوچک‌تر، deployment سبک و integration با اکوسیستم مایکروسافت برایتان مهم باشد.

۸۷
خانواده مدلوزن‌بازCommunity / Open-weightمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

copilotهای داخلی سبک، edge deployment و تیم‌هایی که Azure و Windows/ONNX مسیر مهمشان است.

مسیر اجرا

edge / local

استقرار

محیط محلی • self-host

پیچیدگی

مدل کوچک و کارآمد

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Windows • Linux | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Cohere

Cohere Rerank

وقتی retrieval اولیه خوب است اما top resultها هنوز noisy هستند، Cohere Rerank یکی از ابزارهای حرفه‌ای برای بالا بردن precision نهایی است.

۸۷
خانواده مدلاختصاصیCommercial APIRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG، enterprise search و pipelineهایی که embedding-only جواب کافی نداده است.

مسیر اجرا

API-only

استقرار

API • ابر مدیریت‌شده

پیچیدگی

precision layer

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

OpenAI

Whisper

Whisper هنوز هم یک مرجع مهم برای speech-to-text عمومی است، مخصوصاً وقتی به چندزبانه بودن و سادگی API نیاز دارید.

۸۷
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل گفتار به متن

رونویسی فایل‌های صوتی، meeting notes، archive search و pipelineهای پایه STT.

مسیر اجرا

API-first

استقرار

API

پیچیدگی

STT ساده و قابل اتکا

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: محصول صوتی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Rhasspy

Piper

Piper برای TTS محلی و روی‌دستگاه بسیار مهم است؛ مخصوصاً وقتی privacy، سرعت و اجرای بدون cloud برایتان مهم‌تر از voice expressiveness بسیار بالا است.

۸۷
خانواده مدلمتن‌بازOpen-source permissiveصوت و گفتارتبدیل متن به گفتار

local TTS، edge devices، Home Assistant-style setups و محصولاتی که باید آفلاین یا در شبکه داخلی کار کنند.

مسیر اجرا

local / edge

استقرار

محیط محلی • لبه / روی دستگاه

پیچیدگی

TTS محلی سبک

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Edge / Device | مناسب برای: محصول صوتی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

ElevenLabs

ElevenLabs Scribe

ElevenLabs Scribe برای تیم‌هایی مهم است که voice stack خود را در همان ecosystem ElevenLabs می‌خواهند و ترجیح می‌دهند STT و TTS را از یک vendor بگیرند.

۸۷
خانواده مدلاختصاصیCommercial APIصوت و گفتارتبدیل گفتار به متندستیار صوتی

voice productهای API-first، agentهای صوتی و تیم‌هایی که already روی ElevenLabs برای TTS سرمایه‌گذاری کرده‌اند.

مسیر اجرا

managed voice API

استقرار

API • ابر مدیریت‌شده

پیچیدگی

speech API درون یک stack واحد

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Jina AI

Jina Reranker

Jina Reranker برای تیم‌هایی مهم است که retrieval multilingual و stage دوم ranking می‌خواهند و ترجیح می‌دهند آن را داخل stack باز یا hybrid نگه دارند.

۸۷
خانواده مدلوزن‌بازترکیبی / متغیرRerankingجست‌وجوی معناییRAG و دانش سازمانی

RAG چندزبانه، search ranking، corpusهای متنوع و pipelineهایی که precision مرحله دوم برایشان مهم است.

مسیر اجرا

self-host ranking stage

استقرار

محیط محلی • self-host

پیچیدگی

رتبه‌بندی مرحله دوم

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Container / Docker • Linux | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

Apple MLX community

اکوسیستم MLX / mlx-lm

MLX / mlx-lm برای تیم‌هایی مهم است که macOS و Apple Silicon را به‌عنوان مسیر واقعی local AI می‌بینند، نه فقط fallback development machine.

۸۷
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

local inference روی مک، developer workflow، ارزیابی مدل‌های باز روی Apple Silicon و تیم‌هایی که pilot را روی لپ‌تاپ‌های مک جلو می‌برند.

مسیر اجرا

macOS local-native

استقرار

محیط محلی

پیچیدگی

بهترین fit روی Apple Silicon

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

macOS | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

NVIDIA

اکوسیستم TensorRT-LLM

TensorRT-LLM برای تیم‌هایی مهم است که deployment روی GPU انویدیا را به‌صورت performance-driven می‌بینند و می‌خواهند از optimization stack انویدیا استفاده کنند.

۸۷
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

GPU-heavy serving، latency/throughput optimization و تیم‌هایی که serving production را روی انویدیا استاندارد کرده‌اند.

مسیر اجرا

GPU serving optimization

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

پیشرفته و infra-heavy

راهنمای مرتبط

۱ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

LangChain

راهنمای agent با LangGraph

این guide برای تیم‌هایی است که agent را به‌صورت graph و stateful workflow می‌بینند، نه فقط یک chain ساده یا tool call تک‌مرحله‌ای.

۸۷
پیاده‌سازی use-caseمتن‌بازOpen-source permissiveمتن و چتچندوجهیworkflow عامل‌محورچت و دستیار

agent workflow چندمرحله‌ای، stateful execution، tool orchestration و تیم‌هایی که graph-based control می‌خواهند.

مسیر اجرا

agent orchestration layer

استقرار

self-host • API

پیچیدگی

stateful workflow implementation

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۳ pack خلاصه • ۱ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

راهنمای Open WebUI + Ollama

این setup guide دقیقاً برای تیمی است که می‌خواهد سریع‌ترین مسیر usable برای local یا internal chat stack را با Ollama و Open WebUI ببندد.

۸۷
راهنمای نصبمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

pilot داخلی، chat portal تیمی، RAG سبک و تیم‌هایی که می‌خواهند بدون serving سنگین سریع به surface usable برسند.

مسیر اجرا

local or single-node stack

استقرار

محیط محلی • self-host

پیچیدگی

ساده و practical برای شروع

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۲ pack خلاصه • ۲ pack لینک‌شده

fit عملیاتی

macOS • Linux | مناسب برای: دستیار عمومی • هوش مصنوعی محلی

آخرین بازبینی: 2026-04-23

ورود به راهنما

Cohere

خانواده Command

Command برای تیم‌هایی مهم است که RAG، agents و multilingual enterprise workload را با API مصرف می‌کنند.

۸۶
خانواده مدلاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

دانش سازمانی، search-heavy assistantها و تیم‌هایی که روی retrieval و citation حساس‌اند.

مسیر اجرا

API / managed

استقرار

API • ابر مدیریت‌شده

پیچیدگی

enterprise RAG محور

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • macOS | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Meta

SAM 2

SAM 2 برای تیم‌هایی مهم است که segmentation و visual prompting را به‌عنوان capability مستقل می‌خواهند، نه صرفاً یک VLM chat response.

۸۶
خانواده مدلوزن‌بازCommunity / Open-weightچندوجهیتحلیل سندworkflow عامل‌محور

image and video segmentation، annotation workflow، inspection pipeline و محصولاتی که mask و region-level output لازم دارند.

مسیر اجرا

self-host vision component

استقرار

محیط محلی • self-host

پیچیدگی

vision primitive برای segmentation

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Edge / Device | مناسب برای: پردازش سند • تحلیل ویدئو

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

NVIDIA

Parakeet

Parakeet برای تیم‌هایی مهم است که STT باز می‌خواهند اما در عین حال به performance-aware deployment و ecosystem انویدیا هم نگاه می‌کنند.

۸۶
خانواده مدلوزن‌بازOpen model termsصوت و گفتارتبدیل گفتار به متن

speech pipelineهای GPU-centric، batch or near-realtime transcription و تیم‌هایی که already روی stack انویدیا هستند.

مسیر اجرا

GPU-centric self-host

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

speech مدل باز در stack انویدیا

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: محصول صوتی • پشتیبانی مشتری

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

SGLang Project

اکوسیستم SGLang

SGLang برای تیم‌هایی مهم است که inference و serving را performance-first می‌بینند و می‌خواهند beyond simple vLLM-style setup به scheduling و execution توجه کنند.

۸۶
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

serving مدل‌های باز، performance-sensitive inference و تیم‌هایی که throughput و latency را جدی‌تر optimize می‌کنند.

مسیر اجرا

performance-oriented serving

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

stack inference پیشرفته‌تر

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

AWS / Amazon

استقرار LLM روی SageMaker

این guide برای تیم‌هایی است که می‌خواهند serving مدل‌های باز یا سفارشی را روی SageMaker جلو ببرند و به rollout، endpoint lifecycle و cloud ops فکر می‌کنند.

۸۶
راهنمای deploymentاختصاصیCommercial APIمتن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

سازمان‌های AWS-centric که endpoint، autoscaling، model package و rollout cloud-managed می‌خواهند.

مسیر اجرا

managed cloud deployment

استقرار

ابر مدیریت‌شده

پیچیدگی

ops-heavy enterprise path

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-23

ورود به راهنما

deepset

راهنمای RAG با Haystack

این guide Haystack را به‌عنوان implementation route برای search و RAG پوشش می‌دهد؛ مخصوص تیم‌هایی که pipelineهای retrieval را structured می‌خواهند.

۸۶
راهنمای integrationمتن‌بازOpen-source permissiveمتن و چتEmbeddingRAG و دانش سازمانیجست‌وجوی معنایی

pipelineهای retrieval، document-centric systems و تیم‌هایی که Haystack-style component model را ترجیح می‌دهند.

مسیر اجرا

component-based RAG

استقرار

self-host • API

پیچیدگی

retrieval pipeline implementation

راهنمای مرتبط

۴ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۴ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: جست‌وجوی سازمانی • پردازش سند

آخرین بازبینی: 2026-04-23

ورود به راهنما

LiteLLM

اکوسیستم LiteLLM

LiteLLM برای تیم‌هایی مهم است که multi-provider gateway، routing و compatibility layer می‌خواهند و نمی‌خواهند هر provider را جدا در backend پیاده کنند.

۸۶
اکوسیستم / ابزارمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارworkflow عامل‌محور

provider routing، fallback، cost control، unified API surface و backendهایی که چند vendor را هم‌زمان مصرف می‌کنند.

مسیر اجرا

gateway and routing layer

استقرار

self-host • API

پیچیدگی

مناسب multi-provider backend

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۹ pack کامل • ۰ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

وابسته به stack انتخابی | مناسب برای: دستیار عمومی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

Hooshgate Reference

مدل‌های local روی ویندوز

این setup guide دقیقاً برای کاربر ویندوز است: از local LLM روی لپ‌تاپ یا ورک‌استیشن شروع کنید، بدون اینکه pretend کنیم همه setupها یکسان هستند.

۸۶
راهنمای نصبمتن‌بازOpen-source permissiveمتن و چتچندوجهیچت و دستیارکدنویسی

developer workstation ویندوز، pilot محلی، تست code assistant و تیم‌هایی که local AI را روی Windows/WSL می‌خواهند.

مسیر اجرا

Windows / WSL local-first

استقرار

محیط محلی

پیچیدگی

عملی برای شروع ولی hardware-sensitive

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۲ pack خلاصه • ۲ pack لینک‌شده

fit عملیاتی

Windows | مناسب برای: هوش مصنوعی محلی • ابزار توسعه

آخرین بازبینی: 2026-04-23

ورود به راهنما

AI21

خانواده Jamba

Jamba برای تیم‌هایی جالب است که long-context، private deployment و enterprise workflow را در یک خانواده open model می‌خواهند.

۸۵
خانواده مدلوزن‌بازترکیبی / متغیرمتن و چتچت و دستیاراستدلال و تحلیل

long-context RAG، grounded QA و سازمان‌هایی که private deployment برایشان حیاتی است.

مسیر اجرا

private deploy friendly

استقرار

API • self-host

پیچیدگی

enterprise self-host

راهنمای مرتبط

۵ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Cloud managed | مناسب برای: دستیار عمومی • جست‌وجوی سازمانی

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

Alibaba / Qwen

Qwen Audio

Qwen Audio برای تیم‌هایی مهم است که مدل صوتی باز در همان ecosystem Qwen می‌خواهند و می‌خواهند voice understanding را کنار familyهای دیگر Qwen جلو ببرند.

۸۵
خانواده مدلوزن‌بازOpen-source permissiveصوت و گفتارچندوجهیتبدیل گفتار به متندستیار صوتی

voice assistant آزمایشی، multimodal audio workflows و تیم‌هایی که می‌خواهند audio understanding را self-host یا hybrid جلو ببرند.

مسیر اجرا

audio understanding باز

استقرار

self-host • ابر مدیریت‌شده

پیچیدگی

voice-capable model family

راهنمای مرتبط

۳ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Linux • Container / Docker | مناسب برای: محصول صوتی • دستیار عمومی

آخرین بازبینی: 2026-04-23

ورود به صفحه مرجع

AWS

خانواده Amazon Nova

Nova برای تیم‌هایی مناسب است که روی AWS هستند و می‌خواهند از مدل‌های چندوجهی با governance و integration بومی آمازون استفاده کنند.

۸۴
خانواده مدلاختصاصیپلتفرم مدیریت‌شدهمتن و چتچندوجهیچت و دستیاراستدلال و تحلیل

سازمان‌های AWS-first، RAG و assistantهای enterprise با integration نزدیک به Bedrock و خدمات ابری آمازون.

مسیر اجرا

Bedrock / AWS-managed

استقرار

ابر مدیریت‌شده • API

پیچیدگی

cloud-native enterprise

راهنمای مرتبط

۲ guide مکمل

پوشش همین صفحه

مرور مدلآموزش عملینصب و راه‌اندازیserving و runtime

۵ pack کامل • ۵ pack خلاصه • ۰ pack لینک‌شده

fit عملیاتی

Cloud managed | مناسب برای: دستیار عمومی • پردازش سند

آخرین بازبینی: 2026-04-22

ورود به صفحه مرجع

ورود سریع

ورود سریع بر اساس سناریو

اگر هنوز مطمئن نیستی دنبال چه خانواده‌ای بگردی، از shortcutهای زیر شروع کن.