Hooshgate Models Center

مرجع فارسی انتخاب مدل، setup، integration و deployment

این بخش playground یا inference UI نیست. اینجا برای browse، مقایسه، انتخاب مسیر local/API/self-host و رسیدن به guideهای درست ساخته شده است. در بازسازی فعلی، فقط مرز curated و قابل‌اتکا روی surface عمومی مانده است.

مرجع و directoryopen-source / open-weightproprietary / API-firstsetup / integration / deployment

مرز عمومی فعلی

بازسازی با فهرست curated

در این فاز فقط صفحه‌هایی روی /fa/models دیده می‌شوند که برای reference، selection یا guide عملی ارزش روشن دارند.

کل صفحه‌های visible

۸۶

خانواده و مدل

۳۳

guide و tooling

۵۳

متن‌باز

۳۰

وزن‌باز

۲۳

صفحه‌های proprietary

۳۳

اگر دنبال عمق هستید، از guideها شروع کنید. family pageها بیشتر برای فهم fit، trade-off و shortlist هستند؛ setup و deployment عمیق معمولاً روی pageهای dedicated باز می‌شوند.

Browse سریع

۳۳ صفحه در مرز عمومی فعلی

مرکز مدل‌ها فعلاً فقط روی curated boundary اجرا می‌شود تا surface تمیز، قابل‌جست‌وجو و مرجع‌گونه بماند.

تحلیل سند

خانواده‌های پایه LLM

برای انتخاب بین GPT، Claude، Gemini، Llama، Qwen و Mistral از اینجا شروع کنید.

۱۴ صفحه

کدنویسی و workflow توسعه

مدل‌ها و guideهایی برای code assistant، repo workflow و انتخاب coding stack.

۴۱ صفحه

Embedding، RAG و reranking

برای retrieval stack، document AI و search quality مسیرهای مرتبط را اینجا ببینید.

۴۶ صفحه

تصویر، ویدئو و صوت

مدل‌های media و voice را کنار هم ببینید و بعد بین API و self-host تصمیم بگیرید.

۳۷ صفحه

اکوسیستم و serving

برای Ollama، vLLM، TGI، Hugging Face و runtimeهای محلی و production.

۱۸ صفحه

نصب، integration و deployment

اگر دنبال جواب اجرایی هستید، به‌جای family pages از guideها شروع کنید.

۳۱ صفحه

عمق M4B

عمق را از نوع guide وارد کنید

برای این فاز، landing نقش hub دارد نه card dump. از laneهای curated وارد setup، comparison، deployment، implementation، local/self-host و API-first شوید.

ورود از مسیر task

اگر use-case را می‌دانید، از task شروع کنید و بعد vendor یا runtime را باریک کنید.

ورود از مسیر ecosystem

اگر stack را می‌دانید، از Hugging Face، Ollama، vLLM یا runtimeهای محلی وارد شوید.

نقطه‌های شروع خوب

چند صفحه برای شروع سریع

اگر هنوز مطمئن نیستید از کجا شروع کنید، یکی از این صفحه‌های مرجع یا guide را باز کنید.

خانواده مدل

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

راهنمای نصب

مدل هاي local روي macOS

اگر قرار است local AI را روي مک جدي و قابل تکرار جلو ببريد، اين صفحه تفاوت Ollama، MLX و LM Studio را از نگاه hardware fit، developer workflow و مسير migration روشن مي کند.

مقایسه تصمیم‌یار

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

مقایسه تصمیم‌یار

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

مقایسه تصمیم‌یار

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

راهنمای استقرار

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

راهنمای استقرار

استقرار realtime voice stack در production

این guide برای لحظه‌ای است که voice agent از demo عبور می‌کند و باید با latency بودجه‌بندی‌شده، barge-in، streaming، fallback، observability و policy ضبط صدا وارد production شود.

راهنمای پیاده‌سازی

GitHub Copilot Coding Agent

GitHub Copilot Coding Agent برای تیم‌هایی مهم است که می‌خواهند issue-to-PR automation را داخل همان workflow گیت‌هاب خودشان جلو ببرند، با review و policyهای سازمانی نزدیک به محل کار اصلی تیم.

راهنمای پیاده‌سازی

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

OpenAIخانواده مدلاختصاصی

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات agentic، backofficeهای سندمحور، workflowهای کدنویسی و تیم‌هایی که می‌خواهند عملیات inference را برون‌سپاری کنند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: برای self-host گزینه اصلی نیست؛ باید هزینه، حریم خصوصی و lock-in را از ابتدا در معماری لحاظ کنید.

ورود به صفحه مرجع
Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های product، infra و enterprise که باید تصمیم deployment بگیرند و نمی‌خواهند تحت‌تأثیر hype یک مسیر اشتباه انتخاب کنند.

مسیر شروع

decision framework

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • API

محیط

Cloud managed

نکته‌ی مهم: هیچ مسیر «همیشه درست» وجود ندارد؛ تصمیم باید بر اساس latency target، داده، team maturity و economics workload گرفته شود.

ورود به راهنما
Hooshgate Referenceراهنمای یکپارچه‌سازیوزن‌باز

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند روی اسناد داخلی، دانش سازمانی، policy و document assistant یک RAG قابل‌نگهداری بسازند.

مسیر شروع

integration-focused

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون dataset ارزیابی، metadata درست و failure taxonomy، بیشتر RAGها فقط demo خوب هستند نه محصول قابل اتکا.

ورود به راهنما
Hooshgate Referenceراهنمای استقراراختصاصی

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر شروع

ops and safety layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون quality review، trace و policy checks، حتی بهترین مدل‌ها هم به‌مرور drift می‌کنند و اعتماد کاربر را از بین می‌برند.

ورود به راهنما
Anthropicخانواده مدلاختصاصی

خانواده Claude

Claude برای تیم‌هایی مناسب است که long-context، کیفیت نوشتار و رفتار پایدار در workflowهای document-heavy می‌خواهند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

تحلیل سند، agentهای دانشی، بازنویسی حرفه‌ای و تیم‌هایی که روی Bedrock یا Vertex AI نیز deployment می‌خواهند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: مثل GPT، self-host در مسیر اصلی ندارد و باید economics و data boundary جداگانه مدیریت شود.

ورود به صفحه مرجع
Hooshgate Referenceراهنمای استقراراختصاصی

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

tech leadها، infra leadها و product ownerهایی که باید یک AI feature را به‌شکل production-grade وارد سیستم واقعی کنند.

مسیر شروع

production operations

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بیشتر شکست‌های production نه از خود مدل، بلکه از فقدان rollout phase، logging، fallback و ownership عملیاتی می‌آید.

ورود به راهنما
Googleخانواده مدلاختصاصی

خانواده Gemini

Gemini برای تیم‌هایی جذاب است که از ورودی‌های چندوجهی، PDF، ویدئو یا Google stack استفاده می‌کنند و می‌خواهند API و cloud-native workflow یکپارچه باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات multimodal، تحلیل PDF و ویدئو، RAGهای اسنادی و تیم‌هایی که روی Google Cloud یا Vertex AI کار می‌کنند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر تیم شما vendor-neutral یا self-host-first است، Gemini شاید بهترین نقطه شروع نباشد.

ورود به صفحه مرجع
Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند مدل‌ها را مقایسه، weightها را مدیریت، dataset و adapter را منتشر و از یک ecosystem منسجم برای open model workflow استفاده کنند.

مسیر شروع

ecosystem backbone

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Cloud managed

نکته‌ی مهم: داشتن model card روی Hugging Face به معنی production-ready بودن مدل یا روشن‌بودن license آن نیست؛ governance و review هنوز بر عهده شماست.

ورود به راهنما
Hooshgate Referenceراهنمای یکپارچه‌سازیاختصاصی

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

محصولات agentic، document AI، multimodal appها و تیم‌هایی که زیرساخت inference را نمی‌خواهند خودشان نگه دارند.

مسیر شروع

API-managed path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: ساده‌بودن integration اولیه باعث می‌شود بسیاری از تیم‌ها logging، budget، fallback و data boundary را دیرتر از حد لازم طراحی کنند.

ورود به راهنما
Hooshgate Referenceراهنمای پیاده‌سازیوزن‌باز

پیاده‌سازی document AI و سندمحور

document AI فقط OCR یا chat با PDF نیست. این guide نشان می‌دهد برای ingestion، extraction، validation، citation و human review چطور یک pipeline سندمحور قابل‌اعتماد بسازید.

چندوجهیمتن و چتتحلیل سندRAG و دانش سازمانی

کجا به کار می‌آید؟

workflowهای قرارداد، فاکتور، policy، proposal review و هر use-case که سند source-of-truth است.

مسیر شروع

use-case implementation

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بزرگ‌ترین خطا این است که extraction را مستقیماً به مدل بسپارید بدون schema، validator و review path.

ورود به راهنما
Mistral AIخانواده مدلوزن‌باز

Pixtral

Pixtral برای تیم‌هایی مناسب است که vision + text را با امکان self-host می‌خواهند و نمی‌خواهند برای OCR، سندخوانی و VLM صرفاً به APIهای بسته متکی بمانند.

چندوجهیچت و دستیارتحلیل سند

کجا به کار می‌آید؟

document AI، تحلیل تصویر و PDF، بازرسی کیفیت محتوای تصویری و workflowهای چندوجهی که باید روی زیرساخت خودتان هم قابل اجرا باشند.

مسیر شروع

API یا self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: کیفیت Pixtral در ورودی‌های تصویری ساخت‌یافته خوب است، اما برای سناریوهای فوق‌حساس باید latency، VRAM و دقت extraction را با دیتای خودتان benchmark کنید.

ورود به صفحه مرجع
Mistral AIخانواده مدلاختصاصی

Mistral OCR

Mistral OCR برای تیم‌هایی مهم است که OCR و document extraction را به‌عنوان یک API production-ready می‌خواهند و نمی‌خواهند از صفر pipeline بینایی و parsing بسازند.

چندوجهیتحلیل سندچت و دستیار

کجا به کار می‌آید؟

استخراج متن و ساختار از PDF، workflowهای سندمحور، backofficeهای فرم‌محور و archiveهای سازمانی.

مسیر شروع

API-first document path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر residency داده، self-host یا pipeline کاملاً تحت‌کنترل لازم دارید، باید گزینه‌های باز و self-host را هم کنار این API benchmark کنید.

ورود به صفحه مرجع
Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

CTO، tech lead و product/infra teamهايي که بايد baseline مدل را براي محصول، coding workflow يا assistant سازماني انتخاب کنند.

مسیر شروع

decision layer بين API و open infra

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Cloud managed

نکته‌ی مهم: هيچ کدام ذاتا برنده مطلق نيستند؛ proprietary و open فقط وقتي معنا دارند که task، budget، data boundary و ops ownership را کنار هم ببينيد.

ورود به راهنما
Mistral AIخانواده مدلوزن‌باز

خانواده Mistral

Mistral برای تیم‌هایی جذاب است که هم self-host می‌خواهند و هم سبدی از مدل‌های تخصصی‌تر مثل coding، multimodal و document AI را در یک خانواده ببینند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

سازمان‌هایی که بین API و self-host جابه‌جا می‌شوند و می‌خواهند از مدل‌های متنوع این خانواده برای code، vision و enterprise search استفاده کنند.

مسیر شروع

API + self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Container / Docker

نکته‌ی مهم: تنوع مدل‌ها مزیت است، اما بدون taxonomy داخلی و استاندارد انتخاب مدل، تیم به‌سرعت سردرگم می‌شود.

ورود به صفحه مرجع
Alibaba / Qwenخانواده مدلوزن‌باز

Qwen VL

Qwen VL خانواده‌ای است برای تیم‌هایی که VLM باز، قوی در document understanding و قابل self-host می‌خواهند و نمی‌خواهند همه چیز را به APIهای بسته بسپارند.

چندوجهیچت و دستیارتحلیل سند

کجا به کار می‌آید؟

OCR-aware workflows، document AI، visual QA، agentهای چندوجهی و محیط‌هایی که latency و data boundary باید داخل infra خودتان کنترل شود.

مسیر شروع

self-host یا managed endpoint

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: برای rollout حساس باید VRAM، throughput و کیفیت extraction را روی سندهای واقعی خودتان benchmark کنید.

ورود به صفحه مرجع
Hooshgate Referenceراهنمای نصباختصاصی

راه اندازي API-first براي مدل هاي تجاري

اين راهنما براي تيمي است که مي خواهد مدل تجاري را به شکل API-first وارد محصول يا backend کند، بدون اين که ساده بودن SDK او را از schema، cost guardrail، fallback و ownership عملي غافل کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

MVP سريع، backendهاي product-first، appهاي agentic يا document-heavy و تيم هايي که مي خواهند قبل از self-host سراغ value عملي بروند.

مسیر شروع

delivery سريع با governance لازم

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: API-first burden serving را کم مي کند، اما cost، vendor dependency، retention policy و failure handling را از بين نمي برد.

ورود به راهنما
Hooshgate Referenceمقایسه تصمیم‌یاراختصاصی

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

ویدئوچندوجهیتولید ویدئوتولید تصویر

کجا به کار می‌آید؟

تیم‌های محصول، رسانه، آموزش، مارکتینگ و AI tooling که می‌خواهند ویدئو را به شکل کنترل‌شده وارد prototype، تولید asset یا تحلیل محتوای ویدئویی کنند.

مسیر شروع

managed-first, open-weight experimental

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر دنبال inference ارزان، self-host ساده یا تولید انبوه بدون review حقوقی و انسانی هستید، ویدئو معمولاً انتخاب اول خوبی نیست.

ورود به راهنما
OpenAIخانواده مدلاختصاصی

OpenAI Embeddings

اگر به embedding API ساده، پایدار و کم‌دردسر نیاز دارید، خانواده text-embedding-3 یکی از baselineهای حرفه‌ای بازار است.

Embedding / بردارسازیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG، semantic search، deduplication و هر جایی که می‌خواهید embedding به‌عنوان سرویس مدیریت شود.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: مثل هر embedding API دیگر، هزینه در scale بالا باید با حجم سند، refresh index و dimension strategy سنجیده شود.

ورود به صفحه مرجع
Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم PEFT

PEFT در hub به این خاطر مهم است که لایه adaptation عملی برای modelهای باز را پوشش می‌دهد؛ یعنی جایی بین prompt-only و full fine-tuning.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

LoRA، adapter-based tuning، domain adaptation کم‌هزینه و تیم‌هایی که می‌خواهند experimentation را بدون full training شروع کنند.

مسیر شروع

training-adaptation toolkit

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Cloud managed

نکته‌ی مهم: بدون baseline، eval و data curation، PEFT فقط complexity اضافه می‌کند و الزاماً quality بهتر نمی‌دهد.

ورود به راهنما
Googleراهنمای یکپارچه‌سازیاختصاصی

Gemini Live API

Gemini Live API وقتی مهم می‌شود که شما به تعامل کم‌تاخیر صوت/ویدئو نیاز دارید و می‌خواهید conversation به سبک real-time را داخل محصول خودتان بسازید.

چندوجهیصوت و گفتاردستیار صوتیچت و دستیار

کجا به کار می‌آید؟

voice assistant، multimodal sessions، use-caseهای real-time و محصولاتی که interruption، turn-taking و media streaming برایشان مهم است.

مسیر شروع

managed low-latency media path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: real-time بودن به‌معنای complexity بالاتر در session control، interruption handling، media pipeline و observability است.

ورود به راهنما
Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای self-host روی لینوکس

این guide برای تیمی است که واقعاً می‌خواهد روی Linux self-host کند: انتخاب بین vLLM، TGI، GGUF، container و incident path.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

stack self-host، private infra، rollout مدل‌های باز و تیم‌هایی که production serving را روی Linux جلو می‌برند.

مسیر شروع

Linux production-minded

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: self-host فقط نصب مدل نیست؛ queueing، logging، incident، security و upgrade path هم باید روشن باشند.

ورود به راهنما
Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Omni

Qwen Omni برای تیم‌هایی مهم است که مدل باز چندوجهی با ورودی متن، تصویر و صدا می‌خواهند و می‌خواهند آن را در stack خودشان ادغام کنند.

چندوجهیصوت و گفتارچت و دستیارتحلیل سند

کجا به کار می‌آید؟

multimodal chat، voice-enabled assistant، image + text workflows و تجربه‌های unified که نمی‌خواهند کاملاً وابسته به API بسته باشند.

مسیر شروع

self-host ممکن

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Cloud managed

نکته‌ی مهم: مدل‌های omni به‌سادگی روی paper خوب به نظر می‌رسند، اما در محصول واقعی complexity orchestration و testing آن‌ها بالاست.

ورود به صفحه مرجع
Googleخانواده مدلوزن‌باز

خانواده Gemma

Gemma برای تیم‌هایی مناسب است که مدل باز و سبک‌تر می‌خواهند، اما همچنان می‌خواهند از lineage و tooling گوگل بهره ببرند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

edge و local AI، prototypeهای self-host و تیم‌هایی که مدل بازتر اما manageable می‌خواهند.

مسیر شروع

local / edge friendly

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: Gemma family variantهای متنوعی دارد؛ باید بین core، code و multimodal فرق بگذارید.

ورود به صفحه مرجع
AWS / Amazonاکوسیستم / ابزاراختصاصی

اکوسیستم Amazon Bedrock

Amazon Bedrock برای تیم‌هایی مهم است که multi-model access را در بستر AWS و با دغدغه enterprise governance می‌خواهند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

سازمان‌هایی که already در AWS هستند، policy و governance برایشان مهم است و می‌خواهند model access را داخل همان cloud plane نگه دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed • Serverless

نکته‌ی مهم: Bedrock یک model family واحد نیست؛ quality و ops آن به provider انتخابی، region و service design شما وابسته است.

ورود به راهنما
Googleاکوسیستم / ابزاراختصاصی

اکوسیستم Vertex AI Model Garden

Vertex AI Model Garden برای تیم‌هایی مهم است که در Google Cloud هستند و می‌خواهند هم مدل‌های گوگل و هم بعضی model familyهای third-party را از یک cloud plane ببینند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Google Cloud-native teams، managed AI platform، teamهای data/ML که already روی Vertex و GCP workflow دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: Model Garden هم یک platform layer است؛ باید کیفیت هر family را جدا benchmark و governance آن را جدا طراحی کنید.

ورود به راهنما
Hugging Face / ViDoReخانواده مدلوزن‌باز

ColQwen2

ColQwen2 برای تیم‌هایی مهم است که visual retrieval و document search را به‌صورت باز و self-hostable می‌خواهند، نه فقط OCR یا embedding متنی ساده.

چندوجهیEmbedding / بردارسازیتحلیل سندجست‌وجوی معنایی

کجا به کار می‌آید؟

PDF retrieval، visual search در اسناد پیچیده، pipelineهای RAG سندی و محیط‌هایی که می‌خواهند retrieval تصویر-محور را خودشان کنترل کنند.

مسیر شروع

self-host retrieval stack

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: اگر هنوز retrieval pipeline و eval سندی شما ساده است، ممکن است ColQwen2 زودتر از نیاز واقعی‌تان پیچیدگی وارد کند.

ورود به صفحه مرجع
LangChainراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با LangChain

این guide برای تیم‌هایی است که RAG را واقعاً implement می‌کنند و دنبال wiring بین retriever، prompt، model و evaluation هستند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

prototype تا implementation RAG، document pipeline، retrieval orchestration و تیم‌هایی که chain-level composition می‌خواهند.

مسیر شروع

orchestration-first

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

وابسته به stack انتخابی

نکته‌ی مهم: LangChain خودِ answer quality را تضمین نمی‌کند؛ retrieval quality، schema و evaluation هنوز مسئولیت تیم است.

ورود به راهنما
Googleخانواده مدلاختصاصی

Gemini Embedding

Gemini Embedding برای تیم‌هایی مناسب است که retrieval stack خود را روی Google ecosystem نگه می‌دارند.

Embedding / بردارسازیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG، semantic retrieval و pipelineهایی که هم generation و هم embedding را در Google stack می‌خواهند.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر vendor-neutrality مهم است، abstraction layer لازم است.

ورود به صفحه مرجع
Microsoftاکوسیستم / ابزاراختصاصی

اکوسیستم Azure AI Foundry

Azure AI Foundry برای سازمان‌هایی مهم است که enterprise controls مایکروسافتی و model access را در یک platform واحد می‌خواهند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Azure-centric organizations، enterprise governance، app teams که می‌خواهند model access و security controls را داخل Azure نگه دارند.

مسیر شروع

managed enterprise platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: مثل بقیه platform pageها، اینجا درباره delivery و governance حرف می‌زنیم نه تضمین کیفیت هر model family.

ورود به راهنما
Microsoftخانواده مدلوزن‌باز

خانواده Phi

Phi بیشتر وقتی مهم می‌شود که مدل کوچک‌تر، deployment سبک و integration با اکوسیستم مایکروسافت برایتان مهم باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

copilotهای داخلی سبک، edge deployment و تیم‌هایی که Azure و Windows/ONNX مسیر مهمشان است.

مسیر شروع

edge / local

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Windows • Linux

نکته‌ی مهم: برای همه taskها نباید Phi را به‌عنوان جایگزین مستقیم frontier modelها دید؛ strength آن بیشتر در efficiency است.

ورود به صفحه مرجع
AWS / Amazonراهنمای استقراراختصاصی

استقرار LLM روی SageMaker

این guide برای تیم‌هایی است که می‌خواهند serving مدل‌های باز یا سفارشی را روی SageMaker جلو ببرند و به rollout، endpoint lifecycle و cloud ops فکر می‌کنند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

سازمان‌های AWS-centric که endpoint، autoscaling، model package و rollout cloud-managed می‌خواهند.

مسیر شروع

managed cloud deployment

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر فقط یک pilot ساده دارید، complexity این مسیر می‌تواند از نیاز واقعی شما بیشتر باشد.

ورود به راهنما
deepsetراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با Haystack

این guide Haystack را به‌عنوان implementation route برای search و RAG پوشش می‌دهد؛ مخصوص تیم‌هایی که pipelineهای retrieval را structured می‌خواهند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

pipelineهای retrieval، document-centric systems و تیم‌هایی که Haystack-style component model را ترجیح می‌دهند.

مسیر شروع

component-based RAG

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: Framework choice مسئله اصلی نیست؛ corpus quality، evaluation و answer rubric هنوز تعیین‌کننده‌اند.

ورود به راهنما
AWSخانواده مدلاختصاصی

خانواده Amazon Nova

Nova برای تیم‌هایی مناسب است که روی AWS هستند و می‌خواهند از مدل‌های چندوجهی با governance و integration بومی آمازون استفاده کنند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

سازمان‌های AWS-first، RAG و assistantهای enterprise با integration نزدیک به Bedrock و خدمات ابری آمازون.

مسیر شروع

Bedrock / AWS-managed

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

ابر مدیریت‌شده • API

محیط

Cloud managed

نکته‌ی مهم: برای تیم‌های خارج از AWS، lock-in و معماری cloud-native باید آگاهانه مدیریت شود.

ورود به صفحه مرجع