Googleخانواده مدلوزن‌بازبازبینی: 2026-04-23

CodeGemma

CodeGemma برای تیم‌هایی مهم است که coding model سبک‌تر و باز می‌خواهند و ترجیح می‌دهند روی همان ecosystem Gemma/Google باقی بمانند.

بهترین کاربرد

code completion سبک، local experimentation، IDE prototype و تیم‌هایی که می‌خواهند code model باز را با footprint معقول‌تر امتحان کنند.

مسیر اجرا

local-friendly

ملاحظه مهم

برای repo-scale reasoning یا tool-use پیچیده باید آن را با DeepSeek Coder، Qwen Coder و GPT benchmark کنید.

دسترسی سریع

پوشش صفحه مرور آموزش مسیر عملی سازگارسازی مقایسه ارزیابی منابع

لایسنس

Gemma open model terms

پیچیدگی

نسبتاً سبک برای code experimentation

تسک‌ها

کدنویسی • چت و دستیار

مودالیته‌ها

متن و چت

پوشش واقعی

این صفحه چه packهایی را واقعاً پوشش می‌دهد؟

مرور مدل

کامل

این صفحه باید اول به‌عنوان مرجع شناخت، fit و boundary تصمیم‌گیری قابل اتکا باشد.

آموزش عملی

کامل

سناریوی شروع و مسیر استفاده اولیه روی همین صفحه آمده است.

نصب و راه‌اندازی

خلاصه روی همین صفحه

روی family page فقط مسیرهای recommended و trade-offها آمده تا browse و selection تمیز بماند.

اکوسیستم Hugging Face Transformers stack

serving و runtime

خلاصه روی همین صفحه

این pack در سطح family/reference خلاصه شده تا انتخاب مسیر اجرا سریع‌تر شود.

اکوسیستم Hugging Face Transformers stack

پیاده‌سازی

خلاصه روی همین صفحه

روی family page فقط patternها و بلوک‌های معماری اصلی برای انتخاب سریع آمده است.

اکوسیستم Hugging Face Transformers stack

سازگارسازی

خلاصه روی همین صفحه

روی family page فقط fit و caveatهای tuning گفته می‌شود؛ playbook عمیق باید جداگانه دنبال شود.

استقرار

خلاصه روی همین صفحه

روی family/reference page فقط deployment fit، cost و caveatهای اصلی آمده است.

اکوسیستم Hugging Face Transformers stack

مقایسه

کامل

این صفحه باید به تصمیم‌گیری بین گزینه‌ها کمک کند، نه صرفاً معرفی.

ارزیابی

کامل

بدون eval و quality gate این hub نباید overclaim کند؛ بنابراین checklist ارزیابی روی صفحه آمده است.

منابع رسمی

کامل

منابع رسمی و مسیر مطالعه بیشتر باید روی هر صفحه کامل و شفاف باشد.

مرور مدل

این مدل چیست و کجا می‌درخشد؟

CodeGemma بیشتر وقتی معنا دارد که شما code-focused open model می‌خواهید اما نمی‌خواهید سراغ مدل‌های خیلی سنگین بروید.

در Hooshgate، این family را برای local coding pilot و developer workflowهای کوچک‌تر می‌بینیم، نه لزوماً به‌عنوان strong default برای هر تیم enterprise.

اگر cost و footprint برای شما مهم‌تر از بالاترین raw capability است، CodeGemma ارزش بررسی دارد.

نقاط قوت

سبک‌تر از بعضی code modelهای بزرگ
open-weight
شروع آسان برای local pilot

محدودیت‌ها

ممکن است برای repo-scale tasks کافی نباشد
DX نهایی به orchestration شما وابسته است

تفاوت کلیدی

سه نکته‌ای که این خانواده را از گزینه‌های هم‌رده جدا می‌کند.

نکته 1

در برابر DeepSeek Coder سبک‌تر است ولی ممکن است عمق کمتری بدهد.

نکته 2

در برابر GPT/Claude، خودتان باید serving و eval را بسازید.

نکته 3

برای Hooshgate این family بیشتر گزینه pilot و cost-aware coding stack است.

برای چه مناسب است

code completion سبک، local experimentation، IDE prototype و تیم‌هایی که می‌خواهند code model باز را با footprint معقول‌تر امتحان کنند.
footprint سبک‌تر می‌خواهید.
coding pilot محلی و باز می‌خواهید.

برای چه مناسب نیست

برای repo-scale reasoning یا tool-use پیچیده باید آن را با DeepSeek Coder، Qwen Coder و GPT benchmark کنید.
بالاترین capability coding لازم است.
repo-scale reasoning خیلی مهم است.

آموزش عملی

اولین مسیر عملی با CodeGemma

pilot محلی برای completion و code chat روی پروژه‌های کوچک‌تر

مرحله 1

ابتدا use-case را به‌صورت محدود برای pilot محلی برای completion و code chat روی پروژه‌های کوچک‌تر تعریف کنید و success metric را قبل از اجرا بنویسید.

مرحله 2

روی CodeGemma فقط با چند ورودی واقعی pilot بگیرید و خروجی را با schema، human review یا benchmark داخلی بسنجید.

مرحله 3

اگر pilot قابل‌دفاع بود، بعد سراغ integration، logging و rollout کنترل‌شده بروید نه rollout کامل از روز اول.

نمونه ورودی

یک issue واقعی، function signature یا diff target به همراه constraintهای repo

خروجی مورد انتظار

patch، پیشنهاد refactor یا پاسخ ساخت‌یافته برای review مهندسی

خطاهای رایج

اشتباه‌هایی که معمولاً باعث می‌شوند pilot یا implementation شکست بخورد.

نکته 1

pilot را با داده مصنوعی یا ورودی خیلی تمیز قضاوت نکنید.

نکته 2

بدون schema، quality gate و fallback، مسیر production خیلی زود ناپایدار می‌شود.

نکته 3

قبل از rollout، هزینه و latency را در mode واقعی deployment بسنجید.

مسیر عملی

setup، runtime، integration و deployment در این family

مسیرهای setup

pilot محلی: discovery، prompt testing و single-user evaluation
self-host عملیاتی: data residency، volume پایدار، customization یا economics قابل‌پیش‌بینی

انتخاب runtime و serving path

local run: pilot محلی، prompt workshop و team evaluation
self-host: data residency، workload پایدار، custom serving و optimization اقتصادی در scale

مسیرهای integration

backend integration: اکثر appها و workflowهای جدی که باید provider/runtime را پشت backend پنهان کنند
enterprise workflow: محصولات چندتیمی، taskهای حساس و rollout مرحله‌ای

یادداشت deployment

local runtime
Ollama / GGUF
بدون eval روی codebase واقعی تصمیم نهایی نگیرید.
برای tool-use پیچیده باید orchestration بیرونی بسازید.
برای local pilot اقتصادی است اما context و repo retrieval تعیین‌کننده تجربه نهایی هستند.

production و ریسک

offline eval و success criteria
staging با tracing و feature flag
artifact trust، network policy و access control را قبل از launch روشن کنید.
pilot را با داده مصنوعی یا ورودی خیلی تمیز قضاوت نکنید.
بدون schema، quality gate و fallback، مسیر production خیلی زود ناپایدار می‌شود.

guideهای مکمل برای عمق بیشتر

روی family page فقط decision layer آمده است. برای playbook عمیق‌تر یکی از مسیرهای زیر را باز کنید.

setup و onboarding

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

Transformers stack

Transformers stack زمانی مناسب است که می‌خواهید روی اجرای مدل، pre/post-processing و training/inference workflow کنترل عمیق داشته باشید و حاضر باشید از سادگی runtimeهای turnkey صرف‌نظر کنید.

integration و implementation

اکوسیستم Hugging Face

Transformers stack

deployment و serving

اکوسیستم Hugging Face

Transformers stack

سازگارسازی

سازگارسازی CodeGemma

وضعیت پشتیبانی

LoRA و adapter معمولاً practicalترین مسیر است

مسیرهای پیشنهادی

LoRA / QLoRA
adapter merge
instruction tuning

یادداشت‌های عملیاتی

برای CodeGemma، tuning فقط وقتی ارزش دارد که baseline، سنجه و داده‌ مرجع نوشته شده باشد.
قبل از هر adaptation باید latency، cost و rollback path را مشخص کنید.
اگر data governance مبهم است، retrieval یا orchestration معمولاً ریسک کمتری از training دارد.

مقایسه

چه زمانی CodeGemma را انتخاب کنیم؟

وقتی این مدل انتخاب خوبی است

footprint سبک‌تر می‌خواهید.
coding pilot محلی و باز می‌خواهید.

وقتی باید سراغ گزینه دیگر رفت

بالاترین capability coding لازم است.
repo-scale reasoning خیلی مهم است.

نقشه تصمیم

اگر هنوز بین این خانواده و گزینه‌های رقیب مردد هستید، از این trade-off path شروع کنید.

بلوک 1

code completion سبک، local experimentation، IDE prototype و تیم‌هایی که می‌خواهند code model باز را با footprint معقول‌تر امتحان کنند.

بلوک 2

local-friendly

بلوک 3

برای repo-scale reasoning یا tool-use پیچیده باید آن را با DeepSeek Coder، Qwen Coder و GPT benchmark کنید.

DeepSeek Coder

چه زمانی CodeGemma بهتر است

برای pilot سبک‌تر مناسب‌تر است.

چه زمانی گزینه مقابل بهتر است

برای capability بالاتر روی coding، DeepSeek Coder می‌تواند بهتر باشد.

Qwen Coder

چه زمانی CodeGemma بهتر است

اگر Gemma stack برایتان آشناتر است.

چه زمانی گزینه مقابل بهتر است

Qwen Coder می‌تواند روی بعضی benchmarkها برتری داشته باشد.

خانواده GPT

چه زمانی CodeGemma بهتر است

برای open local experimentation مناسب‌تر است.

چه زمانی گزینه مقابل بهتر است

برای آماده‌بودن API و tool-use، GPT ساده‌تر است.

ارزیابی

Checklist ارزیابی

مرحله 1

completion quality

مرحله 2

edit accuracy

مرحله 3

latency on local hardware

مرحله 4

context sensitivity

منابع رسمی

منابع رسمی و مسیر مطالعه بیشتر

CodeGemma model card

https://huggingface.co/google/codegemma-7b