این setup guide بهجای کلیگویی، مسیر عملی روشن برای راهاندازی خانواده GPT و gpt-oss را نشان میدهد: انتخاب route، نصب dependency، تست اولین درخواست و آمادهسازی برای rollout محدود.
این آموزش برای چیست؟
هدف این راهنما این است که خانواده GPT و gpt-oss را بهصورت درست و repeatable راهاندازی کنید؛ نه اینکه صرفاً یک درخواست آزمایشی بفرستید و بعد وارد production شوید.
پیشنیازها
- دسترسی به route مناسب: API یا self-host
- secret management یا دسترسی به مدل/weightها
- نمونه ورودی واقعی برای smoke test
- فهرست روشن از محدودیتهای محیط اجرا
مرحله 1: route مناسب را انتخاب کنید
مسیر اصلی برای مدلهای hosted، Responses API است. این مسیر روی Linux، Windows و macOS بهخاطر SDK و REST تقریباً بدون اصطکاک کار میکند و برای agentها، ابزارها و pipelineهای سازمانی سریعترین راه ورود به production است. GPT-5.1 بهصورت self-hosted عرضه نمیشود. اگر اجرای محلی برای شما مهم است، باید از شاخه open-weight یعنی gpt-oss-20b یا gpt-oss-120b استفاده کنید. OpenAI در مستندات این شاخه را برای use caseهای local و specialized معرفی کرده و مدل 120B را مناسب یک H100 واحد میداند.
مرحله 2: dependencyها و محیط اجرا را آماده کنید
برای API route، نصب SDK و مدیریت secretها کافی است. برای local route باید branch gpt-oss را از Hugging Face دریافت کنید و از همان ابتدا درباره hardware، quantization و سروینگ تصمیم بگیرید.
نصب وابستگی اصلی
ثبت secret یا weight
تعریف smoke test کوتاهروی Linux، Windows و macOS مسیر API تقریباً یکسان است. در production self-host، Linux انتخاب اصلی است؛ Windows و macOS بیشتر برای توسعه سبک یا مصرف API مناسباند.
مرحله 3: اولین request یا اولین inference را اجرا کنید
در این نقطه فقط باید مطمئن شوید chain اصلی کار میکند؛ هنوز وارد tuning و rollout نشدهاید. smoke test شما باید روی همان route اصلی Responses API / self-host اجرا شود و با یک ورودی کوتاه، پاسخ قابلparse و قابلردیابی برگرداند.
اگر خانواده GPT و gpt-oss را در مسیر self-host اجرا میکنید، همین مرحله جای بررسی device map، حافظه و load اولیه است. اگر hosted route دارید، همینجا latency، parse rate و ثبت request ID را کنترل کنید.
مرحله 4: secret، logging و versioning را ببندید
اگر خانواده GPT و gpt-oss را بدون secret hygiene، log مناسب و ثبت نسخه model/prompt وارد workflow کنید، چند روز بعد حتی نمیدانید کدام تغییر باعث drift شده است.
نمونه input
یک درخواست واقعی کوتاه که از همان دامنه هدف شما میآید و smoke test را از حالت نمایشی بیرون میآورد.
نمونه output
پاسخی کوتاه، قابلخواندن و قابلردیابی که نشان دهد route انتخابی سالم است و output contract میتواند در کد شما parse شود.
خطاها و محدودیتها
- شروع با model یا branchی که با بودجه و latency شما همخوان نیست
- نداشتن تفکیک بین prototype environment و rollout environment
- بیتوجهی به Linux/Windows/macOS path و تفاوت نیاز production با توسعه
- راهاندازی بدون ثبت نسخه مدل، SDK و promptها
نتیجه نهایی
در پایان این راهنما باید یک setup repeatable برای خانواده GPT و gpt-oss داشته باشید که روی محیط موردنظر شما بالا میآید و آماده evaluation محدود است.
قدم بعدی
پس از setup، فوراً یک eval set کوچک بسازید و قبل از وصل شدن به سیستمهای اصلی، سه سناریوی واقعی را با این محیط جدید اجرا کنید.
