TL;DR
- در بیشتر سال 2025، مسابقه هوش مصنوعی در مورد هوش مدل بود.
- در سه ماه گذشته، رقابت تغییر کرده است.
- هوشمندی مدل هنوز حیاتی است،.
چه اتفاقی افتاد
در بیشتر سال 2025، مسابقه هوش مصنوعی در مورد هوش مدل بود. در سه ماه گذشته، رقابت تغییر کرده است.
هوشمندی مدل هنوز حیاتی است،. اما در هر آزمایشگاه بزرگ مرزی،.
سرعت استنتاج به یک تمرکز جدید و فوری تبدیل شده است:. گوگل از Gemini 3 Flash رونمایی کرد.
این نسخه برای کدنویسی عاملی ساخته شده است و 3 برابر سریعتر از Gemini 3 Pro اجرا می. شود.
Anthropic نسخه 2. 5 برابر سریعتر Claude Opus 4.
6 را برای موارد استفاده از کدنویسی حساس به سرعت منتشر کرد. OpenAI از همکاری با Cerebras برای انتشار GPT-5.
3-Codex-Spark خبر داد که با سرعتی بیش از 1 مدل Open/00 در حال اجرا است. date.
چرا سرعت استنتاج ناگهان اینقدر مهم شده است؟ از آنجایی که نرخی که یک مدل با آن توکن تولید میکند،.
اکنون مستقیماً بر نرخ تکرار مدل برای آزمایشگاههای اصلی و نرخ ساخت نرمافزار برای اقتصاد گستردهتر تأثیر میگذارد. در ماه فوریه، OpenAI و Anthropic هر دو فاش کردند که اکنون از نرمافزار خود استفاده میکنند.
مدلهای کدگذاری برای ساخت نسخههای بعدی مدلهای هوش مصنوعی خود. این یک افشای فوق العاده است.
در پست وبلاگ OpenAI "Harness Engineering"، آنها مینویسند: GPT‑5. 3‑Codex اولین مدل ما است که در ایجاد خود نقش داشت.
تیم Codex از نسخههای اولیه برای اشکالزدایی آموزش خود،. مدیریت استقرار خود،.
و تشخیص نتایج آزمایش و ارزیابیها استفاده میکرد - تیم ما از میزان توانایی Codex برای سرعت بخشیدن. به توسعه خود غافلگیر شد.
این پست تیمیمتشکل از سه مهندس را توصیف میکند که از Codex برای تولید یک میلیون خط. کد تولید در پنج ماه استفاده کردند - ساخت محصول تقریباً یک دهم زمان طول کشید.
انسانها هرگز یک خط کد را به صورت دستی ننوشتند. آنها عامل را تشویق کردند، درخواستهای کشش آن را بررسی کردند و موانع را برطرف کردند.
همانطور که OpenAI میگوید: "انسانها هدایت میکنند. ماموران اعدام میکنند.
" داستان Anthropic نیز مشابه است. زمانی که آنها نسخه 2.
5 برابر سریعتر را منتشر کردند از Claude Opus 4. 6، آنها اذعان کردند که این سرعتی بود که قبلاً در داخل از آن استفاده میکردند.
بوریس چرنی،. رئیس کلود کد در آنتروپیک،.
علناً اعلام کرده است که 100 ٪ کد او بیش از دو ماه است که با هوش مصنوعی. نوشته شده است،.
و تقریباً 90 ٪ از پایگاه کد خود کلود کد توسط خود کلود کد نوشته شده است. بهطور خلاصه،.
آنتروپیک از ابزارهای کدگذاری خود برای ساخت محصولات بعدی خود استفاده میکرد و تا همین اواخر،. آنها سریعترین نسخههای مدلهای خود را برای خود رزرو میکردند.
پیامدها هم عمیق و هم واضح هستند - لحظه بازگشتی در توسعه نرمافزار فرا رسیده است،. و وقتی نوبت به استنتاج میرسد،.
هرچه خروجی توکن شما سریعتر باشد،. سریعتر میتوانید محصول بعدی خود را ارسال کنید.
هر آزمایشگاهی در حال مسابقه دادن است تا مدلی توانمندتر بسازد. قبلاً هر کسی که بزرگترین کلاس آموزشی را داشت، اول به آنجا میرسید.
در حال حاضر،. همه چیز برابر است،.
هر کسی که از سریعترین استنتاج در طول مدل استفاده کند توسعه ابتدا از خط پایان عبور می. کند.
سرعت استنتاج در حال حاضر در مسیری حیاتی برای توسعه مدل مرزی بعدی قرار دارد،. و در نتیجه،.
AGI. اگر استنتاج سریع واقعاً این مهم باشد، باید بسیار ارزشمند باشد.
یکی از راههای تأیید این موضوع این است که ببینیم آنتروپیک چگونه مدلهایش را نسبت به هوشمندی و. سرعت قیمتگذاری میکند.
کلود API Token Pricing آنتروپیک مدل پرچمدار Opus 4. 6 با قیمت 66 درصد نسبت به مدل رده متوسط Sonnet 4.
6 خود قیمت دارد. در همین حال Opus 4.
6 Fast که 2. 5 برابر سریعتر اجرا میشود، 6 برابر بیشتر از مدل پایه قیمت دارد.
قیمت گذاری Anthropic این ایده را تایید میکند که سرعت اکنون به اندازه کافی مهم است که. دسته بندی خود را تضمین کند،.
و از نظر ارزش،. شاید حتی ارزشمندتر از یک پله ارتقاء در هوشمندی مدل باشد.
استنتاج سریع زمان را برای درآمد تسریع میکند سرعت استنتاج فقط برای OpenAI و Anthropic استراتژیک نیست. برای هر ساختمان شرکتی استراتژیک است و ارسال محصولات نرم افزاری.
دو شرکت - شرکت A و شرکت B - را در نظر بگیرید که هر دو یک CRM. جدید مبتنی بر هوش مصنوعی میسازند.
شرکت A از یک مدل مرزی پیشرو استفاده میکند و توسعه را در شش هفته به پایان. میرساند.
شرکت B نیز ایده، استعداد تیم و بودجه یکسانی دارد. اما از یک مدل مرزی استفاده میکند که استنتاج سریع را اجرا میکند و اولین نسخه.
را تنها در 3 هفته ارسال میکند. در هفتههای بعدی، شرکت B به سرعت بر اساس بازخورد کاربران تکرار میشود.
نسخه 3 محصول به صورت ویروسی منتشر میشود و تا هفته 8 به 10 میلیون دلار در. ARR میرسد.
در همین حال، شرکت A هنوز از اولین عرضه محصول خود یاد میگیرد. استنتاج سریع در این مورد مستقیماً تکرار محصول و زمان رسیدن به درآمد را تسریع میکند.
مثال بالا ممکن است کمیخارقالعاده به نظر برسد، اما در حال حاضر در اقتصاد واقعی اتفاق میافتد. در نامه سالانه Stripe در سال 2025،.
شرکت پرداخت فاش کرد که تعداد شرکتهایی که در عرض 3 ماه پس از راهاندازی به 10 میلیون. دلار رسیدهاند نسبت به سال 2024 دو برابر شده است.
این تقریباً بهطور قطع ناشی از پذیرش فزاینده کدگذاری عاملی است. ما انتظار داریم که سال 2026 شتاب چشمگیرتری را شاهد باشیم زیرا توسعه دهندگان از عوامل کدنویسی قدرتمندتری.
استفاده میکنند که با سرعتی بالاتر از 2025 کار میکنند. الگوی نشان داده شده در بالا نه تنها در مورد استارت آپها بلکه در مورد شرکتها.
نیز صادق است. ژانویه 2026 حسابرسی برای شرکتهای SaaS در هر مرحله و اندازهای بود.
تیمها در حال تلاش برای بازسازی پشته محصول و مدل درآمدی خود هستند. کسانی که سریعترین و تواناترین عاملهای کدنویسی را دارند،.
احتمالاً جای خود را در اقتصاد پس از عامل پیدا میکنند. سرعت همیشه محرک اقتصاد دیجیتال بوده است.
در دهه 1990، شرکتها سریعترین رایانههایی را که میتوانستند خریداری کردند. در دهه 2000، آنها برای ایمن سازی سریعترین اتصالات اینترنتی رقابت کردند.
در عصر هوش مصنوعی، استنتاج با سرعت بالا زیرساخت حیاتی است. Cerebras از روز اول روی سرعت تمرکز کرده است.
با نگاهی به خط سیر صنعت - مدلهای ساخت مدلها،. عوامل کدگذاری جایگزین توسعه دستی،.
و سرعت ورود به بازار که تابعی از بازده توکن است - واضح است که سرعت در آینده. اهمیت بیشتری خواهد داشت.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
