TL;DR
- ما در حال حاضر در حال تغییر از استفاده از مدلهایی هستیم که در وظایف خاص برتری دارند،.
- به استفاده از عواملی که قادر به مدیریت گردشهای کاری پیچیده هستند.
- با ارائه مدلها، فقط میتوانید به هوش آموزش دیده دسترسی داشته باشید.
چه اتفاقی افتاد
ما در حال حاضر در حال تغییر از استفاده از مدلهایی هستیم که در وظایف خاص برتری دارند،. به استفاده از عواملی که قادر به مدیریت گردشهای کاری پیچیده هستند.
با ارائه مدلها، فقط میتوانید به هوش آموزش دیده دسترسی داشته باشید. با این حال،.
با دادن یک محیط کامپیوتری به مدل میتوان به طیف وسیعتری از موارد استفاده،. مانند اجرای سرویسها،.
درخواست دادهها از APIها،. یا تولید مصنوعات مفیدتر مانند صفحات گسترده یا گزارشها دست یافت.
هنگامیکه سعی میکنید عاملها را بسازید،. چند مشکل عملی ظاهر میشوند:.
کجا فایلهای میانی را قرار دهید،. چگونه از چسباندن جداول بزرگ در یک اعلان اجتناب کنید،.
چگونه به گردش کار بدون ایجاد زمان دسترسی به شبکههای دستی و نحوه دسترسی به هدآوت شبکه،. و نحوه دسترسی به شبکه هدآوت بدون ساختن یک صفحهنمایش،.
چند مشکل عملی به وجود میآید. سیستم گردش کار خودتان.
به جای اینکه آن را بر روی توسعه دهندگان قرار دهیم تا محیطهای اجرایی خود را بسازند،. ما اجزای لازم را برای تجهیز Responses API (در یک پنجره جدید باز میشود) با رایانه ساختیم.
محیطی برای اجرای مطمئن وظایف دنیای واقعی. API Responses OpenAI،.
همراه با ابزار پوسته و فضای کاری کانتینر میزبان،. برای رسیدگی به این مشکلات عملی طراحی شده است.
مدل مراحل و دستورات را پیشنهاد میکند. پلتفرم آنها را در یک محیط ایزوله با یک سیستم فایل برای ورودی و خروجی،.
ذخیره سازی ساختار یافته اختیاری (مانند SQLite) و دسترسی محدود به شبکه اجرا میکند. در این پست،.
نحوه ایجاد یک محیط کامپیوتری برای عوامل را شرح میدهیم و چند درس اولیه در مورد نحوه استفاده. از آن برای جریانهای کاری تولید سریعتر،.
تکرارپذیرتر و ایمنتر را به اشتراک میگذاریم. یک گردش کار عامل خوب با یک حلقه اجرای فشرده شروع میشود:.
مدل اقدامیمانند خواندن فایلها یا واکشی دادهها با API را پیشنهاد میکند،. پلتفرم آن را اجرا میکند،.
و مرحله بعدی وارد میشود. ما با ابزار پوسته شروع میکنیم - سادهترین راه برای دیدن این حلقه در عمل -.
و سپس فضای کاری کانتینر،. شبکه،.
مهارتهای قابل استفاده مجدد و فشردهسازی زمینه. برای درک ابزار پوسته،.
ابتدا درک اینکه چگونه یک مدل زبان از ابزارها بهطور کلی استفاده میکند مفید است:. برای انجام کارهایی مانند فراخوانی یک تابع یا تعامل با رایانه.
در طول آموزش،. یک مدل نمونههایی از نحوه استفاده از ابزارها و اثرات حاصله به صورت گام به گام نشان.
داده میشود. این به مدل کمک میکند تا تصمیم بگیرد که چه زمانی از یک ابزار و نحوه استفاده.
از آن استفاده کند. وقتی میگوییم "استفاده از ابزار"،.
منظور ما این است که مدل در واقع فقط یک فراخوانی ابزار را پیشنهاد میکند. این ابزار به تنهایی نمیتواند تماس را اجرا کند.
ابزار پوسته مدل را به طرز چشمگیری قدرتمندتر میکند:. از طریق خط فرمان با رایانه تعامل میکند تا طیف وسیعی از وظایف را انجام دهد،.
از جستجوی متن گرفته تا ارسال درخواستهای API در رایانه شما. ابزار پوسته ما که بر اساس ابزار آشنای یونیکس ساخته شده است،.
با ابزارهایی مانند grep،. curl،.
و awk میتواند هر کاری را که انتظار دارید انجام دهد. در مقایسه با کد موجود ما.
مفسر،. که فقط پایتون را اجرا میکند،.
ابزار پوسته طیف وسیعتری از موارد استفاده را فعال میکند،. مانند اجرای برنامههای Go یا Java یا راه اندازی یک سرور NodeJS.
این انعطافپذیری به مدل اجازه میدهد وظایف پیچیده عاملی را انجام دهد. یک مدل به تنهایی میتواند دستورات پوسته را پیشنهاد کند، اما این دستورات چگونه اجرا میشوند؟
ما به یک ارکستراتور نیاز داریم تا خروجی مدل را دریافت کند،. ابزارها را فراخوانی کند و پاسخ ابزار را در یک حلقه به مدل برگرداند،.
تا زمانی که کار کامل شود. Responses API نحوه تعامل توسعه دهندگان با مدلهای OpenAI است.
هنگامیکه با ابزارهای سفارشی استفاده میشود،. Responses API کنترل را به کلاینت باز میگرداند و کلاینت برای اجرای ابزارها به مهار خود نیاز دارد.
با این حال، این API همچنین میتواند بین مدل و ابزارهای میزبانی خارج از جعبه هماهنگ کند. هنگامیکه Responses API یک درخواست دریافت میکند،.
زمینه مدل را جمع آوری میکند:. درخواست کاربر،.
وضعیت مکالمه قبلی و دستورالعملهای ابزار. برای پوسته برای اجرای کار،.
اعلان باید با استفاده از ابزار پوسته ذکر شود و مدل انتخاب شده باید برای پیشنهاد دستورات پوسته. آموزش ببیند—مدلهای GPT‑5.
2 به بعد برای این کار آموزش داده شدهاند. با تمام این زمینه، مدل سپس اقدام بعدی را تصمیم میگیرد.
اگر اجرای پوسته را انتخاب کند، یک یا چند دستور پوسته را به سرویس Responses API برمیگرداند. سرویس API آن دستورات را به زمان اجرا کانتینر ارسال میکند،.
خروجی پوسته را به عقب ارسال میکند و آن را در زمینه درخواست بعدی به مدل میدهد. سپس مدل میتواند نتایج را بررسی کند، دستورات پیگیری صادر کند یا پاسخ نهایی را ارائه دهد.
Responses API این حلقه را تکرار میکند تا زمانی که مدل یک تکمیل را بدون دستورات پوسته. اضافی برگرداند.
هنگامیکه Responses API یک فرمان پوسته را اجرا میکند،. یک اتصال جریان به سرویس کانتینر را حفظ میکند.
همانطور که خروجی تولید میشود،. API آن را در زمان واقعی به مدل رله میکند تا مدل بتواند تصمیم بگیرد آیا منتظر.
خروجی بیشتر باشیم،. دستور دیگری را اجرا کنیم یا به پاسخ نهایی برویم.
Responses API دستور خروجی پوسته را پخش میکند. هر جلسه خروجی را بهطور مستقل پخش میکند و API آن جریانها را بهعنوان متن به خروجیهای ابزار.
ساختاریافته بازمیگرداند. به عبارت دیگر،.
حلقه عامل میتواند کارهایی مانند جستجوی فایلها،. واکشی دادهها و اعتبارسنجی نتایج میانی را موازیسازی کند.
وقتی فرمان شامل عملیات فایل یا پردازش دادهها میشود،. خروجی پوسته میتواند بسیار بزرگ شود و بودجههای زمینه را بدون افزودن سیگنالهای مفید مصرف کند.
برای کنترل این امر، مدل برای هر فرمان یک سقف خروجی را مشخص میکند. API Responses آن سرپوش را اعمال میکند و یک نتیجه محدود را برمیگرداند که ابتدا و انتهای خروجی.
را حفظ میکند،. در حالی که علامتگذاری حذف شده است.
محتوا بهعنوان مثال،. ممکن است خروجی را به 1000 کاراکتر،.
با حفظ شروع و پایان:. متن در ابتدا .
1000 نویسه کوتاه شده . متن در پایان،.
با هم،. اجرای همزمان و خروجی محدود،.
حلقه عامل را سریع و کارآمد در زمینه ایجاد میکند،. بنابراین مدل میتواند استدلال را بر روی نتایج بالقوه اولیه مرتبط نگه دارد.
وظایف میتوانند برای مدت طولانی اجرا شوند. وظایف طولانی مدت پنجره زمینه را پر میکند،.
که برای ارائه زمینه در سراسر نوبتها و بین عوامل مهم است. نمایندهای را در حال فراخوانی یک مهارت،.
دریافت پاسخ،. افزودن تماسهای ابزار و خلاصههای استدلالی تصور کنید—پنجره زمینه محدود به سرعت پر میشود.
برای جلوگیری از از دست دادن زمینه مهم با ادامه کار عامل،. به راهی برای حفظ جزئیات کلیدی و حذف هر چیز اضافی نیاز داریم.
به جای اینکه توسعه دهندگان را ملزم به طراحی و سیستمهای خلاصهسازی سفارشی یا حمل حالت را حفظ. میکنیم،.
ما فشردهسازی بومیرا در پاسخهای API اضافه کردیم،. که برای هماهنگی با نحوه رفتار مدل و نحوه آموزش آن طراحی شده است.
جدیدترین مدلهای ما برای تجزیه و تحلیل وضعیت مکالمه قبلی و تولید یک مورد فشردهسازی آموزش داده شدهاند. که حالت قبلی کلید را در یک نمایش رمزگذاری شده کارآمد برای رمزگذاری حفظ میکند.
پس از فشرده سازی،. پنجره زمینه بعدی شامل این آیتم فشرده سازی و بخشهای با ارزش بالا از پنجره قبلی است.
این اجازه میدهد تا گردش کار بهطور منسجم در سراسر مرزهای پنجره ادامه یابد،. حتی در جلسات طولانی چند مرحلهای و ابزار محور.
Codex بر این مکانیسم تکیه میکند تا وظایف برنامهنویسی طولانیمدت و اجرای ابزار تکراری را بدون کاهش کیفیت. حفظ کند.
Compaction یا بهصورت داخلی روی سرور یا از طریق یک نقطه پایانی «/ فشرده» مستقل در دسترس است. فشرده سازی سمت سرور به شما امکان میدهد یک آستانه را پیکربندی کنید و سیستم کنترل می.
کند زمان بندی فشرده سازی به صورت خودکار،. نیاز به منطق پیچیده سمت مشتری را از بین میبرد.
این اجازه میدهد تا یک پنجره زمینه ورودی موثر کمیبزرگتر بتواند اضافههای کوچک را درست. قبل از فشرده سازی تحمل کند،.
بنابراین درخواستهای نزدیک به حد مجاز همچنان میتوانند پردازش و فشرده شوند تا رد شوند. همانطور که آموزش مدل تکامل مییابد،.
راهحل فشرده سازی بومیبا آن برای هر نسخه مدل OpenAI تکامل مییابد. Codex به ما کمک کرد تا سیستم تراکم را بسازیم در حالی که بهعنوان کاربر اولیه آن خدمت.
میکردیم. هنگامیکه یک نمونه Codex با خطای فشردهسازی مواجه شد، نمونه دوم را برای بررسی میچرخانیم.
نتیجه این بود که Codex تنها با کار بر روی مشکل،. یک سیستم فشرده سازی بومیو موثر را به دست آورد.
این توانایی Codex برای بازرسی و اصلاح خود به بخش جالبی از کار در OpenAI تبدیل شده است. بیشتر ابزارها فقط به کاربر نیاز دارند که نحوه استفاده از آنها را بیاموزد.
Codex در کنار ما یاد میگیرد. حال اجازه دهید وضعیت و را پوشش دهیم منابع کانتینر نه تنها مکانی برای اجرای دستورات بلکه زمینه.
کاری مدل نیز میباشد. در داخل کانتینر،.
مدل میتواند فایلها را بخواند،. پایگاههای داده پرس و جو کند و به سیستمهای خارجی تحت کنترلهای خطمشی شبکه دسترسی پیدا کند.
اولین بخش از زمینه کانتینر، سیستم فایل برای آپلود، دهی و مدیریت منابع است. ما APIهای Container و file (در یک پنجره جدید باز میشود) ساخته ایم تا به مدل نقشهای از.
دادههای موجود بدهیم و به آن کمک کنیم تا عملیات فایل هدفمند را بهجای انجام اسکنهای گسترده و. پر سر و صدا انتخاب کند.
یک ضد الگوی رایج این است که تمام ورودیها را مستقیماً در متن سریع قرار میدهد. همانطور که ورودیها رشد میکنند،.
پر کردن بیش از حد درخواست گران میشود و حرکت مدل برای مدل سخت میشود. الگوی بهتر این است که منابع را در سیستم فایل کانتینر مرحله بندی کنید و به مدل اجازه.
دهید تصمیم بگیرد که چه چیزی را با دستورات پوسته باز،. تجزیه یا تبدیل کند.
مدلها نیز مانند انسانها با اطلاعات یافته بهتر کار میکنند بخش دوم زمینه کانتینر پایگاههای داده است. در بسیاری از موارد،.
ما به توسعهدهندگان پیشنهاد میکنیم که دادههای ساختاریافته را بهعنوان SQLite در پایگاههای داده ذخیره کرده و آنها. را پرس و جو کنند.
بهعنوان مثال،. بهجای کپی کردن کل صفحهگسترده در فرمان،.
میتوانید به مدل توضیحی از جداول بدهید - ستونهایی که وجود دارند و به چه معنا هستند -. و اجازه دهید ردیفهای مورد نیاز خود را بکشد.
برای مثال،. اگر بپرسید،.
«کدام محصولات در این سهماهه فروش کاهش داشتهاند؟» مدل میتواند به جای اسکن کل صفحه گسترده،. فقط ردیفهای مربوطه را پرس و جو کند.
این سریعتر، ارزانتر و مقیاسپذیرتر به مجموعه دادههای بزرگتر است. بخش سوم زمینه کانتینر، دسترسی به شبکه است، که بخشی ضروری از بارهای کاری عامل است.
گردش کار نماینده ممکن است نیاز به واکشی دادههای زنده،. تماس با APIهای خارجی یا نصب بستهها داشته باشد.
در عین حال،. دادن دسترسی نامحدود به کانتینرها به اینترنت میتواند خطرناک باشد:.
میتواند اطلاعات را در معرض وب سایتهای خارجی قرار دهد،. بهطور ناخواسته حساس به لمس باشد.
سیستمهای داخلی یا شخص ثالث، یا محافظت در برابر نشت اعتبار و استخراج دادهها را سختتر میکنند. برای رفع این نگرانیها بدون محدود کردن سودمندی عوامل،.
کانتینرهای میزبانی را برای استفاده از پراکسی خروجی کناری ساخته ایم. تمام درخواستهای شبکه خروجی از طریق یک لایه خطمشی متمرکز جریان مییابند که لیستهای مجاز و کنترلهای دسترسی.
را اجرا میکند و در عین حال ترافیک را قابل مشاهده نگه میدارد. برای اعتبار، از تزریق مخفی دامنه دامنه در هنگام خروج استفاده میکنیم.
مدل و ظرف فقط نگهدارندهها را میبینند،. در حالی که مقادیر مخفی خام خارج از بافت قابل مشاهده مدل باقی میمانند و فقط برای مقصدهای.
تأیید شده اعمال میشوند. این امر خطر نشت را کاهش میدهد و در عین حال تماسهای خارجی تأیید شده را.
فعال میکند. دستورات شل قدرتمند هستند، اما بسیاری از وظایف همان الگوهای چند مرحلهای را تکرار میکنند.
Agentها باید گردش کار را در هر اجرا دوباره کشف کنند - برنامهریزی مجدد،. صدور مجدد دستورات،.
و قراردادهای یادگیری مجدد - که منجر به نتایج متناقض میشود. و اعدام بیهوده مهارتهای عامل (در یک پنجره جدید باز میشود) این الگوها را در بلوکهای ساختمانی قابل.
استفاده مجدد و ترکیبپذیر بستهبندی میکند. بهطور مشخص، یک مهارت یک بسته پوشه است که شامل «SKILL.
md(در یک پنجره جدید باز میشود)» (شامل فراداده و دستورالعملها) بهعلاوه هر گونه منبع پشتیبانی،. مانند مشخصات API و داراییهای UI است.
این ساختار بهطور طبیعی با معماری زمان اجرا که قبلاً توضیح دادیم نگاشت میشود. کانتینر فایلهای پایدار و زمینه اجرا را فراهم میکند و ابزار پوسته رابط اجرا را فراهم.
میکند. با وجود هر دو،.
مدل میتواند در صورت نیاز،. فایلهای مهارت را با استفاده از دستورات پوسته («ls»،.
«cat» و غیره) کشف کند،. دستورالعملها را تفسیر کند،.
و اسکریپتهای مهارت را در همان حلقه عامل اجرا کند. توسعهدهندگان پوشههای مهارت را بهعنوان بستههای نسخهشده آپلود و ذخیره میکنند،.
که بعداً میتوانند با شناسه مهارت بازیابی شوند. قبل از ارسال پاسخ به مدل،.
API پاسخها مهارت را بارگیری میکند و آن را در بافت مدل گنجانده است. این دنباله قطعی است: فراداده مهارت، از جمله نام و توضیحات را واکشی کنید.
بسته مهارت را واکشی کنید، آن را در ظرف کپی کنید، و آن را باز کنید. بافت مدل را با ابرداده مهارت و مسیر ظرف بهروزرسانی کنید.
وقتی تصمیم میگیرید که یک مهارت مرتبط است،. مدل به تدریج دستورالعملهای آن را بررسی میکند و دستورات آن را در اسکریپت از طریق cute اجرا.
میکند. با هم:.
Responses API هماهنگسازی را ارائه میکند،. ابزار پوسته اقدامات اجرایی را ارائه میکند،.
کانتینر میزبان،. زمینه زمان اجرا مداوم را ارائه میکند،.
منطق گردش کار قابل استفاده مجدد لایه مهارت،. و فشردهسازی به یک عامل اجازه میدهد تا برای مدت طولانی با زمینهای که نیاز دارد اجرا شود.
با این موارد اولیه،. یک اعلان میتواند به یک دادههای fell-to-end تبدیل شود،.
به یک کار محلی تبدیل شود. حالت ساخت یافته، آن را بهطور کارآمد جستجو کنید و مصنوعات بادوام تولید کنید.
نمودار زیر نشان میدهد که این سیستم چگونه برای ایجاد صفحهگسترده از دادههای زنده کار میکند. ما از دیدن آنچه که توسعهدهندگان با این مجموعه از اولیهها میسازند هیجانزده هستیم.
مدلهای زبان بیشتر از تولید متن،. تصویر و صدا انجام میدهند - ما به تکامل پلتفرم خود ادامه میدهیم تا در انجام کارهای پیچیده.
و دنیای واقعی در مقیاس توانمندتر شویم.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
