TL;DR
- بازگشت به داستانهای مشتری 13 نوامبر 2025 • 5 دقیقه خواندناین پست در ارتباط با تیم Decagon.
- نوشته شده است.
- Decagon یک پلت فرم یکپارچه برای ساخت،.
چه اتفاقی افتاد
بازگشت به داستانهای مشتری 13 نوامبر 2025 • 5 دقیقه خواندناین پست در ارتباط با تیم Decagon. نوشته شده است.
Decagon یک پلت فرم یکپارچه برای ساخت،. بهینهسازی و مقیاس بندی عوامل هوش مصنوعی ارائه میدهد که تجربیات مشتری در سطح دربان را.
در هر کانال ارائه میدهد. در اوایل سال جاری،.
آنها صدای Decagon را راهاندازی کردند و تیمها را قادر میسازد تا عوامل هوش مصنوعی صوتی سریع و. هوشمند متناسب با لحن،.
شخصیت و نیازهای عملکرد هر برند بسازند. Voice یکی از سختترین مرزهای فنی در هوش مصنوعی است.
این نیاز به تأخیر فرعی، چرخش طبیعی و پاسخگویی یکپارچه دارد، همگی با حفظ کیفیت مکالمه. برآورده شدن این محدودیتها در تولید و در مقیاس عظیم،.
نیازمند پیشرفتهایی در دقت مدل و عملکرد استنتاج است. برای امکانپذیر ساختن آن،.
تیمهای Decagon و Modal در دو جبهه همکاری نزدیک داشتند:. بهبود دقت مدل:.
استفاده از نظارت پیشرفته این تیم با تکنیکهای تنظیم دقیق (SFT) و یادگیری تقویتی (RL)،. مجموعهای از مدلهای متن باز فشرده را آموزش دادند که دقت و کیفیت پاسخگویی را ارائه میدهند -.
در حالی که برای تعاملات صوتی در زمان واقعی به اندازه کافی کارآمد باقی میمانند. دستیابی به استنتاج بلادرنگ:.
آنها سپس آن را با استنتاج بلادرنگ با مدلهای پیشنویس سفارشی و بهینهسازیهای عمیق در سطح موتور از. تیم تخصصی استنتاج LLM Modal جفت کردند.
Decagon Voice 2. 0 اکنون با کاهش 65 درصدی تأخیر همراه با دستاوردهای قابل توجهی در تشخیص هدف و کیفیت پاسخ،.
استاندارد جدیدی برای آنچه در تعاملات هوش مصنوعی صوتی امکان پذیر است را ایجاد میکند. بخش 1:.
بهبود تعمیم مدل از طریق داده،. SFT و RL ایجاد یک تجربه صوتی با تأخیر کم نیاز به استفاده از مدلهای پارامتر کوچکتر بدون.
به خطر انداختن دقت کلی مدل دارد. آزمایشهای اولیه مدل کوچک در تعمیم متوقف شد:.
دقت نبود انتقال موثر به دامنههای جدید برای غلبه بر این مانع،. تیم ترکیبی از روشهای پیشرفته را در طرحهای آموزشی آمادهسازی داده،.
تنظیم دقیق نظارت شده (SFT) و یادگیری تقویتی (RL) به کار برد. در زمینه داده، دکاگون بر ایجاد تنوع و استحکام تمرکز داشت.
آنها یک مجموعه داده گسترده و افزوده ایجاد کردند که چندین عمودی،. لحن مکالمه و انواع هدف را در بر میگرفت تا بیش از حد برازش را کاهش دهند.
و انتقال بین دامنه را بهبود بخشند. در SFT،.
آنها یادگیری برنامه درسی را برای ساختار پیشرفت آموزش و تنظیم دقیق ترکیبی هدف برای حفظ توانایی پیروی. از دستورالعمل مدل بررسی کردند.
پیشرفت نهایی زمانی حاصل شد که تکنیکهای یادگیری تقویتی برای اصلاح رفتار مدل به کار گرفته شد. با ترکیب این رویکردها،.
این تیم از عملکرد اولیه مدلهای بزرگتر و پیشرفتهتر با مدلهای بسیار کوچکتر پیشی گرفت. مدل تنظیم شده راهحلهای آموزشی Modal این فرآیند را بدون اصطکاک انجام داد.
مهندسان با ارائه جاروهای همزمان با GPU بالا،. حجمهای پایدار و ابزارهای مشاهده پذیری،.
به راحتی میتوانند اجراهای تنظیم دقیق را بدون نگرانی در مورد هماهنگی خوشهای یا لوله کشی. ذخیره سازی راه اندازی،.
نظارت و مقایسه کنند. این امر توانایی دکاگون را برای آموزش و تکرار بر روی مجموعهای از مدلها تسریع میکند که بهطور.
موثر در میان مکالمات مشتری تعمیم مییابند. بخش 2:.
دستیابی به عملکرد همزمان با مدلهای پیشنویس سفارشی و مهندسی زمان اجرا مکالمات هوش مصنوعی صوتی به پاسخهای. زیر ثانیهای نیاز دارد تا طبیعی باشد.
برای رسیدن به آن نوار، Decagon به چیزی بیش از یک مدل هدف دقیق نیاز داشت. آنها به یک خط لوله استنتاج بهینه شده برای سرعت نیاز داشتند.
تیم استنباط Modal در دو جنبه مشارکت داشت:. آموزش یک مدل پیش نویس تخصصی و مهندسی مجدد موتور سرویس.
آموزش یک سفته باز سفارشی رمزگشایی گمانه زنی یک است تکنیکی که استنتاج را با جفت کردن یک. مدل هدف با یک «مدتگیر» (یا مدل پیشنویس) کوچکتر تسریع میکند.
مدل پیش نویس به سرعت توکنهای نامزد را پیشنهاد میکند و مدل هدف آنها را تأیید. میکند.
هنگامیکه بسیاری از این پیشنهادات پذیرفته میشوند،. سیستم به جلو میرود و زمان تولید را بهطور چشمگیری کاهش میدهد.
مدلهای پیشنویس EAGLE3 زمانی که با مدل هدف Decagon جفت شدند، طول پذیرش محدودی را نشان دادند. برای رفع این مشکل،.
تیم Modal SpecForge را فورک کرد و یک خط لوله آموزشی سفارشی برای مدلهای پیشنویس EAGLE3 ساخت -. ابتدا پیشآموزش روی دادههای مکالمه گسترده،.
سپس تنظیم دقیق با استفاده از مجموعه داده دامنه Decagon. مدل پیشنویس بهدستآمده 38 درصد طول پذیرش بالاتری نسبت به خطوط پایه منبعباز به دست آورد،.
که جهشی بزرگ در کارایی استنتاج ایجاد کرد. مهندسی مجدد SGLang برای زمان واقعی در حالی که مدل پیش نویس سفارشی سرعت قابل توجهی را ارائه.
میدهد،. میتوان دستاوردهای عملکرد بیشتری را در زمان اجرا باز کرد.
لایه. با کاوش در SGLang - موتور استنتاج منبعباز که برای ارائه مدلها استفاده میشود -.
Modal برخی فرصتهای بهینهسازی را کشف کرد که در نهایت استنتاج بلادرنگ را امکان پذیر کرد. طراحی همزمان SGLang دو گلوگاه اصلی را معرفی کرد:.
توقف CPU در مسیر بحرانی که محدودیت استفاده از GPU را دارد. هیچ زمانبندی ناهمگام برای رمزگشایی گمانهزنی با تأخیر کم.
برای غلبه بر این محدودیتها، تیم یک زمانبندی ناهمزمان جدید برای رمزگشایی گمانهزنی ساخت. این امر ناکارآمدیهای سمت میزبان را حذف کرد،.
هستههای GPU را قادر ساخت به صورت موازی و نه سریالی اجرا شوند و SGLang را بهطور. مؤثری برای رمزگشایی حدسی بدون همگام سازی کرد.
این تغییرات زمان بیکاری پردازندههای گرافیکی H200 را بهطور کامل حذف کرد و توان عملیاتی را تا. 12 درصد بهبود بخشید.
بهبودها در حال حاضر در این روابط عمومیبه SGLang منتقل شده اند. Decagon توانست به تأخیر p90 برابر با 342 میلیثانیه دست یابد که بسیار کمتر از محدوده زیر ثانیه.
مورد نیاز برای مکالمات طبیعی مشتری - ارائه سرعت،. کارایی و قابلیت اطمینان در مقیاس ی.
آنچه بعدی برای هوش مصنوعی صوتی بلادرنگ Decagon و Modal Building در مقیاس بزرگ است،. یکی از سختترین چالشهای زیرساختی است که الزامات آموزش مدلهای بزرگ را با محدودیتهای تأخیر سیستمهای تعاملی ترکیب.
میکند. Decagon و Modal با هم مرزها را در هر دو جبهه جابجا کردند و تکنیکهای یادگیری تقویتی و.
تنظیم دقیق پیشرفته را با بهینهسازیهای عمیق زمان اجرا جفت کردند. زیرساخت Modal به این پیشرفت کمک کرد و Decagon را قادر میسازد تا مدلهای توانمندتر را آموزش دهد.
و در عین حال بهطور یکپارچه مقیاسبندی کند تا با ترافیک رو به رشد روبرو شود. همانطور که پلتفرم Decagon به تکامل خود ادامه میدهد،.
سیستمهای Modal به پشتیبانی از نسل بعدی تجربیات هوش مصنوعی همزمان ادامه میدهند - آموزش مدلهای بیشتر،. ارائه سریعتر آنها و کمک به شکلدهی آینده هوش مکالمه.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
