TL;DR
- در MLflow 3.
- ما مفهوم ارزیابی را معرفی کردیم،.
- که ارزیابی کیفیت و حاشیه نویسی ردیابی است که برای درک و بهبود برنامههای هوش مصنوعی شما.
چه اتفاقی افتاد
در MLflow 3. 2،.
ما مفهوم ارزیابی را معرفی کردیم،. که ارزیابی کیفیت و حاشیه نویسی ردیابی است که برای درک و بهبود برنامههای هوش مصنوعی شما.
بسیار مهم است. با بهروزرسانی MLflow 3.
3،. ما تعدادی تغییرات در رابط کاربری ایجاد کرده ایم تا تجسم و مدیریت ارزیابیهای شما را آسانتر کنیم تا.
از گردش کار ارزیابی GenAI بهتر پشتیبانی کنیم. چه جدید است:.
طراحی اولین ارزیابی برای ردیابی رابطهای کاربری رابطهای کاربری ردیابی مجدداً طراحی شدهاند،. ارزیابیها را در خط مقدم قرار داده و ایجاد،.
مشاهده و مدیریت ارزیابیها را در کل چرخه عمر برنامهتان آسانتر از همیشه میکند. ویژگیهای کلیدی 1.
Trace viewer: پشتیبانی از عملیات CRUD (منتشر شده در MLflow 3. 2) نمایشگر ردیابی اکنون شامل یک پانل جانبی برای مدیریت ارزیابیها بهطور مستقیم از UI است:.
ارزیابیها را مستقیماً در نمای جزئیات ردیابی ایجاد کنید تمام ارزیابیهای مرتبط با یک ردیابی را. در یک نگاه بخوانید و مرور کنید ارزیابیهای موجود را برای اصلاح ارزیابیها یا تصحیح اشتباهات.
به روز کنید وقتی ارزیابیها دیگر مرتبط نیستند،. آنها را حذف کنید این رویکرد پانل جانبی به شما امکان میدهد به راحتی حاشیهنویسیهای ردیابی موقت ایجاد.
کنید،. و همچنین ارزیابیهایی را که توسط سایر کاربران یا داوران LLM ایجاد شدهاند،.
بررسی و تصحیح کنید. برگه Traces Redesigned (منتشر شده در MLflow 3.
3). برگه Traces در آزمایشهای MLflow بهروزرسانی شده است تا ارزیابیها را در سطح بالا تجسم کند،.
و تشخیص الگوها،. شناسایی نقاط پرت و نظارت بر روندهای کیفیت را بدون فرو رفتن در ردیابیهای فردی آسانتر میکند.
ستونهای ارزیابی که معیارهای ارزیابی کلیدی را مستقیماً در فهرست ردیابی نشان میدهند شاخصهای بصری برای وضعیت. ارزیابی و نمرات کیفیت فیلتر کردن و مرتبسازی بر اساس مقادیر ارزیابی،.
محدوده تاریخ و ویژگیهای بیشتر با ارزیابیهایی که اکنون بهطور برجسته در برگه Traces نمایش داده می. شوند،.
نظارت بر تولید بهطور قابل توجهی موثرتر میشود. میتوانید به سرعت ردیابیهایی را با امتیازهای کیفیت پایین شناسایی کنید و مشکلات سیستماتیکی را که بر پاسخهای.
برنامهتان تأثیر میگذارند،. شناسایی کنید.
شروع به کار ویژگیهای ارزیابی جدید در MLflow 3. 3 در دسترس خواهند بود، و اگر میخواهید یک پیشنمایش اولیه داشته باشید، میتوانید کاندید انتشار MLflow 3.
0rc0 را نصب کنید. اگر قبلاً از قابلیتهای ردیابی MLflow استفاده میکنید،.
رابط کاربری پیشرفته بهطور خودکار ارزیابیهای موجود را که ثبت کرده اید نمایش میدهد. برای شروع استفاده از این قابلیتهای جدید: به MLflow 3.
3 ارتقا دهید و در آزمایشات خود به برگه Traces پیشرفته دسترسی پیدا کنید نمایشگر ردیابی را با. کلیک بر روی هر اثری در نمای جزئیات ردیابی باز کنید اولین ارزیابی خود را با استفاده از.
پنل ارزیابی ایجاد کنید،. بدون نیاز به کد!
برای آموزشهای عمیقتر در مورد ارزیابیهای اجرا با داوران LLM و گلزنان سفارشی،. راهنمای شروع سریع را بررسی کنید!
درباره ارزیابی و قابلیتهای نظارت MLflow در مستندات بیشتر بیاموزید،. یا مخزن MLflow GitHub را کاوش کنید تا ببینید آینده چه خواهد شد.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
