TL;DR
- کمتر طلا راش و کارخانه خستهکنندهتر – ذهنیت هوش مصنوعی در حال تکامل.
- قسمت اول از یک مجموعه ۳ قسمتی وقتی امروز مردم درباره استراتژی هوش مصنوعی صحبت میکنند،.
- شاهد مسابقهای به سوی پیشرفت بعدی هستیم – چه مدلها،.
چه اتفاقی افتاد
کمتر طلا راش و کارخانه خستهکنندهتر – ذهنیت هوش مصنوعی در حال تکامل. قسمت اول از یک مجموعه ۳ قسمتی وقتی امروز مردم درباره استراتژی هوش مصنوعی صحبت میکنند،.
شاهد مسابقهای به سوی پیشرفت بعدی هستیم – چه مدلها،. چه پیشرفتهای CPU-GPU،.
یا پلتفرمهای عامل. در یک ذهنیت عجله طلا، موفقیت به سرعت، شانس و اولین ورود به بازار است.
سریع پیش بروید و چیزها را خراب کنید. (1) طرز فکر کارخانهای از طریق فرآیند ارزش ایجاد میکند:.
گردشهای کاری قابل تکرار،. استانداردسازی ورودیها و خروجیها،.
کاهش عیوب،. و مقیاس دادن به آنچه کار میکند.
اما چگونه میتوانید یک "کارخانه" هوش مصنوعی بسازید وقتی که اجزا هنوز در حال کشف هستند؟ سیستمها چیست و چه چیزی باید خودکار شود؟
در یک سری سه قسمتی با عنوان «چگونه در مورد TCO برای هوش مصنوعی ی خود فکر کنید»،. در قسمت 1 به بررسی شباهتهای بین تولید و زیرساخت هوش مصنوعی میپردازیم و میپرسیم:.
«آیا درسهای رایج اعمال میشود؟» در قسمت 2،. سیگنالها را از نویز جدا میکنیم.
کدام پارامترها مهم هستند؟ در دنیای تاخیر، هزینه، سرعت، اندازه مدل، محل اقامت دادهها و امنیت، چند مورد برجسته هستند.
بخش 3 به دادههایی میپردازد که ملاحظات TCO را تعیین میکنند. آنچه که تولید درباره اتوماسیون آموختهاست وقتی کارخانهها برای اولین بار شروع به کار کردند و اتوماسیون برای.
وظایف به کار رفت،. درس ساده بود:.
شما فقط تجهیزات نمیخرید. شما بر اساس الزامات آن طراحی میکنید.
جوشکاری را بهعنوان مثال در نظر بگیرید. 3 راه برای اتصال فلز وجود دارد - یک فرد میتواند به صورت دستی یک قطعه را.
جوش دهد یا از ایستگاه جوشکاری CNC 200 هزار دلاری یا حتی یک سلول جوش رباتیک 2 میلیون. دلاری استفاده کند.
نتیجه یکسان است - قطعات فلز را به هم بپیوندید - واضح است که یک جمله تقلیل کننده. است،.
اما با این وجود صادق است. یکی برای سرعت،.
دقت و تولید بالا ساخته شده است،. دومیموارد کمتری را با حساسیت زمانی کمتر کنترل میکند،.
و سومیواحدهای صنایع دستی را یکی یکی میسازد،. که فرصت ایجاد یک نتیجه سفارشی را ارائه میدهد.
ابزار جوشکاری هزینه وقتی منطقی است حجم CNC متوسط حجم متوسط رباتیک بالا توان عملیاتی بالا سوال این. است - چه چیزی و چه زمانی استفاده شود؟
چگونه میتوانید نتیجه مورد نظر را با تجهیزات مناسب تطبیق دهید و سپس یک سیستم پشتیبانی ایجاد کنید. که همه چیز را مولد نگه میدارد – زیرا دیگر چگونه TCO و ROI را اندازهگیری میکنید،.
اگر از طریق بهرهوری و کارایی نباشد؟ هوش مصنوعی ی با همین وضعیت مواجه است.
متأسفانه، بسیاری از ها آن را به خوبی اجرا نمیکنند. استنباط هوش مصنوعی ی عزیز، آیا تجهیزات شما بهینهسازی شده است؟
آموزش هوش مصنوعی عموماً محاسباتی فشرده است و برای ساختن مدلی که بعداً میتواند برای استنتاج استفاده شود،. به حجم زیادی از داده نیاز دارد.
استنتاج هوش مصنوعی مرحله تولید مداومیاست که در آن مکالمات TCO شروع میشود. مدل آموزش دیده پاسخهایی را روی دادههای تجاری زنده ایجاد میکند و بهطور کلی برای.
تأخیر کم،. مقیاس پذیری و کارایی هزینه بهینه شده است.
برای بازگرداندن این موضوع به مدل کارخانه ما: استنتاج کاری است که میخواهیم به دست آوریم. انجام شد.
پشته هوش مصنوعی شما روی پردازندههای گرافیکی و پردازندههای مرکزی اجرا میشود – تجهیزات موجود در قیاس کارخانهای. ما از لحاظ تاریخی،.
خطوط ترسیم شده بین انتخاب پردازنده گرافیکی و پردازنده واضح و متمایز بودند. اما ما یک تصور غلط گسترده در شرکتها میبینیم که هوش مصنوعی برابر با GPU است.
- این یک اشتباه پرهزینه است. برای بسیاری از بارهای کاری استنتاج،.
به ویژه آنهایی که شامل RAG،. رباتهای گفتگو،.
بینایی کامپیوتر،. پیش پردازش دادهها،.
SLMها و VLMها هستند،. CPUها کارایی کافی را ارائه میدهند و بسیار مقرون به صرفه هستند.
علاوه بر این،. راهحل بسیار انعطاف پذیر است - آن هزینههای پشتیبانی مداوم را به خاطر دارید؟
در پردازش دادهها،. آموزش مدلسازی و استنتاج،.
بارهای کاری هوش مصنوعی تولیدی اغلب به استفاده پایدار زیر 50 درصد میرسند،. حتی تحت بار.
(البته،. این به شدت به حجم کاری وابسته است.) هزینههای پنهان در Plain Sight بسیاری ازها به.
دلیل طرز فکر «اول از فناوری» فلج میشوند و این میتواند به یک ذهنیت کسب GPU. برای حجم کاری هوش مصنوعی شما تبدیل شود.
نیاز دارد. بدتر از آن،.
ما قبلاً روی پردازندههای گرافیکی سرمایهگذاری کرده ایم،. بنابراین اکنون باید استفاده از آنها را بهینه کنیم.
معتبر است، اما آیا ملاحظه دیگری وجود دارد؟ به قیاس کارخانه خود برگردیم - آیا باید تمام نیازهای جوشکاری را از طریق دستگاه 2 میلیون دلاری.
"فقط به این دلیل که آن را خریدیم" هدایت کنیم؟ ما میبینیم که پردازندههای گرافیکی بارهای کاری را اجرا میکنند که نیازی به آنها ندارند،.
استفاده پراکنده،. سخت افزار بیکار و هزینههایی که با ارزش مطابقت ندارند.
در یک داستان غم انگیز از پشیمانی دنیای واقعی،. یک شرکت ژنومیک نیاز به کسب و کار هفت روزه SLA داشت.
آنها پردازندههای گرافیکی سطح بالا را مستقر کردند و نتایج خود را در کمتر از یک دقیقه به. دست آوردند.
همه بسیار تحت تأثیر قرار گرفتند تا اینکه کسی پرسید که آیا زمان تکمیل دو ساعته با استفاده. از CPU کافی است یا خیر.
انجام داد. GPUها از کار افتاده بودند.
این برای مکالمات TCO و ROI چگونه است؟ داستانهایی مانند این یک ناهنجاری نیستند.
آنها بیشتر از آنچه که ما بخواهیم بپذیریم به هنجار نزدیکتر هستند. معلوم میشود که محدودیت محاسبه نشده است.
این فقدان الف است سیستمیبرای تطبیق کار با تجهیزات مناسب. افزودن GPU فقط به خرید سخت افزار نیست.
همچنین در حال اضافه کردن TCO برای:. درایورها و نرمافزارهای جدید،.
حالتهای خرابی جدید،. مهارتهای تخصصی جدید،.
TCO را نیز اضافه میکند. مسیریابی محاسبات ناهمگن نسبت CPU به GPU شما را هدایت میکند برای شرکتها،.
Workload Placement هنر تطبیق تجهیزات با الزامات و نتایج است. پردازندههای Intel® دو نقش کلیدی در دنیای GPU-CPU ایفا میکنند: پردازندههای تولید انعطافپذیر برای استنباط با تأخیر.
ستون فقرات زیرساختی که خطوط لوله،. دستهها،.
دستهها و محصولات را بدون توجه به خط لولهها،. دستهبندیکنندهها و کنترلکنندهها را حفظ میکند.
اتفاق میافتد. شروع کنید با در نظر گرفتن اهداف استنتاج در طول استنتاج،.
کار GPU به ازای هر درخواست نسبتاً کوچک است (مخصوصاً با هستههای بهینهسازی شده،. کوانتیزهسازی و غیره)،.
اما وظایف CPU (جریان توکن،. ذخیرهسازی حافظه پنهان،.
مونتاژ سریع،. بازیابی،.
مسیریابی) بر بودجههای تأخیر غالب است. هماهنگسازی CPU اکنون یک عامل تعیینکننده قویتر برای توان استنتاج FL در بسیاری از موارد GPU خام است.
نیاز به CPU بالاتر در استنتاج در مقایسه با آموزش. سپس نگاه دقیقی به اینکه آیا و در کجا برای پشتیبانی از اهداف خود به GPU نیاز دارید،.
بیندازید. پردازندههای گرافیکی هزینه بالایی دارند،.
بنابراین اگر میخواهید برای آنها هزینه بپردازید،. نسبت CPU به GPU باید بر اساس حجم کار،.
تأخیر و توان عملیاتی بهینه شود. Takeaway Enterprise اگر استراتژی هوش مصنوعی شما با «خرید GPU» شروع میشود،.
قبل از درک کار،. «خط روباتیک» بسیار گران قیمتی را خریداری میکنید.
برای کارهایی که CPUهای فعلی شما میتوانند به خوبی از عهده آن برآیند،. قیمتهای ممتاز را پرداخت نکنید.
در عوض،. نسبت CPU به GPU بسازید که الگوهای محاسباتی ناهمگن و منحصربهفرد شما را ارائه میکند بعدی در قسمت.
2:. کدام بار کاری در CPUهای تجهیزات منعطف در مقابل پردازندههای گرافیکی پرسرعت به بهترین وجه ارائه میشود.
و چگونه این انتخابها میتوانند منحنی هزینه شما را تغییر دهند. در سایت شاخص عملکرد بیشتر بدانید.
نتایج عملکرد بر اساس آزمایش در تاریخهای نشاندادهشده در پیکربندیها است و ممکن است همه بهروزرسانیهای در دسترس. عموم را منعکس نکند.
برای جزئیات پیکربندی به نسخه پشتیبان مراجعه کنید. هیچ محصول یا مؤلفهای نمیتواند کاملاً ایمن باشد.
هزینهها و نتایج شما ممکن است متفاوت باشد. فناوریهای Intel ممکن است به فعالسازی سختافزار، نرمافزار یا خدمات فعال نیاز داشته باشند.
© Intel Corporation. اینتل، لوگوی اینتل و سایر علائم اینتل علائم تجاری Intel Corporation یا شرکتهای تابعه آن هستند.
نامها و مارکهای دیگر ممکن است بهعنوان دارایی دیگران ادعا شود.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
