AMD رسما Instinct MI350P را منتشر کرده است، یک شتاب دهنده جدید PCIe که برای کاربران سازمانی طراحی شده است که به دنبال استنتاج هوش مصنوعی داخلی بدون تعمیرات اساسی در زیرساخت مرکز داده فعلی خود هستند. این کارت گرافیک دارای دو اسلات، تمام قد و فرم فاکتور تمام طول است و با سرورهای معمولی هوا خنک کاملا سازگار است. همچنین اولین عرضه تراشه Instinct نسل فعلی AMD است که برای اسلات های سرور استاندارد در نزدیک به چهار سال گذشته طراحی شده است.
AMD Instinct MI350P
خط تولید Instinct مبتنی بر PCIe AMD پس از عرضه MI210 در اوایل سال 2022 راکد ماند. همه نسلهای بعدی، از جمله MI300X، MI325X و MI350X با فرمت OAM، از ماژولهای سوکت OAM که بر روی پایههای اختصاصی جهانی نصب شده بودند، استفاده کردند. این ماژولها به محفظههای سفارشیسازی شده با انتقال نیرو و جریان هوا قوی نیاز دارند تا از هشت شتابدهنده کلاس 1000 وات در یک سینی پشتیبانی کنند. چنین معماری سخت افزاری مناسب ارائه دهندگان ابر مقیاس بزرگی است که رک های GPU را به صورت عمده خریداری می کنند، با این حال نمی تواند شرکت های معمولی را که مایل یا قادر به استقرار قفسه های AI سفارشی برای کارهای استنتاج در محل نیستند، تطبیق دهد. MI350P دقیقاً این شکاف بازار را پر می کند. در حال حاضر، NVIDIA فاقد یک رقیب PCIe درجه یک سرور بالا در این بخش است، و AMD را با انحصار بازار موقت باقی میگذارد.
مقایسه سخت افزار: MI350P در مقابل MI350X OAM
MI350P یک نوع کوچک از MI350X نیست. AMD یک تراشه کارآمد مستقل را برای این مدل جدید مهندسی کرده است. MI350X دو دای ورودی/خروجی جفت شده با هشت دای پیچیده شتاب دهنده (XCD) را ادغام می کند که در مجموع 256 واحد محاسباتی را ارائه می دهد. در مقابل، MI350P شامل یک دای ورودی/خروجی و چهار عدد XCD است که معادل 128 واحد محاسباتی است. علیرغم نصف شدن مقیاس سیلیکون، فرکانس ساعت پیک 2.2 گیگاهرتز مشابه مشابه سطح بالاتر خود را حفظ می کند. پیکربندی حافظه از همان مشخصات کاهش یافته پیروی می کند: چهار پشته HBM3E (در مقابل هشت)، یک گذرگاه حافظه 4096 بیتی (کاهش از 8192 بیت)، در کنار ظرفیت حافظه 144 گیگابایت و پهنای باند 4 ترابایت بر ثانیه، در مقایسه با MI350X با ظرفیت 288 گیگابایت بر ثانیه و 8 TB.
معماری AMD Instinct MI350P
حداکثر توان محاسباتی نیز به نصف کاهش می یابد. MI350P به 4600 MXFP4 TFLOPS در مقابل 9.2 PFLOPS MI350X می رسد، همراه با 2300 FP8 TFLOPS در مقایسه با مدل پریمیوم 4.6 PFLOPS. معیارهای عملکرد برای BF16، FP16 و سایر استانداردهای دقت از همان کاهش متناسب پیروی می کنند. قابل ذکر است که AMD برای شفافیت، داده های عملکرد پایدار در اوج و واقعی را منتشر کرده است. این کارت 2299 TFLOPS تحت MXFP4، 1529 TFLOPS تحت FP8 و 713 TFLOPS تحت BF16 ارائه می دهد. این ارقام عملی خروجی واقعی را در یک پوشش توان 600 وات منعکس میکنند، جایی که محدودیتهای توان و محدودیتهای پهنای باند حافظه به طور اجتنابناپذیری عملکرد اوج نظری را کاهش میدهند.
تیم تحریریه قبلاً پلتفرم MI350X را از طریق برنامه Jumpstart Supermicro ارزیابی کرده و قابلیتهای استنتاج قوی آن را تشخیص داده است. این تیم مشتاق است تا آزمایشات عملی MI350P را انجام دهد و نحوه عملکرد این شتابدهنده PCIe-form-factor در شاسی سرور استاندارد کالا را تجزیه و تحلیل کند.
MI350P علیرغم اینکه مقیاس سیلیکونی نصف شده است، از کاهش 50 درصدی برق برخوردار نیست. توان 600 وات TBP را دارد که معادل تقریباً 60 درصد حد مجاز 1000 وات MI350X است. این اوج وات به مرز بالایی مشخصات PCIe CEM می رسد و کارت را در حداکثر آستانه حرارتی اسلات اجرا می کند. حالت عملکرد کاهش یافته 450 وات برای سرورهایی با خنک کننده ناکافی، همراه با کاهش عملکرد متوسط در دسترس است. MI350P که در همان براکت قدرت قرار دارد، به طور مستقیم با سرور H200 NVL و RTX Pro 6000 NVIDIA برای خرید سازمانی رقابت می کند.
برخلاف H200 NVIDIA با اتصالات پرسرعت NVL4، MI350P نوردهی Infinity Fabric را غیرفعال میکند. تمام انتقال داده های بین GPU به پهنای باند 128 گیگابایت بر ثانیه PCIe Gen5 x16 محدود شده است.
هشت GPU استقرار هوا خنک
به عنوان یک کارت استاندارد دو اسلات FHFL PCIe، MI350P با سرورهای سازمانی موجود سازگار است. OEM های اصلی مدل های متراکم هشت پردازنده گرافیکی با هوا خنک را ارائه می دهند، از جمله Dell PowerEdge XE7740 و HPE ProLiant DL380a Gen12 که قبلاً بررسی شده بود. این پلتفرمها که برای شتابدهندههای 600 وات بهینه شدهاند، نیازی به قفسههای سفارشی، خنککننده مایع یا پایههای OAM ندارند.
پیکربندی هشت کارته MI350P 1152 گیگابایت HBM3E و پهنای باند مجموع 32 ترابایت بر ثانیه را ارائه میکند که برای میزبانی مدلهای تریلیون پارامتری با دقت MXFP4 در یک شاسی هوا خنک کافی کافی است. با این وجود، پارچه های مخصوص پوسته ریزی را قربانی می کند. در حالی که MI350X از Infinity Fabric برای ارتباط سریع بین ماژول ها استفاده می کند، MI350P تنها به PCIe Gen5 متکی است. این معماری برای استنتاج با موازی تانسور محلی گره و موازی سازی داده متقابل گره مناسب است، در حالی که MI350X مبتنی بر OAM برای کارهای آموزشی هوش مصنوعی با پهنای باند بسیار برتر است.
فرمت های دقیق
MI350P تمام فرمت های دقیق را بدون ارتقاء از MI350X به ارث برده است. انواع مقیاسبندی بلوک OCP از جمله MXFP4، MXFP6 و MXFP8 به جریان اصلی توسعه مدل هوش مصنوعی تبدیل شدهاند و امکان آموزش با دقت پایین با کاهش کیفیت ناچیز را فراهم میکنند. سرعت MXFP4 بیش از دو برابر FP8 و چهار برابر توان عملیاتی BF16 است. موارد دنیای واقعی مانند OpenAI gpt-oss و Kimi K2.6 ارزش کوانتیزاسیون با بیت پایین بومی را اثبات می کنند. از آنجایی که وزنهای MXFP4 و INT4 تنها 25 درصد از فضای حافظه BF16 را اشغال میکنند، مدلهای تریلیون پارامتری را میتوان در یک سرور تنها با هشت GPU مستقر کرد، و خوشههای دست و پا گیر چند نود را برای شرکتهای اولیه حذف کرد.
خط پایین
بیشتر شرکتهای مبتنی بر هوش مصنوعی بهجای قابلیت محاسبات خام، به دلیل قدرت، خنککننده، تراکم و بودجه محدود هستند. MI350P به طور موثر این موانع استقرار را کاهش می دهد. با توجه به اینکه NVIDIA فاقد پردازنده گرافیکی سرور PCIe پرچمدار در این بخش است، AMD در حال حاضر یک مزیت رقابتی واضح را حفظ کرده است. جزئیات بیشتر در صفحه وب رسمی AMD Instinct موجود است.
پکن Qianxing Jietong Technology Co., Ltd.
سندی یانگ / مدیر استراتژی جهانی
WhatsApp / WeChat: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز تجاری:
توزیع محصول ICT/یکپارچه سازی سیستم و خدمات/راه حل های زیرساخت
با بیش از 20 سال تجربه توزیع فناوری اطلاعات، ما با برندهای پیشرو جهانی برای ارائه محصولات قابل اعتماد و خدمات حرفه ای همکاری می کنیم.
«استفاده از فناوری برای ساختن جهانی هوشمند» ارائهدهنده خدمات مورد اعتماد شما در زمینه فناوری اطلاعات و ارتباطات!
سندی یانگ / مدیر استراتژی جهانی
WhatsApp / WeChat: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز تجاری:
توزیع محصول ICT/یکپارچه سازی سیستم و خدمات/راه حل های زیرساخت
با بیش از 20 سال تجربه توزیع فناوری اطلاعات، ما با برندهای پیشرو جهانی برای ارائه محصولات قابل اعتماد و خدمات حرفه ای همکاری می کنیم.
«استفاده از فناوری برای ساختن جهانی هوشمند» ارائهدهنده خدمات مورد اعتماد شما در زمینه فناوری اطلاعات و ارتباطات!



