سوپرمیکرو مدتهاست که طیف گستردهای از سرورهای گرافیکی را در اندازهها و فرمهای مختلف عرضه میکند که پرداختن به همه آنها در این بررسی میسر نیست. در این مطلب، به بررسی یک سرور 4 یونیته میپردازیم که به دو پردازنده AMD EPYC سری 9005/9004 مجهز است و از PCIe Gen5 بهره میبرد. این سرور قابلیت پشتیبانی از حداکثر هشت کارت گرافیک دو اسلاته را دارد و از کارتهای گرافیکی پیشرفتهای مانند NVIDIA H100 و AMD Instinct Mi210 پشتیبانی میکند.
سرور سوپرمیکرو AS-4125GS-TNRT با قابلیتهای پیشرفته و انعطافپذیری بالا
سرور سوپرمیکرو AS-4125GS-TNRT دارای مجموعهای از ویژگیهای سختافزاری برجسته است. این سرور به شبکه داخلی 10 گیگابیت اترنت، مدیریت خارج از باند (OOB)، 9 اسلات PCIe Gen5 FHFLو 24 جایگاه 2.5 اینچی مجهز است که از این تعداد، 4 جایگاه از نوع NVMe و مابقی از نوع SATA/SAS هستند. همچنین، این سرور از چهار منبع تغذیه تیتانیومی 2000 واتی با قابلیت افزونگی بالا بهره میبرد. علاوه بر این، یک اسلات NVMe M.2 روی مادربرد برای بوت سیستم در نظر گرفته شده است.
صرفنظر از نوع پیکربندی، سرور AS-4125GS-TNRT سوپرمیکرو به لطف طراحی منحصربهفرد و امکان استفاده از مدلهای مجهز به سوئیچ PCIe، انعطافپذیری بالایی را ارائه میدهد. این سبک از سرورهای GPU به دلیل قابلیت شروع با پیکربندیهای کوچک و امکان ارتقای تدریجی، بسیار مورد توجه سازمانها قرار گرفته است. همچنین، امکان ترکیب و استفاده از کارتهای گرافیک مختلف برای پاسخگویی به نیازهای متنوع کاربران از دیگر مزایای این سرور است. در حالی که سیستمهای GPU سوکتی برای تجمیع بهتر GPUها در بارهای کاری بزرگ هوش مصنوعی ایدهآل هستند، سیستمهای مبتنی بر کارتهای افزودنی به دلیل انعطافپذیری بیشتر در انواع مختلف بارهای کاری، جایگاه ویژهای دارند.
علاوه بر این، هرچند ممکن است این موضوع برای برخی غیرمنتظره یا غیرمعمول به نظر برسد، اما سرورهای GPUمحور سوپرمیکرو با کارتهای افزودهشونده این قابلیت را دارند که از کارتهای گرافیکی AMD و NVIDIA به طور همزمان در یک سیستم استفاده کنند. این ویژگی به مشتریان این امکان را میدهد که بر اساس نیازهای بار کاری خود، از مزایای هر دو نوع کارت بهرهمند شوند؛ به عنوان مثال، برخی از بارهای کاری ممکن است به عملکرد کارتهای AMD Instinct نیاز داشته باشند، در حالی که سایر بارهای کاری ممکن است کارتهای گرافیکی NVIDIA را ترجیح دهند. علاوه بر این، از آنجا که این اسلاتها صرفاً اسلاتهای PCIe هستند، امکان استفاده از شتابدهندههای دیگری مانند FPGAها، DPUها و سایر شتابدهندهها نیز وجود دارد. این قابلیت انعطافپذیری بیشتری برای مشتریان فراهم میکند و به یکی از مزایای کلیدی این طراحی تبدیل شده است.
ممکن است مفید باشد
پیکربندی بررسی سرور AS-4125GS-TNRT سوپرمیکرو
بررسی سرور سوپرمیکرو AS-4125GS-TNRT با پردازندههای AMD و کارتهای گرافیک NVIDIA
برای اهداف بررسی، سرور GPU AS-4125GS-TNRT سوپرمیکرو به صورت سیستم (Barebones) در اختیار ما قرار گرفت تا بتوانیم پردازنده، رم، حافظه ذخیرهسازی و البته GPUها را به آن اضافه کنیم. ما با همکاری سوپرمیکرو، چهار کارت گرافیک NVIDIA H100 را برای این بررسی قرض گرفتیم. پس از ورود به آزمایشگاه، اولین اقدام ما نصب یک جفت پردازنده AMD EPYC 9374F با 32 هسته و 64 رشته پردازشی بود. این پردازندهها به دلیل فرکانس بالای کلاک و عملکرد قوی در پردازشهای چند هستهای انتخاب شدند. برای شتابدهندهها، گزینههای متعددی از پردازندههای قدیمی Intel Phi گرفته تا جدیدترین کارتهای NVIDIA H100 PCIe و کارتهای RTX 6000 ADA در اختیار داشتیم. هدف ما ایجاد تعادلی میان توان محاسباتی خام، بهرهوری و تطبیقپذیری بود. در نهایت، تصمیم گرفتیم ابتدا از چهار کارت NVIDIA RTX A6000 استفاده کنیم و سپس برای آزمایشهای اولیه به چهار کارت NVIDIA H100 PCIe ارتقاء دهیم. این ترکیب، انعطافپذیری پلتفرم سوپرمیکرو و توانایی آن در پشتیبانی از انواع کارتهای شتابدهنده NVIDIA را به خوبی نشان داد.
در تحلیل عملکرد هوش مصنوعی، شاهد پیشرفت قابلتوجهی بودیم. ابتدا از کارتهای RTX 8000 استفاده کردیم، سپس به چهار کارت RTX A6000 ارتقاء دادیم و در نهایت از چهار کارت NVIDIA H100 PCIe بهره بردیم. این ارتقاءها به وضوح نشاندهنده قدرت پردازشی بالای این شتابدهندهها و پیشرفت چشمگیر معماری شتابدهندههای NVIDIA در طول سالهای اخیر است.
در ابتدا، کارت RTX 8000 عملکرد قابل قبولی ارائه داد، اما در مواجهه با تنظیمات پیچیدهتر، محدودیتهایی نمایان شد. با ارتقاء به کارت RTX A6000، توانستیم اندازه دستههای ورودی (Batch Size) را تا چهار برابر افزایش دهیم. با این حال، پیشرفت چشمگیر زمانی حاصل شد که از چهار کارت گرافیک H100 استفاده کردیم. این کارتها، به لطف معماری پیشرفته Hopper و ویژگیهای اختصاصی هوش مصنوعی مانند موتور Transformer، امکان اجرای مدلهای پیچیدهتر هوش مصنوعی را فراهم کردند، آن هم بدون افزایش در زمان هر تکرار (Epoch).
نتیجهگیری
قابلیت مقیاسپذیری و انعطافپذیری، از ویژگیهای کلیدی سرور GPU AS-4125GS-TNRT سوپرمیکرو بهشمار میروند. این قابلیتها به مشتریان اجازه میدهند تا با پیکربندیهای کوچکتر شروع کنند و در صورت نیاز، سیستم را برای بارهای کاری سنگینتر توسعه دهند. کاربران میتوانند با هزینه اولیه کمتر، وارد حوزههای هوش مصنوعی و زیرساخت دسکتاپ مجازی (VDI) شوند و در آینده با ارتقای سیستم، از توان پردازشی بیشتری بهرهمند شوند. این سرور با پشتیبانی از کارتهای گرافیکی L40S که هماکنون در دسترس هستند، فرصتی فراهم میکند تا بارهای کاری هوش مصنوعی سریعتر آغاز شوند. طراحی این سرور نهتنها پاسخگوی نیازهای فعلی کاربران است، بلکه با قابلیت ارتقا و انعطافپذیری بالا، آمادگی لازم برای پشتیبانی از نیازهای آینده را نیز دارد.
جهت دریافت مشاوره با شماره 02142535 داخلی 117 در تماس باشید.
منبع: Supermicro 4U AMD EPYC GPU Servers Offer AI Flexibility (AS-4125GS-TNRT) – StorageReview.com