سخت افزار

پردازنده‌های سری Max اینتل از راه رسیدند؛ قدرت‌نمایی پونته وکیو در دنیای ابرکامپیوترها

جدیدترین پردازنده‌های مرکزی و گرافیکی اینتل با معماری مدرن و قدرت پردازشی سرسام‌آور از راه رسیدند. گرافیک‌های جدید از معماری خوش‌سابقه‌ی پونته وکیو استفاده می‌کنند.

به گزارش آی تی بوم، اینتل در آستانه‌ی برگزاری رویداد Supercomputing 22، پردازنده‌های مرکزی کلاس دیتاسنتر زیان مکس (Xeon Max) را معرفی کرده است. گفتنی است پیش‌تر، از این پردازنده‌ها با کدنام Sapphire Rapids HBM یاد می‌شد. علاوه‌برایی، تیم آبی پردازنده‌های گرافیکی سری Intel Data Center GPU Max را رونمایی کرده است. پیش‌‌ازاین، پردازنده‌های گرافیکی یادشده صرفاً با کدنام پونته وکیو (Ponte Vecchio) خطاب می‌شدند. اینتل می‌گوید پردازنده‌های جدیدش مخصوص پیچیده‌ترین پردازش‌های ابرکامپیوترها هستند.

پردازنده‌های مرکزی سری Xeon Max

دهه‌ها است که پردازنده‌های مبتنی‌بر معماری x86 برای انواع پردازش‌های فنی استفاده می‌شوند؛ به‌همین‌دلیل، امروزه می‌توان از آن‌ها برای وظایف پردازشی متنوعی استفاده کرد. با وجود بهبود درخورتوجه عملکرد هسته‌های CPU در سال‌های اخیر، پردازنده‌های امروزی در پردازش وظایف هوش مصنوعی و رایانش با قدرت بالا (HPC) با دو محدودیت مهم مواجه هستند: یکی پهنای باند حافظه و دیگری موازی‌سازی. اینتل وعده می‌دهد که پردازنده‌های سری Xeon Max هر دو محدودیت را دور بزنند.

براساس گزارش تامز هاردور، پردازنده‌های سری Xeon Max مجهز به حداکثر ۵۶ هسته‌ی پرقدرت بر‌پایه‌ی ریزمعماری Golden Cove هستند. این هسته‌ها در قالب چهار چیپلت روی بستری واحد قرار دارند و اینتل ازطریق فناوری اختصاصی EMIB بین چیپلت‌ها ارتباط برقرار می‌کند. طبق گفته‌ی اینتل، تراشه‌های جدید کلاس دیتاسنتر موتورهای پردازشی ویژه‌ای با تمرکز بر هوش مصنوعی و HPC دارند و از ۶۴ گیگابایت حافظه‌ی آن‌برد HBM2E استفاده می‌کنند.

پردازنده‌های جدید اینتل همچون سایر محصولات سری Sapphire Rapids از هشت کانال حافظه‌ی DDR5 و رابط PCIe Gen 5 با پروتکل CXL 1.1 پشتیبانی می‌کنند. هسته‌های بهبودیافته‌ی اینتل از AVX-512 و تکنیک Deep Learning Boost و حتی شتاب‌دهنده‌ی ماتریس AMX نیز بهره می‌برند. هسته‌های جدید از DSA هم پشتیبانی می‌کنند. این تکنیک فشار ناشی از انتقال داده‌ها را از روی پردازنده برمی‌دارد.

استفاده از ۶۴ گیگابایت حافظه‌ی آن‌برد HBM2E (شامل چهار حافظه‌ی ۱۶ گیگابایتی) به حداکثر پهنای باند یک ترابایت منتهی می‌شود که معادل تقریباً ۱٫۱۴ گیگابایت حافظه و پهنای باند ۱۸٫۲۸ گیگابایت‌برثانیه به‌ازای هر هسته است. برای فهم بهتر این اعداد، بهتر است بدانید پردازنده‌ی ۵۶ هسته‌ای Sapphire Rapids که هشت ماژول DDR5-4800 داشته باشد، به پهنای باند ۳۰۷٫۲ گیگابیت‌برثانیه دست پیدا می‌کند یا به‌بیان بهتر، ۵٫۴۸۴ گیگابایت‌برثانیه به‌ازای هر هسته.

پردازنده‌های سری Xeon Max می‌توانند از حافظه‌ی HBM2E به شیوه‌های مختلف استفاده کنند: استفاده به‌عنوان حافظه‌ی سیستم و استفاده به‌عنوان کش پرسرعت برای ساب‌سیستم حافظه‌ی DDR5 و استفاده به‌عنوان بخشی از حافظه‌ی یکپارچه‌ی HBM. روش آخر نیازمند بهینه‌سازی‌های نرم‌افزاری است؛ اما دو روش اول به تغییر کد نیازی ندارند.

اینتل می‌گوید بسته‌ به نوع پردازش، Xeon Max می‌تواند حدوداً ۳٫۰ تا ۵٫۳ برابر قوی‌تر از Xeon Scalable 8380 عمل کند. پردازنده‌ی Xeon Scalable 8380 هم‌اکنون در بازار موجود است. پردازنده‌های نسل جدید اینتل به‌لطف حافظه‌ی HBM2E خود در پردازش‌هایی مثل توسعه‌ی مدل سه‌بعدی برای مولکول‌ها، حداکثر ۲٫۸ برابر قوی‌تر از AMD EPYC 7773X عمل می‌کنند. این پردازنده‌ی AMD متکی‌بر 3D V-Cache است.

استفاده از حافظه‌ی HBM2E مزیت دیگری نیز برای اینتل دارد و آن کاهش میزان حمل‌و‌نقل داده‌ها در بین CPU و GPU است؛ موضوعی که برای تعدادی از پردازش‌های حوزه‌ی HPC اهمیت زیادی دارد.

پردازنده‌های گرافیکی سری Intel GPU Max

اینتل گفته است پردازنده‌های گرافیکی جدیدش در حوزه‌ی دیتاسنتر برپایه‌ی نسخه‌ای از معماری پونته وکیو تولید می‌شوند؛ معماری‌ای که نخستین‌بار در سال ۲۰۱۹ معرفی شد. اینتل تا مدت‌ها پونته وکیو را در سکوت خبری توسعه می‌داد تا اینکه در سال‌های ۲۰۲۰ و ۲۰۲۱، جزئیات دقیقی درباره‌ی آن منتشر کرد.

پونته وکیو پیچیده‌ترین پردازنده‌ی ساخته‌شده در تاریخ است؛ چون بدون احتساب حافظه، بیش از ۱۰۰ میلیارد ترانزیستور در ۴۷ کاشی پردازشی (شامل هشت کاشی HBM2E) دارد. معماری پونته وکیو به‌‌طورگسترده از فناوری‌های مدرن اینتل در حوزه‌ی پکیجینگ تراشه نظیر EMIB استفاده می‌کند. چندین شرکت با فناوری‌های متنوع چیپلت‌های پرتعداد پونته وکیو را تولید می‌کنند.

اینتل می‌گوید پردازنده‌های گرافیکی Data Center GPU Max را با بهره‌گیری از معماری اصلاح‌شده‌ی Xe-HPC تولید می‌کند که به‌طورویژه برای پردازش‌های هوش مصنوعی و حوزه‌ی HPC بهینه شده است. به‌موجب استفاده از این معماری، پردازنده‌های جدید تعداد زیادی از فرمت‌ها و دستورالعمل‌ها را پشتیبانی می‌کنند.

مشخصات فنی گرافیک‌های کلاس دیتاسنتر جدید اینتل
Data Center Max 1100 Data Center Max 1350 Data Center Max 1550
فرم‌فکتور PCIe OAM OAM
کاشی‌های پردازشی (چیپلت) ؟ ؟ ۴۷
ترانزیستور ؟ ؟ ۱۰۰ میلیارد
هسته‌های Xe HPC ۵۶ ۱۱۲ ۱۲۸
هسته‌های رهگیری پرتو ۵۶ ۱۱۲ ۱۲۸
موتورهای وکتور ۵۱۲ بیت ۴۴۸ ۸۹۶ ۱٬۰۲۴
موتورهای ماتریس ۴٬۰۹۶ بیت ۴۴۸ ۸۹۶ ۱٬۰۲۴
کش L1 ؟ ؟ ۶۴ مگابایت
کش L2 Rambo ؟ ؟ ۴۰۸ مگابایت
حافظه‌ی HBM2E ۴۸ گیگابایت ۹۶ گیگابایت ۱۲۸ گیگابایت
توان ۳۰۰ وات ۴۵۰ وات ۶۰۰ وات

معماری Xe-HPC درمقایسه‌با Xe-HPG تعداد بسیار بیشتری ساب‌سیستم برای حافظه و کش دارد و از هسته‌های متفاوتی استفاده می‌کند. معماری Xe-HPC واحد بافت ندارد؛ به‌همین‌دلیل، نمی‌تواند با روش‌های سنتی محتوای گرافیکی را پردازش کند. در کمال تعجب، Xe-HPG برای بصری‌سازی داده‌ها در ابرکامپیوتر از فناوری رهگیری پرتو (Ray Tracing) پشتیبانی می‌کند.

یکی از مشخصه‌های مهم‌ معماری Xe-HPC، تکنیک XMX است که به پردازنده‌های گرافیکی جدید اینتل کمک می‌کند تا در فرمت TF32 به قدرت ۴۱۹ ترافلاپس دست پیدا کنند. بررسی‌های اولیه نشان می‌دهد قوی‌ترین پردازنده‌ی پونته وکیو در اکثر سناریوها در حدواندازه‌ی Nvidia H100 ظاهر نمی‌شود و تقریباً در تمامی پردازش‌ها برتری چندانی بر AMD Instinct MI250X ندارد. اینتل می‌گوید پردازنده‌ی گرافیکی Data Center GPU Max 1550 در شبیه‌سازی‌های Riskfuel تا ۲٫۴ برابر و در شبیه‌سازی‌های NekRS تا ۱٫۵ برابر سریع‌تر از A100 انویدیا است.

اینتل قصد دارد سه محصول جدید برپایه‌ی پونته وکیو عرضه کند. قوی‌ترین مدل Data Center GPU Max 1550 نام دارد و شامل ۱۲۸ هسته‌ی Xe-HPC و ۱۲۸ گیگابایت حافظه‌ی HBM2E و توان ۶۰۰ وات است. مدل دوم، یعنی Data Center GPU Max 1350، از ۱۱۲ هسته‌ی Xe-HPC به‌همراه ۹۶ گیگابایت حافظه و توان ۴۵۰ وات استفاده می‌کند. سومین و ضعیف‌ترین مدل، Data Center GPU Max 1100 است. این پردازنده ۵۶ هسته‌ی He-HPC و ۵۶ گیگابایت حافظه‌ی HBM2E و ۳۰۰ وات توان دارد.

Rialto Bridge؛ نسل بعد گرافیک‌های دیتاسنتر اینتل

اینتل افزون‌بر رونمایی گرافیک‌های سری Data Center GPU Max، جزئیاتی مقدماتی از گرافیک‌های سری Rialto Bridge را منتشر کرد؛ گرافیک‌هایی که سال ۲۰۲۴ از راه می‌رسند. اینتل می‌گوید محصولات این خانواده از هسته‌های بهبودیافته‌ی Xe-HPC استفاده می‌کنند و همچنان مبتنی‌بر معماری پونته وکیو خواهند بود. استفاده از هسته‌های جدید باعث می‌شود توان مصرفی در Rialto Bridge به حداکثر ۸۰۰ وات برسد. ناگفته نماند مدل‌هایی از این پردازنده‌ها با توان کمتر تولید می‌شوند.

اینتل می‌گوید آزمایشگاه ملی آرگون در ایالات متحده یکی از اولین مشتریانی است که محصولات جدید سری Intel Xeon Max و Intel Data Center GPU Max را دریافت می‌کند. این آزمایشگاه تحقیقاتی مشغول تولید ابرکامپیوتری با قدرت بیش از دو اگزافلاپس است. شرکای تجاری اینتل در اوایل سال آینده‌ی میلادی دستگاه‌های مبتنی‌بر Xeon Max و Data Center GPU Max را برای بازار سرور عرضه می‌کنند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 × دو =

دکمه بازگشت به بالا