ساخت و طراحی پیشرفته‌ترین تراشه توسط انویدیا بنام Volta GV100

اخیرآ انویدیا شتاب دهنده Tesla V100 مجهز به یک پردازنده گرافیکی مبتنی بر ریزمعماری جدید Volta را معرفی کرد.

GV100 کُد تراشه بکار رفته در این شتاب دهنده است که ویژگی های خارق العاده ای چون برخورداری از در مجموع 5376 هسته CUDA و 16 گیگابایت حافظه HBM دارد. با اینکه ما درباره یک شتاب دهنده مخصوص مصارف حرفه ای صحبت می کنیم، اما برای گیمرها هم اهمیت خاص خود را دارد، چراکه تراشه GV100 نیرو بخش دو کارت TITAN Xv و GTX 2080 Ti نیز خواهد بود. در ادامه به تشریح کامل این تراشه بسیار پیشرفته می پردازیم.

.

.

.

.

.

.

.

.

تراشه GV100 دارای ساختار و اجزای مشابه نسل پیشین انویدیا است اما تغییرات اساسی در بخش محاسباتی و واحدهای SM صورت گرفته است. واحدهای SM مبتنی بر ریزمعماری Volta که در تراشه GV100 یافت می شوند دارای هر دو هسته های CUDA نوع FP64 و FP32 هستند. البته در کارت های گرافیک مخصوص مصرف کننده یا به طور مشخص مخصوص گیمینگ مبتنی بر این تراشه، هسته های FP64 غیر فعال خواهد بود.

.

.

.

.

هر واحد SM دربرگیرنده 64 هسته CUDA  نوع FP32 و 32 هسته  نوع FP64 است. هسته های FP64 قادر به اجرای عملیات 32 بیتی، 16 بیتی و 8 بیتی هستند. تراشه GV100 در مجموع دارای 84 واحد SM است، بنابراین ما با تعداد 5,376 هسته CUDA نوع FP32 و 2,688 هسته CUDA نوع FP64 روبرو هستیم. همچنین با ریزمعماری Volta شاهد گونه جدیدی از هسته های پردازشی به نام Tensor هستیم که مخصوص یادگیری ماشین هستند. هر واحد SM دارای 8 هسته Tensor است، بنابراین این تراشه در مجموع دارای 672 هسته Tensor است. هسته های Tensor نیز برای کارت های گرافیک مخصوص مصرف کنندگان غیرفعال خواهند شد.  تراشه GV100 دارای 336 واحد TMU است. توان حرارتی این تراشه 300 وات است.

به ادعای انویدیا Tesla V100 در مقایسه با شتاب دهنده Tesla P100 مبتنی بر ریزمعماری Pascal در محاسبات FP32 و FP64 تا 50 درصد کارایی بالاتری ارائه می کند. حداکثر قدرت محاسباتی FP32 این شتاب دهنده به 15 ترافلاپ و قدرت محاسباتی FP64 آن حداکثر به 7.5 ترافلاپ می رسد. هسته های Tensor نیز قدرت محاسباتی 120 ترافلاپ را ارائه می کنند. البته هسته های Tensor استفاده بسیار خاص دارند و برخلاف هسته های CUDA چندمنظوره نیستند. این هسته ها برای ضرب ماتریس-ماتریس طراحی شده اند که عملیات ریاضی اصلی در یادگیری شبکه های مصنوعی است. به ادعای انویدیا تعبیه هسته های Tensor یادگیری و ساخت شبکه های عصبی مصنوعی را 12 برابر سرعت می بخشد.

GV100 یک تراشه متشکل از چندین ماژول (موسوم به MCM) با انداز 815 میلی متر مربع است که از 21.1 میلیارد ترانزیستور تشکیل شده است. این تراشه با بکارگیری فناوری ساخت 12 نانومتری تولید می شود. GV100 به 16 گیگابایت حافظه HBM2 متشکل از چهار تراشه 32 گیگابیتی تعبیه شده بر روی همان قطعه سیلیکونی اصلی مجهز است که از طریق رابط حافظه 4096 بیتی با پردازنده گرافیکی در ارتباط است. این تراشه ها دارای فرکانس موثر 1 گیگاهرتز هستند و پهنای باند حافظه موثر 1 ترابایت را فراهم می کنند.

از آنجایی که بکارگیری تراشه های HBM2 می تواند به افزایش چشمگیر هزینه ساخت منجر شود، ممکن است گونه مخصوص کارت های رده مصرف کننده این تراشه از تراشه های GDDR6 بهره بگیرند. در این حالت افزون بر هسته های FP64 و هسته های Tensor، حافظه HBM2 نیز برای مصرف کنندگان ارائه نخواهد شد.

لازم به ذکر است اولین محصول مبتنی بر تراشه GV100 که شتاب دهنده Tesla P100 خواهد بود، مبتنی بر گونه تقلیل یافته ای از تراشه مزبور است. جدول مشخصات موجود در این نوشتار مربوط به گونه تقلیل نیافته (چاق) تراشه GV100 است.

منبع

 

نوشته های مرتبط

سرور HPE DL380 Gen10 Plus

04

اردیبهشت
سرور و Mainframe

سرور HPE DL380 Gen10 Plus

سرور HPE DL380 Gen10 Plus

سرور های HPE پرفروش‌ ترین مدل سرور در ایران و کل دنیا هستند، و باز هم HPE جدیدترین سرور خود را با نام HPE DL380 Gen10 PLUS میباشد را معرفی و به بازار دنیا روانه کرد تا بالاترین جایگاه را در میان دیتاسنتر ها کسب نماید .

در سرورهای نسل 10 با داشتن ویژگی‌ها و تکنولوژی‌های به‌روز و جدید در زمینه سخت افزار و نرم افزار، قادر به ارایه کارایی، توسعه پذیری و امنیت در سطح بسیار بالا است و در پردازش‌های سنگین و دیتاسنتر، HPC ، مجازی سازی ، گرافیک و رندرینگ در سطح حرفه‌ای ، شبیه سازی و مدل سازی ، کاربرد دارد. […]

iLO Amplifier Pack

11

بهمن
نرم افزار و سیستم عامل

نرم افزار HPE iLO Amplifier Pack چیست؟

نرم افزار iLO Amplifier Pack یک ابزار مدیریت به روزرسانی است که کاربران سرور اچ پی HPE SERVER GEN8/9/10 را قادر می سازد تا سریعتر به روزرسانی خود را انجام داده و سیستم عامل و بروزرسانی های درایور را به صورت خودکار انجام دهند. […]

ارتباطات شبکه های پخشی و ارتباطات همتا به همتا

10

بهمن
شبکه ، ارتباطات و انتقال اطلاعات

ارتباطات شبکه های پخشی و ارتباطات همتا به همتا

(ارتباطات شبکه های پخشی و ارتباطات همتا به همتا)

در این مقاله سعی می کنیم که توجه خود را از مسایل متفرقه به موضوع اصلی(یعنی همان شبکه های کامپیوتری) معطوف کنیم.هیچ طبقه بندی پذیرفته شده ای که در بر گیرنده تمام انواع شبکه های کامپیوتری باشد وجود ندارد.امروزه دو تکنولوژی انتقال بیش از همه گسترش یافته و فراگیر هستند : […]