ساخت و طراحی پیشرفته‌ترین تراشه توسط انویدیا بنام Volta GV100

GV100
اشتراک

ساخت و طراحی پیشرفته‌ترین تراشه توسط انویدیا بنام Volta GV100

اخیرآ انویدیا شتاب دهنده Tesla V100 مجهز به یک پردازنده گرافیکی مبتنی بر ریزمعماری جدید Volta را معرفی کرد.

GV100 کُد تراشه بکار رفته در این شتاب دهنده است که ویژگی های خارق العاده ای چون برخورداری از در مجموع 5376 هسته CUDA و 16 گیگابایت حافظه HBM دارد. با اینکه ما درباره یک شتاب دهنده مخصوص مصارف حرفه ای صحبت می کنیم، اما برای گیمرها هم اهمیت خاص خود را دارد، چراکه تراشه GV100 نیرو بخش دو کارت TITAN Xv و GTX 2080 Ti نیز خواهد بود. در ادامه به تشریح کامل این تراشه بسیار پیشرفته می پردازیم.

.

.

.

.

.

.

.

.

تراشه GV100 دارای ساختار و اجزای مشابه نسل پیشین انویدیا است اما تغییرات اساسی در بخش محاسباتی و واحدهای SM صورت گرفته است. واحدهای SM مبتنی بر ریزمعماری Volta که در تراشه GV100 یافت می شوند دارای هر دو هسته های CUDA نوع FP64 و FP32 هستند. البته در کارت های گرافیک مخصوص مصرف کننده یا به طور مشخص مخصوص گیمینگ مبتنی بر این تراشه، هسته های FP64 غیر فعال خواهد بود.

.

.

.

.

هر واحد SM دربرگیرنده 64 هسته CUDA  نوع FP32 و 32 هسته  نوع FP64 است. هسته های FP64 قادر به اجرای عملیات 32 بیتی، 16 بیتی و 8 بیتی هستند. تراشه GV100 در مجموع دارای 84 واحد SM است، بنابراین ما با تعداد 5,376 هسته CUDA نوع FP32 و 2,688 هسته CUDA نوع FP64 روبرو هستیم. همچنین با ریزمعماری Volta شاهد گونه جدیدی از هسته های پردازشی به نام Tensor هستیم که مخصوص یادگیری ماشین هستند. هر واحد SM دارای 8 هسته Tensor است، بنابراین این تراشه در مجموع دارای 672 هسته Tensor است. هسته های Tensor نیز برای کارت های گرافیک مخصوص مصرف کنندگان غیرفعال خواهند شد.  تراشه GV100 دارای 336 واحد TMU است. توان حرارتی این تراشه 300 وات است.

به ادعای انویدیا Tesla V100 در مقایسه با شتاب دهنده Tesla P100 مبتنی بر ریزمعماری Pascal در محاسبات FP32 و FP64 تا 50 درصد کارایی بالاتری ارائه می کند. حداکثر قدرت محاسباتی FP32 این شتاب دهنده به 15 ترافلاپ و قدرت محاسباتی FP64 آن حداکثر به 7.5 ترافلاپ می رسد. هسته های Tensor نیز قدرت محاسباتی 120 ترافلاپ را ارائه می کنند. البته هسته های Tensor استفاده بسیار خاص دارند و برخلاف هسته های CUDA چندمنظوره نیستند. این هسته ها برای ضرب ماتریس-ماتریس طراحی شده اند که عملیات ریاضی اصلی در یادگیری شبکه های مصنوعی است. به ادعای انویدیا تعبیه هسته های Tensor یادگیری و ساخت شبکه های عصبی مصنوعی را 12 برابر سرعت می بخشد.

GV100 یک تراشه متشکل از چندین ماژول (موسوم به MCM) با انداز 815 میلی متر مربع است که از 21.1 میلیارد ترانزیستور تشکیل شده است. این تراشه با بکارگیری فناوری ساخت 12 نانومتری تولید می شود. GV100 به 16 گیگابایت حافظه HBM2 متشکل از چهار تراشه 32 گیگابیتی تعبیه شده بر روی همان قطعه سیلیکونی اصلی مجهز است که از طریق رابط حافظه 4096 بیتی با پردازنده گرافیکی در ارتباط است. این تراشه ها دارای فرکانس موثر 1 گیگاهرتز هستند و پهنای باند حافظه موثر 1 ترابایت را فراهم می کنند.

از آنجایی که بکارگیری تراشه های HBM2 می تواند به افزایش چشمگیر هزینه ساخت منجر شود، ممکن است گونه مخصوص کارت های رده مصرف کننده این تراشه از تراشه های GDDR6 بهره بگیرند. در این حالت افزون بر هسته های FP64 و هسته های Tensor، حافظه HBM2 نیز برای مصرف کنندگان ارائه نخواهد شد.

لازم به ذکر است اولین محصول مبتنی بر تراشه GV100 که شتاب دهنده Tesla P100 خواهد بود، مبتنی بر گونه تقلیل یافته ای از تراشه مزبور است. جدول مشخصات موجود در این نوشتار مربوط به گونه تقلیل نیافته (چاق) تراشه GV100 است.

منبع

 

ارسال دیدگاه

Your email address will not be published. Required fields are marked *

چهارده − چهارده =

*