Всё, что мы знаем об Nvidia RTX 3080 и Ampere
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Архитектура Nvidia Ampere в пяти строчках
- До 128 SM и 8192 ядер CUDA (в GA100)
- 7-нм техпроцесс означает большую энергоэффективность, чем у 12-нм Turing
- Намного более высокая производительность, чем у карт RTX 20-й серии
- Ожидаемая дата выпуска: сентябрь 2020 года
- Цены: скорее всего, RTX 3080 будет стоить дорого
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Анонс GA100 и Nvidia A100
Новая графическая архитектура Nvidia Ampere была анонсирована 14 июня 2020 года в виде графического процессора Nvidia A100 и благодаря этому сегодня мы знаем о ней гораздо больше, чем неделю назад.
Монструозный чип размером 826 кв. мм выпускается по 7-нм технологическим нормам и состоит из 54 миллиардов транзисторов, 108 потоковых мультипроцессоров SM и 6912 ядер CUDA, при этом для вычислений с плавающей запятой стандартной точности FP32 используются все 6912 ядер, для двойной точности FP64 — половина из них. Общее число тензорных ядер составило 432. Пиковая производительность в вычислениях с одинарной точностью достигает 312 терафлопс, что в 20 раз выше возможностей Volta. В вычислениях с двойной точностью A100 выдаёт 156 терафлопс, что в два с половиной раза больше, чем у Volta. Чип оснащён 40 Гбайтами памяти HBM2 с общей пропускной способностью до 1,6 Тбайт в секунду.
Процессор Nvidia A100 не предназначен для игрового применения, а рассчитан на использование в нейронных обучаемых системах. Именно этим объясняется и неожиданный гигантизм, и поддержка интерфейса NVLink 3.0, причём в чипе используются 12 каналов, позволяющих добиться скорости передачи данных 600 Гбайт в секунду. Кроме того, впервые в серверном чипе Nvidia применён интерфейс PCI Express 4.0 c пропускной способностью до 64 Гбайт в секунду. Благодаря переходу на 7-нм нормы максимальное энергопотребление чипа составляет всего 400 Вт.
Несмотря на серверную ориентацию Nvidia A100, он позволяет составить более точное представление об архитектуре Ampere. В её основе лежат «строительные блоки» SM, «потоковые микропроцессоры». А поскольку они представляют собой аналог CU, «вычислительных блоков» от AMD, будет вполне корректно сравнивать чипы конкурентов по количеству SM и CU.
В микроархитектуре Turing впервые появились тензорные и RT-ядра для трассировки лучей, триангуляционных вычислений и вычислений глубокого обучения уровня FP16. Кроме них, основой чипов от Nvidia служат ядра CUDA, и в архитектуре Turing в каждом из них реализованы выделенные линии для целочисленных вычислений INT, что обеспечивает возможность одновременной работы как с целыми числами, так и с плавающей запятой FP. В Ampere эти разработки выводятся на принципиально новый уровень.
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Возможные характеристики видеокарт
Подчёркиваем, что приводимые ниже данные основаны либо на догадках, либо на «утечках», так что реальные характеристики видеокарт на базе Ampere могут заметно отличаться от них. Тем не менее, анонс Nvidia A100 позволяет нам сделать более обоснованные предположения, чем ранее.
GPU | GA100 | GA102 | GA103? | GA104? | G106? | GA107? |
Видеокарта | Nvidia A100 | GeForce RTX 3090? | GeForce RTX 3080 | GeForce RTX 3070 | GeForce RTX 3060 | GeForce RTX 3050 |
Техпроцесс, нм | 7 | 7 | 7 | 7 | 7/8 | 7/8 |
Транзисторов, млрд | 54 | 30 | 22 | 16 | 12 | 9 |
Площадь кристалла, кв. мм | 826 | около 500 | около 367 | около 267 | 200 | 150 |
Число SM | До 128 | До 84 | До 60 | До 40 | До 30 | До 20 |
Ядер CUDA | 8192 | 5376 | 3840 | 2560 | 1920 | 1280 |
Ядер RT | Нет | 84 | 60 | 40 | 30 | 20 |
Тензорных ядер | 512 | 336 | 240 | 160 | 120 | 80 |
Частота, МГц | 1410 | 1750 | 2000 | 1900 | 2000 | 2000 |
Скорость VRAM, Гб/c | 2,43 | 18 | 18 | 18 | 16 | 16 |
Объём VRAM, Гбайт | До 48 | 24 | 11 | 10 | 8 | 8 |
Скорость шины | До 6144 | 384 | 352 | 320 | 256 | 128 |
Число ROP | 192 | 128 | 96 | 80 | 64 | 32 |
Число TMU | 512 | 672 | 480 | 320 | 240 | 160 |
Производительность FP32, Гфлопс | 23101 | 18816 | 15360 | 9728 | 7680 | 5120 |
Скорость трассировки лучей, Гигалучей/c | - | 42 | 34 | 22 | 17 | 11 |
Производительность тензорных ядер FP16, Тфлопс | 739 | 602 | 492 | 311 | 246 | 164 |
Пропускная способность, Гбайт/c | 1866 | 864 | 792 | 720 | 512 | 256 |
Энергопотребление, Вт | 400 | 350 | 320 | 250 | 160 | 120 |
Дата анонса | Июнь 2020 г | Осень 2020 г | Осень 2020 г | Осень 2020 г | Зима 2020/ 2021 г | Весна 2021 г |
Цена при анонсе | $199000 за DGX A100 | $1500 | $800 | $550 | $350 | $200 |
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Утечки об RTX 3080
Недавние утечки демонстрируют нам, как может выглядеть эталонная модель Nvidia RTX 3080 Founders Edition. Конечно, всё может измениться, но количество фотографий этой карты в интернете намекает на то, что она будет выглядеть именно так. Да, название может быть другим, и, конечно же, мы получим целый набор карт собственной конструкции от партнёров Nvidia. Их всех объединяет одно: они не похожи ни на одну из видеокарт предыдущих поколений.
Новая система охлаждения состоит из двух вентиляторов (по одному с каждой стороны), которые продувают воздух через радиаторы. При этом TDP старшей модели RTX 3090, по слухам, может составить 350 Вт. Предположительно, она станет новым флагманом, придя на смену 2080 Ti — или же на смену Titan. В любом случае, это будет монстр.
Мощную систему охлаждения получит и RTX 3080, TDP которой составит 320 Вт. Но подтверждений этому нет, так что лучше дождёмся их релиза.
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Когда нам их ждать?
Кстати, а когда же состоится их релиз? Это самый сложный вопрос. Ещё несколько месяцев назад можно было говорить о какой-то определённости, но мировая пандемия COVID-19 спутала все планы. И всё же мы надеемся, что премьера флагманов состоится не позднее осени, а бюджетные версии появятся зимой и весной будущего года. Всё, что мы знаем об Nvidia RTX 3080 и Ampere | А как насчёт цен?
Топовые видеокарты всегда стоили дорого. Если предположить, что RTX 3090 придёт на смену 2080 Ti, то её могут оценить примерно в $1200–1500. Исходя из той же логики, RTX 3080, как преемник 1080 Ti, будет стоить $700–800. При этом стоит учитывать, что новые карты будут выпускаться на фабриках TSMC по пока более дорогому техпроцессу 7 нм, так что реальную цену предсказать трудно.
Всё, что мы знаем об Nvidia RTX 3080 и Ampere | Заключение
Лучшее, что мы можем сегодня сделать — это сидеть и ждать. И хотя вокруг Ampere ходит масса слухов, нам достоверно неизвестно, что же Nvidia представит на самом деле. Мы не знаем о производительности с трассировкой лучей и без неё, но если верны предположения о том, что мощность ядер RT вырастет вдвое, то карточки среднего уровня, скажем, RTX 3060, смогут превзойти или как минимум на равных конкурировать с RTX 2080 Ti в таких играх, как Minecraft RTX, в которых возможности ядер RT используются на полную.
Разумеется, Ampere будут быстрее и экономичней, чем современные Turing — хотя бы благодаря 7-нм техпроцессу. Однако важно дождаться появления «живых» карт и объявления цен на них.
Полный текст статьи читайте на Tom's Hardware