AMD анонсировала 32-ядерный серверный процессор Naples
Двухпроцессорный сервер AMD Naples поддерживает до 4 ТБ оперативной памяти (по 16 модулей DIMM на процессор), обмен данными между памятью и одним ЦПУ происходит на скорости 170 ГБ/с
Две недели назад компания AMD представила семейство десктопных процессоров Ryzen 7, которые уже поступили в продажу. Вторым этапом применения архитектуры Zen должны стать серверные процессоры, а третьим этапом — мобильные APU со встроенными видеоускорителями.
Сейчас пришло время для этапа № 2. На серверном рынке и в дата-центрах AMD собирается так же всколыхнуть рынок и потеснить гегемонию Intel Xeon, как она сделала с десктопными процессорами. Вчера AMD анонсировала высокопроизводительные серверные процессоры Naples на той же архитектуре Zen x86.
У Naples до 32 ядер / 64 потоков с поддержкой одновременной многопоточности (SMT). Он ориентирован на корпоративные серверы и дата-центры. Процессор изготавливается согласно 14-нм технологическим нормам, выпускается для сокета Socket SP3.
Как и все современные процессоры, Naples спроектирован в формате системы на кристалле (SoC), так что контроллер памяти и большая часть I/O внесено непосредственно на чип. Материнская плата превращается главным образом в хаб для подключения периферии, что означает более элегантную и простую конструкцию (см. фото вверху). Процессоры установлены в разъёмы, модули памяти вставляются прямо рядом с процессором, то есть в непосредственной близости от контроллера памяти на ЦПУ. Нет ничего лишнего. Очень красиво.
Кроме вычислительной мощности, процессор поддерживает производительные интерфейсы ввода-вывода.
Во-первых, восьмиканальные контроллеры памяти DDR4–2400 (до 16 DIMM на каждый ЦПУ). AMD официально заявила о поддержке 2 ТБ памяти на разъём. Соответственно, в двухпроцессорный сервер можно поставить 4 ТБ оперативной памяти.
Во-вторых, в микросхему процессора встроен контроллер PCI Express 3.0 на 128 линий, что позволяет отказаться от проектирования в дизайне сервера отдельных компонентов PCI Express, которые увеличивают задержки при передаче данных.
В двухпроцессорной конфигурации на материнских платах с двумя сокетами 64 линии шины PCI Express используются для передачи данных между процессорами — эту шину AMD называет Infinity Fabric. В этом случае на каждом процессоре по 64 линии заняты для коммуникации между процессорами, а на всю остальную систему остаётся по 64 линии с каждого ЦПУ. В сумме получается те же 128 линий PCIe, как и при использовании единственного процессора.
Физические размеры процессора на мероприятии не сообщили, но исходя из размеров кристалла Zeppelin в 195,2 мм², коих тут четыре, можно вывести размер микросхемы в 780 мм² и примерно 19,2 млрд транзисторов. Это намного больше, чем у любого когда-либо производившигося в мире процессора.
Если сравнить Naples с двухпроцессорным сервером Intel Xeon E5–2699A V4, то сервер на AMD Naples может иметь вдвое больше каналов памяти, намного больше вычислительных ядер (+20 физических ядер, +40 потоков) и на 48 больше свободных линий PCI Express.
Вчера на официальной презентации компания AMD поделилась результатами сравнительного тестирования двухпроцессорного сервера Naples и сервера Intel Xeon E5–2699A V4 — серийной модели одного из вендоров. Очевидно, что из-за большего количества ядер и модулей памяти Naples сразу получает преимущество. К тому же, у него выше тактовая частота памяти: 2400 МГц против 1866 МГц у Xeon E5–2699A V4.
Более высокая вычислительная мощность процессорных ядер и более широкая шина памяти позволяют AMD серьёзно обогнать процессоры Xeon во всех тестах. Тактовая частота работы процессоров AMD не называлась (компания сказала, что окончательное решение по тактовым частотам ещё не принято). Но это уже не очень важно при таком серьёзном преимуществе по остальным характеристикам.
С обсчётом некоей задачи по сейсмическому анализу, которая требует многократных вычислений 3D волновых уравнений, сервер Naples справился почти вдвое быстрее, чем сервер Xeon, даже когда снизили для справедливости тактовую частоту памяти до аналогичной 1866 МГц и ограничили использование ядер 44 ядрами на одном процессоре в обеих системах.
По словам представителя AMD, подобный тест с реальной задачей нагружает все подсистемы компьютера, в том числе ЦПУ, память и подсистему ввода/вывода. Вычисления волновых уравнений в таких задачах используются в разных задачах, в том числе в анализе геодезических данных при поиске новых месторождений полезных ископаемых и т.д.
Если снять ограничение на количество ядер и тактовую частоту памяти — и отпустить Naples на волю, то разница в скорости вычислений с Xeon увеличивается до 2,5X.
Предыдущий тест был выполнен на структуре отсчётов с 1 млрд элементов и выполнением по 10 итераций для вычисления волновых уравнений.
Когда набор данных увеличили вчетверо до 4 млрд элементов, то сервер Intel не смог загрузить задачу, а Naples справился за 54 секунды. Впрочем, это явное читерство со стороны AMD, ведь у неё в сервере установлено больше оперативной памяти.
Маркетологи AMD не остановились на этом. Они заявили, что сервер Naples с четырьмя видеокартами Radeon Instinct соответствует вычислительной мощности одного человеческого мозга.
AMD не раскрыла стоимость процессоров. Если компания будет следовать той же тактике, что на рынке десктопных процессоров, то более производительный сервер Naples должен стоить даже дешевле, чем сервер Intel Xeon.
Продажи Naples начнутся во II кв. 2017 года, то есть до конца июня.