Ретроклокинг: «Проект36» – практически финал истории
Оглавление
Вступление
Еще в конце 2018-го года я начал один проект, который получил название «Проект36». Он был посвящен суперсерверу ALR Revolution 6×6 с шестью физическими процессорами Intel Pentium Pro и стоимостью, сопоставимой с новенькой Ferrari в 1997 году.
реклама
Прошло каких-то 450 дней и наконец-то последовало продолжение истории, а суперсервер получил долгожданный upgrade — шесть Intel Pentium II Overdrive 333 МГц! Для тех лет такая мощь была просто колоссальной, а вот как она соотносится с днем сегодняшним и насколько прибавилось производительности, вы узнаете из этой статьи.
450 дней достаточно большой срок, но некоторые мои проекты растянуты не на год и не два. Кратко напомню содержание двух предыдущих серий статей.
реклама
А тем, кто не помнит начало истории, либо не читал ее совсем, советую перейти по ссылкам:
Для всех остальных напомню коротко, как все начиналось. Погрузившись в мир мэйнфреймов и суперкомпьютеров, мне захотелось попробовать в деле какую-нибудь супермощную систему, и выбор пал на суперсервер ALR Revolution 6×6, который нес на борту шесть Socket 8 и поддерживал до 4 Гбайт оперативной памяти. Для конца 1990-х это были страшные цифры, как, впрочем, и его стоимость.
Один процессор для такой системы оценивался Intel в $2675, а их требовалось шесть, за один модуль 256 Мбайт серверной памяти нужно было отдать $3500, а их было необходимо шестнадцать, чтобы получить заветные 4 Гбайт ОЗУ.
А еще дисковая подсистема с семью рейд-контроллерами и дисковый массив объемом 860 Гбайт, двадцатикилограммовый блок питания и сам сервер… В итоге можно было выйти на суммы от 270 до 500 тысяч долларов, а если прибавить сюда уровень инфляции за эти годы, то сейчас эти значения будут составлять от 435 до почти 800 тысяч долларов.
С точки зрения производительности нынче любой низкобюджетный компьютер будет быстрее этого монстра, но сам факт наличия такой возможности в 2020 году — ощутить всю мощь того времени, делает эти большие числа малозначимыми, куда важнее найти и собрать такого монстра.
Ранее в рамках «Проекта36» я изучил производительность с шестью процессорами Intel Pentium Pro с частотой 200 МГц и кэш-памятью второго уровня 256 Кбайт и даже разогнал все шесть экземпляров до 240 МГц. А также шесть топовых Intel Pentium Pro черного цвета с частотой 200 МГц и кэш-памятью второго уровня 1024 Кбайт, которые удалось разогнать до 233 МГц.
В моей конфигурации у меня было 2 Гбайт оперативной памяти стандарта FPM, 16 модулей по 128 Мбайт, которые инициализировались при прохождении начальной POST-процедуры целых 4 минуты с небольшим хвостиком.
реклама
Четыре гигабайта оперативной памяти довели бы эту цифру до 9 минут времени, что сопоставимо с разгоном поезда или взлетом самолета, хотя у последнего это получается намного быстрее. Но зато после загрузки в мое распоряжение поступали сразу шесть физических ядер, правда, без поддержки MMX и тем более SSE инструкций хотя бы первого поколения.
Процессор Intel Pentium II Overdrive 333 МГц
Основу любых компьютеров составляют центральные процессоры. Процессоры Intel Pentium Pro впервые появились 1995 году. Тогда существовали и обычные «Пентумы» без приставки Pro, но данный префикс в наименовании моделей говорил о том, что данные процессоры позиционируются в первую очередь как решения для серверов и рабочих станций со своим специальным разъемом Socket 8. Обычные Intel Pentium устанавливались в Socket 5 и 7.
Существенным отличием между Pro и обычной версии десктопного Pentium«ма являлось наличие кэш-памяти второго уровня у Pro версии, который работал на частоте ядра процессора, что позволяло значительно увеличить производительность.
реклама
У разных моделей Intel Pentium Pro объем L2 кэша варьировался от 256 Кб до 1 Мб. Кэш память первого уровня Pentium Pro составляла 16 Кб, из которых 8 Кб предназначалось для данных и столько же для инструкций.
У последующих Intel Pentium-II кэш-память второго уровня работала на половине частоты ядра процессора и ее объем составлял 512 Кб для всех моделей, а располагалась она в виде отдельных микросхем на картридже поодаль от самого ядра CPU.
реклама
Тестируемые процессоры производилась по 350 нм техпроцессу. Количество транзисторов у Pentium Pro насчитывало 5.5 млн. штук для самого процессорного ядра и целых 15.5 — 31 миллион приходился на кэш-память второго уровня, в зависимости от ее объема. Сам кэш второго уровня располагался на отдельном кристалле рядом с ядром CPU.
Процессор имел свободный множитель и частоту системной шины в зависимости от модели 60 либо 66 МГц. Разгон процессора упирался в разгон кэш-памяти второго уровня, именно она являлась сдерживающим фактором.
реклама
Intel Pentium II Overdrive 333 МГц был очень интересным процессором. Появился этот процессор, можно сказать, благодаря правительству США, которое финансировало программу по созданию суперкомпьютеров для целей моделирования ядерных взрывов и слежением за состоянием ядерного арсенала страны.
реклама
Правительство США выделило средства на постройку такого суперкомпьютера, Intel выиграла тендер и в 1997 году сдала под ключ суперкомпьютер под названием ASCI Red.
ASCI Red состоял из 9298 процессоров Pentium Pro c частотою 200 МГц, все модули суперкомпьютера располагались в 85 шкафах-стойках. Суммарный объем оперативной памяти составлял 594 гигабайта, дисковая подсистема состояла из 640 жестких дисков с суммарным объемом дискового пространства 2 терабайта.
реклама
ASCI Red был первым суперкомпьютером, который преодолел рубеж в 1000 GFLOPS или 1 терафлопс. Несколько лет подряд он возглавлял список TOP-500 самых быстрых суперкомпьютеров мира.
В 1999 году задачи моделирования усложнились и мощностей ASCI Red уже начало не хватать, нужен был апгрейд. Тендер опять выиграла Intel и благодаря этому событию на свет появился уникальный процессор с разъемом Socket 8 и мощью Pentium II — Intel Pentium II OverDrive с частотой 333 МГц.
реклама
Модернизированный ASCI Red второго поколения с 9632 процессорами после апгрейда обеспечил производительность на уровне 2.38 TFLOPS в тесте Linpack. Такие качественные характеристики позволили ASCI Red удерживать звание самого быстрого суперкомпьютера вплоть до июня 2000 года.
Intel Pentium II OverDrive, ставший завершающим этапом эволюции Socket 8, относился к шестому поколению процессоров Intel (P6). Процессор был анонсирован в августа 1998 года, несмотря на его специфичность рекомендованная стоимость процессора в партиях от 1000 штук составляла $599.
Физически данный процессор устанавливался в Socket 8, однако фактически перед нами Pentium II на ядре «Deschutes», дополненный 512-килобайтным кэшем второго уровня, работавшим на частоте ядра процессора. Встроенный в корпус Pentium II OverDrive VRM понижал подаваемое напряжение с материнской платы до требуемых 2 вольт.
Множитель у процессора заблокированный и равен 5, что в сумме с FSB 66,6 МГц дает итоговые 333 МГц. Существует две версии данного процессора первый со SPEC SL2KE, который оснащен активной системой охлаждения и SL3EA с пассивной.
Но самый большой плюс заключается не только в возросшей тактовой частоте процессора, но и в поддержке набора инструкций MMX и некоторых других.
Так как материнская плата поддерживает изменение множителя вплоть до х5.5, что в итоге дало бы 366 МГц, то я заодно изучил свойства инженерных образцов Intel Pentium II Overdrive 333 МГц со SPEC Q0125. Как мне сказал обладатель такого процессора, множитель даже у этой Engineering Sample заблокирован.
Может оно и к лучшему, так как приобрести шесть таких ES процессоров будет сопоставимо с покупкой любого топового современного CPU, но для начала их нужно сначала где-то еще найти в таком количестве.
Mendocino
Казалось бы, я потратил более года, чтобы найти и приобрести шесть процессоров Intel Pentium II Overdrive 333 МГц, которые в среднем сейчас продаются по $200 на всемирно известной барахолке, и получил максимальный конфиг ALR Revolution 6×6, но как всегда нет пределу совершенству. В названии этой статьи «Ретроклокинг: «Проект36» — практически финал истории» есть одно слово «практически», которое я специально употребил, так как есть еще один вариант, который может еще увеличить и без того космическую производительность.
Но боюсь, четвертая часть выйдет в 2025-м году, либо вообще останется на бумаге, так как это решение еще более финансово затратное и самое главное, экстремально трудно реализуемое. Но об этом чуть ниже.
Mendocino — это название ядра процессоров Celeron, выпускавшихся с 1998 года в исполнении SEPP (Slot1) и пластиковых PGA (Socket 370). В 1999 году Intel отказалась от Slot1 разъема в пользу привычного всем PPGA.
Пластиковые процессоры Celeron были дешевле в изготовлении, изготовлялись по технологии 250 нм и имели встроенную кэш-память второго уровня объемом 128 Кб, работающую на полной скорости ядра процессора. Частотный диапазон варьировался от 300 до 533 МГц.
А причем тут вообще Celeron Mendocino? Дело в том, что запустить процессоры Celeron в SMP (Symmetric Multiple Processor) возможно и этим занимались энтузиасты еще достаточно давно. Celeron по своей сути имеет ядро полноценного Pentium II, который, как известно, SMP поддерживает. Разница этих процессоров только в кеш памяти второго уровня, у Celeron L2=128 Кб, но зато частота может достигать более высоких значений 533 МГц против 450 у Pentium II.
Поддержка SMP заключается в наличие сигнал BR#1, который в самом процессоре физически присутствует, но не был разведен на материнских платах. Как только этот секрет был обнаружен, решение проблемы SMP не заставило себя долго ждать. Энтузиасты брали в руки паяльник, а проникшиеся этой идеи производители материнских плат ABIT и QDI даже выпустили свои серийные продукты. Достаточно вспомнить материнскую плату ABIT BP6 на чипсете Intel 440BX с двумя Socket 370.
Далее, существует один адаптер компании Powerleap модель PL-ProII, который как раз позволяет устанавливать процессоры Intel Celeron в исполнении Socket 370 в Socket 8 материнские платы.
Поэтому теоретически возможно установить шесть Intel Celeron с частотой 533 МГц, что суммарно даст нам 3200 МГц. Я, конечно, не знаю, будут ли работать все шесть процессоров, но шанс есть неплохой. Сколько я не бороздил просторы интернета, но реализации таких причудливых идей я не нашел. Шесть Celeron«ов я смогу найду без труда, а вот шесть Powerleap PL-ProII вряд ли.
У меня был один такой адаптер, но его пришлось продать, чтобы реализовать «Проект36», как и часть других моих экспонатов. Поэтому если у кого-то есть такой, либо знают, где найти за вменяемые деньги напишите мне в ЛС на форуме.
Продолжаем фантазировать : D В свою очередь если расширить еще дальше границы воображения, и в адаптер от Powerleap установить еще один адаптер с поддержкой процессоров Pentium III на ядре Tualatin, то кто знает что может получится вообще на выходе, возможно такой вот бутерброд.
Идея получилась интересной, так что я не оставляю надежд, что четвертая часть когда-нибудь все же будет опубликована.
Windows Vista Server
Заполучив в свое распоряжение шесть Intel Pentium II Overdrive 333 МГц, которые уже обзавелись поддержкой MMX инструкций и поднялись еще на одну ступень эволюции по процессорной лестнице, мне захотелось попробовать установить еще более современную операционную систему.
Напомню, в прошлый раз мне удалось поставить операционную систему, отличную от рекомендованных: Microsoft Windows NT Server 4.0 Enterprise, Microsoft Windows 2000 Advanced/Datacenter Server, которые в полной мере не позволяют запускать программы и тесты, написанные для народно-любимой Windows XP. В результате длительных экспериментов получилась вот такая ОС: «Windows .Net Enterprise Server. Build 2600 Service Pack 2», которая представляет собою подобие серверной операционный системы с ядром Windows XP.
В этот раз я хотел поднять планку еще выше и нацелился на семейство операционных систем на ядре Windows Vista. Идеальным вариантом являлся Windows Server 2008 Enterprise Edition (x86), но вначале я решил попробовать установить Windows Server 2003 Enterprise Edition.
Хотя на бумаге было написано про аппаратную ошибку в ядре CPU процессоров семейства Intel Pentium Pro и ранних Penitum-II и связанную с этим проблемой «утечки» памяти и невозможности работы в SMP режиме вышеуказанных процессоров, я решил на практике это проверить.
Итог сего эксперимента предсказуем — шесть Intel Pentium II Overdrive 333 МГц не будут работать в составе ALR Revolution 6×6 под управлением семейства ОС Windows Server 2003. Видится только один CPU. А жаль, вот так одна хардварная ошибка ставит крест на счастливом будущем таких интересных процессорах.
Следующим этапом была установка Windows Server 2008 Enterprise Edition. По многим параметрам минимальной конфигурации ALR Revolution 6×6 советовал тем требованиям, необходимым для успешной установки этой операционной системы. Процесс установки благополучно начался, файлы начали копироваться с DVD-ROM«a на SSD.
Но после ребута я увидел такое окно:
Опять ACPI… Говоря, что мой конфиг почти соответствовал всем минимальным требованиям, я не упомянул что начиная с ОС Windows Vista все ядра этой и последующих операционных систем являются ACPI совместимыми, иными словами без поддержки ACPI со стороны железа ничего не получится. И ответ тут кроется в BIOS ALR Revolution 6×6, который был выпущен задолго до появления ACPI.
Но все же шанс установки присутствует, но для этого нужно вмешательство в код BIOS, а я все никак не обзаведусь программатором. Еще во времена Socket 7, когда первая ревизия ACPI начала появляться, производители материнских плат выпускали новые версии своих BIOS с поддержкой этой технологии. Я проходил это на примере материнской платы Asus P5A на чипсете Ali ALADDiN V для процессоров Socket 7, когда был выпущен ACPI BIOS Revision 1006. Благодаря чему стала возможна установка на эту материнскую плату с процессором AMD K6–2+ Microsoft Windows 7×86.
Альтернативный вариант решения данной проблемы был в поисках ранних сборок Windows Vista Server. Первоначальный проект данной разработки носил имя «Longhorn».
Образ был найден в сети, записан на DVD и процесс установки пошел:
Все шло как обычно, файлы копировались, но по завершению процесса копирования и ребута меня ждала все та же ошибка с ACPI.
Опять изрядно потратив время я решил, что начну поиск ядрер операционной системы без поддержки ACPI в ранних версиях Windows Vista или проекта «Longhorn». Возможно они существуют. Если установился любой ранний билд, то далее будет проще с реализацией поддержки SMP. Я попробовал разные билды: 4042, 5098, а также bett«у 2-й версии. Должно было получиться вот так:
Но успешность данного мероприятия все равно закончилось поддержкой ACPI со стороны моей тестовой системой. Все опробованные билды все равно требовали поддержку ACPI. В итоге я пока эту идею отложил в долгий ящик и решил провести все тесты на проверенной Windows XP подобной ОС, где себя прекрасно чувствовали шесть Intel Pentium Pro. Чтобы решить данную задачку одной головы мало, поэтому ценные идеи можно написать как в обсуждении к данной статье, так и напрямую мне в ЛС на форуме.
Тестовый стенд
В тестовой конфигурации использовались следующие комплектующие.
- Процессоры:
- 6 x Pentium II Overdrive 333 МГц, L2=512 Кб;
- 6 x Pentium Pro 200 МГц, L2=1024 Кб;
- 6 x Pentium Pro 200 МГц, L2=256 Кб;
Тестирование производительности проводилось в Windows Whislter .Net Advanced Enterprise Server, Build 2600, Service Pack 2, 3 in 1, авторское издание с помощью следующего ПО:
- Super Pi mod. 1.5XS (задача 1M);
- PiFast v. 4.1;
- wPrime v. 1.43;
- HWBOT Prime v. 0.8.3;
- CPU-Z v. 1.87.0;
- WinRAR x86 v. 5.40;
- 7-Zip v. 16.04;
- AIDA64 5.50.3600;
- SiSoftware Sandra 2004 SP2;
- Cinebench 2003;
- Cinebench R10.
Результаты тестирования
Для начала — пара однопоточных тестов: Super Pi и PiFast.
Super Pi mod. 1.5XS
Время, минуты
Меньше — лучше
Включите JavaScript, чтобы видеть графики
Если сравнить производительность самого быстрого Pentium Pro с тактовой частотой 200 МГц и кэшем второго уровня объемом 1 мегабайт, то замена одного Pentium II Overdrive 333 МГц прибавляет дополнительно одну треть производительности. А если количество таких процессоров, как в ASCI Red — 9632 шт., то получается почти 3 миллиона процентов, если я все правильно подсчитал.
PiFast v. 4.1
Время, секунды
Меньше — лучше
Включите JavaScript, чтобы видеть графики
В данном тесте сохраняется прежняя динамика роста производительности между Pentium Pro и Pentium II Overdrive. Хотя этот тест больше любит тактовую частоту процессора, нежели объем кэша, отрыв от 400-мегагерцового Celeron у «Овердрайва» получился не сильно большим. Мне так и хочется установить в эту систему шесть таких Celeron.
wPrime v. 1.43
Время, секунды
Меньше — лучше
Включите JavaScript, чтобы видеть графики
Первый тест, который поддерживает многопоточность. Для данной статьи я решил не только измерить производительность шести Intel Pentium II Overdrive, но и посмотреть, на что способны пять и четыре процессора, благо система позволяет использовать даже нечетные конфигурации и неплохо при этом масштабируется.
Критерий производительности получился шесть к четырем, производительность шести Pentium Pro соответствует четырем Pentium II Overdrive, точнее даже разгонным до 233 МГц Pentium Pro. Шесть «Овердрайвов» достаточно оторвались от четырех серверных Xeon с тактовой частотой 400 МГц, либо их производительность равна одному AMD Athlon XP с PR рейтингом 2100+ и частотой 1733 МГц, выпущенному в начале 2002 года. Понадобилось чуть менее четырех лет, чтобы некогда космическая производительность стала обыденной (и с ценою процессора в двести с лишним долларов).
HWBOT Prime v. 0.8.3
Итоговый балл
Больше — лучше
Включите JavaScript, чтобы видеть графики
Если в прошлый раз производительность пары гигагерцовых Intel Pentium III Xeon была чем-то фантастическим, то теперь шести «Овердрайвам» удалось даже обойти эту пару, но до немного разогнанного (на 5%) представителя 64-х битной «новой» школы — AMD Athlon 64 3800+ на Socket 939 уже не добраться. Хотя между ними, надо сказать, уже технологическая пропасть.
WinRAR x86 v. 5.40
Кбайт/с
Больше — лучше
Включите JavaScript, чтобы видеть графики
Подсистема оперативной памяти от апгрейда у нас не изменилась, используется все та же 66 МГц Fast Page Mode память, но цифры все же подросли за счет грубой процессорной силы.
7-Zip v. 16.04
Итоговый результат, MIPS
Больше — лучше
Включите JavaScript, чтобы видеть графики
Здесь мы опять видим эффект 6 к 4 или паритет в производительности четырех «Овердрайвов» к шести Pentium Pro. Тягаться в архивировании с более современными противниками мешает медленная подсистема памяти, разогнать бы ее до 75 МГц…
AIDA64 5.50.3600
Теперь перейдем к результатам шести Intel Pentium II Overdrive 333 МГц в данном тестовом пакете.
Мой любимый тест Cache and Memory Benchmark. Посмотрите, как выросла скорость кэшей обоих процессоров. Слева направо: Pentium II Overdrive 333 МГц и Pentium Pro 200 МГц (L2=1024 Кб).
Cache and Memory Benchmark
Больше — лучше
CPU Queen, баллы
Больше — лучше
Догнать и перегнать Intel Pentium 4 удалось тестовой системе с шестью ядрами. Так высоко такие представители микроархитектуры Intel P6 еще не забирались.
FPU Julia, баллы
Больше — лучше
FPU VP8, баллы
Больше — лучше
SiSoftware Sandra 2004 SP2
Arithmetic benchmark, MIPS
Больше — лучше
Multi-media benchmark, it/s
Больше — лучше
Ну вот мы и добрались до самых всенародных мультипоточных числодробительных тестов — Cinebench!
Cinebench 2003
Баллы
Больше — лучше
Включите JavaScript, чтобы видеть графики
К вопросу, сколько ядер и какие лучше для рендеринга. Позади остался Pentium III-S 1400 МГц на ядре Tualatin-S, Socket 370. Это уже хорошо, хотя между ними времени прошло не так уж и много, но до двух Intel Pentium III EB 933 МГц в слотовом исполнении далековато.
Cinebench R10
Баллы
Больше — лучше
Включите JavaScript, чтобы видеть графики
Интересные показатели, не правда ли? Можете попробовать найти данный тест и посмотреть на свой результат. Финальный рендеринг предыдущей системой с шестью одномегабайтными Pentium Pro с частотой 200 МГц выполнился за 21 минуту и 14 секунд. Разогнанные до 233 МГц шесть ядер сократили это время до 18 минут и 13 секунд, а для шести Pentium II OverDrive понадобилось уже 13 минут и 32 секунды. Преимущество в 4 минуты 41 секунду, а если умножить это время на все количество процессоров в суперкомпьютере ASCI Red, то получим 31 день (24/7) чистой экономии времени или 1/12 года, а это уже ощутимо.
В прошлой статье я сравнивал шесть Pentium Pro с Intel Core i7–7800X, который отрендерил финальное изображение за 20 секунд. А за сколько секунд это сумеет сделать современный топ Intel — Core i9–10980XE? Мне удалось выяснить это благодаря помощи sewenstar, который является обладателем данного процессора.
Итак, с настройками по умолчанию тест выполнился за 11 секунд; при разгоне всех 18-ти ядер до 5 ГГц — за 9. И хотя Cinebench R10 поддерживает всего 16 потоков, все равно можно представить ту разницу, когда приходилось ждать на десктопном ПК по нескольку часов и буквально несколько секунд сейчас для выполнения одной и той же задачи.
И в виде небольшого бонуса приведу результаты встроенного теста CPU-Z:
Альтернативой увеличения производительности моей системы может стать ее разгон. Процессоры эти разгоняются, необходимо только правильно применить к ним усилие, но это уже совсем другая история.
Заключение
Настало время подвести итоги. Без сомнения, ALR Revolution 6×6 и ему подобные системы это просто фантастика. Использовать в домашних условиях такую машину где-то даже интересно.
На один процессор можно повесить сервер какой-нибудь сетевой игры (например, C&C, StarCraft или Counter-Strike), на другом будет запущен сам клиент этой игры, на третьем — второй, на четвертом будет поигрывать mp3 в Winamp, и еще останется пара свободных ядер, которые всегда можно чем-то нагрузить в фоне. Двух или четырех гигабайт оперативной памяти с лихвой должно хватить под эти и другие задачи.
Пока у меня только одна проблема — чем занять восемь свободных слотов PCI? Выслушаю все ваши предложения на этот счет в обсуждении к данной статье.
Для своего времени такая производительность было недостижимой для большинства организаций ввиду конечной стоимости таких систем. Но самое интересное, что с конца 90-х годов прошлого века прогресс стремительно набирал обороты и буквально через 4–5 лет, одноядерные процессоры для домашнего применения, стоимостью в сотни раз дешевле, обскакивали этого монстра.
Что же мы имеем сейчас объяснять не надо. Процесс прогресса в последние 7 лет значительно замедлился, однако, со времен «возвращения» AMD в народ с народной маркой «Ryzen» и корпоративной «Epyc» процесс значительно оживился. И это не может не радовать. Возможно, через пару лет тест Cinebench R10 выполнится на NexGen процессоре за 1 секунду, тогда можно будет считать, что будущее уже наступило.
Я же точку ставить в этом эксперименте не хочу, пока есть куда стремиться я буду стараться это осуществить, хотя это становится с каждым годом все сложнее и сложнее. Всем, кому понравился данный эксперимент и есть желание помочь с 4-й частью буду рад видеть в своей теме.
Полный текст статьи читайте на overclockers.ru