FirstVDS / FirstDEDIC corporate blog
Computer hardware
CPU
11 April

Чего ждать от новых Xeon E. Сравниваем с E3 и делаем выводы



Продолжаю тестировать процессоры. В этот раз моё внимание целиком и полностью переключилось с десктопных Core на серверные Xeon. Что, надо признаться, не случайно. Во-первых, меня об этом горячо просили в комментариях к прошлой статье, а во-вторых, наш парк пополнился свежими Xeon E — мы решили обновить линейку однопроцессорных выделенных серверов и прикупили E-2134 и E-2136 как альтернативу E3-12XX.

Изначально у меня были наполеоновские планы. Так как наша «коллекция» Xeon E3-12xyVz, где «z» принимает значение от 2 до 6, охватывает процессоры от Ivy Bridge до Kaby Lake, мне стало интересно сравнить их между собой и с новым семейством Xeon E.

Но оценив объём предстоящей работы, я решил понизить градус амбициозности и оставить из представителей Xeon E3 лишь два предыдущих семейства: Xeon E3-12xxV5 и Xeon E3-12xxV6. Вместе с новыми Xeon E все три семейства фактически построены на одной архитектуре, одном технологическом процессе и, спасибо Интелу, одном процессорном сокете FCLGA1151.

Более того! В наличии оказались процессоры из двух предыдущих семейств, пересекающиеся по базовой частоте и частоте в «бусте», что, на мой взгляд, большая удача :) В комментариях к предыдущей статье прозвучала просьба от читателей — сравнить разные семейства на одной частоте, чтобы увидеть чистый прирост микроархитектурных изменений. Идея показалась мне интересной и, возможно, когда-нибудь я вернусь к Core, чтобы воплотить её в жизнь. А пока решил адаптировать к тому, что есть под рукой, и посмотреть, как поведут себя Xeon с одинаковыми частотами.

Тестирование

В тестировании участвуют восемь процессоров из трёх семейств:
Skylake — Intel E3-1230v5, E3-1240v5, E3-1270v5,
Kaby Lake — E3-1230v6, E3-1240v6, E3-1270v6,
Coffee Lake — E-2134 и E-2136.



Тактико-технические характеристики платформ

Серверы с процессорами Intel E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6 и E3-1270v6 имеют одинаковую базовую конфигурацию:

  • Материнская плата: Supermicro X11SSE-F (2.2 BIOS).
  • Оперативная память: 16 Гб Micron Technology (DDR4-2666) ECC — 2 штуки.
  • SSD-накопитель: Intel DC S4500 480 Гб — 2 штуки в RAID1.

Серверы с процессорами Intel E-2134 и E-2136 также работают на одинаковой платформе:

  • Материнская плата: Supermicro X11SCE-F (BIOS 1.0a).
  • Оперативная память: 16 Гб Micron Technology (DDR4-2666) ECC — 2 штуки.
  • SSD-накопитель: Intel DC S4500 480 Гб — 2 штуки в RAID1.

Программная часть: ОС CentOS Linux 7 x86_64 (7.6.1810)
Ядро: 3.10.0-957.5.1.el7.x86_64
Внесённые оптимизации относительно штатной установки: добавлены опции запуска ядра elevator=noop selinux=0.
Тестирование производится со всеми патчами от уязвимостей Spectre, Meltdown и Foreshadow, бэкпортироваными в данное ядро.

Тесты, которые использовал для исследования:

  1. Sysbench
  2. Geekbench
  3. Phoronix Test Suite

Более подробное описание тестов можно найти в предыдущей статье. Взял тот же набор плюс Timed GCC Compilation, который добавил по просьбам читателей. А пока кратко о том, что и чем замерял.

Тест Sysbench
Тест многопоточный, во все ядра. Замерял один показатель — CPU speed events per second, который означает количество выполненных процессором операций за секунду — чем выше значение, тем производительнее система.

Тест Geekbench
Измерял два основных показателя, построенных на результатах нескольких тестов: Single-Core Score и Multi-Core Score, — одно- и многопоточные тесты. Единицы измерения — абстрактные «попугаи». Чем больше «попугаев», тем лучше.

Тест Phoronix Test Suite
Из большого набора взял только 10 — те же, что и в прошлый раз — и к ним, как я уже говорил выше, добавил Timed GCC Compilation. В итоге получилось 8 многопоточных тестов и 2 однопоточных (Himeno и LAME MP3 Encoding).

В этих тестах чем показатель больше, тем лучше

  1. Тест John the Ripper для подбора паролей. Возьмём криптоалгоритм Blowfish.
  2. Тест Himeno — линейный решатель давления Пуассона, использующий точечный метод Якоби.
  3. 7-Zip Compression — тест 7-Zip с использованием p7zip с интегрированной функцией тестирования производительности.
  4. OpenSSL — это набор инструментов, реализующих протоколы SSL (Secure Sockets Layer) и TLS (Transport Layer Security). Измеряет производительность RSA 4096-бит OpenSSL.
  5. Apache Benchmark — измеряет, сколько запросов в секунду может выдержать данная система при выполнении 1 000 000 запросов, при этом 100 запросов выполняются одновременно. Единицы измерения — запросы в секунду.

А в этих если меньше, то лучше — во всех тестах измеряется время его прохождения.

  1. C-Ray тестирует производительность CPU на вычислениях с числами с плавающей запятой. Это многопоточный тест (16 потоков на ядро).
  2. Parallel BZIP2 Compression — измеряет время сжатия файла (пакет .tar исходного кода ядра Linux) с использованием сжатия BZIP2.
  3. Тест LAME MP3 Encoding выполняется в один поток.
  4. Тест ffmpeg x264 — многопоточный.
  5. Timed GCC Compilation. В первой моей статье в комментариях читатели просили добавить тест, связанный с компиляцией из исходников. Этот тест именно для вас :-) Он показывает, сколько времени занимает сборка компилятора GNU GCC (версия 8.2.0). Единицы измерения — секунды.

Итак, я собрал на одном тестовом стенде представителей трёх семейств — Skylake, Kaby Lake и Coffee Lake. У всех процессоров, кроме нового E-2136, по четыре ядра и восемь потоков в HT, а также одинаковый суммарный объём кэш-памяти. Все процессоры имеют двухканальную память с поддержкой ECC и близкие базовые частоты. Как и в предыдущей статье, обращаю внимание, что процессоры трёх разных семейств построены на одной архитектуре. Соответветственно, «балом должны править частоты, ядра и потоки».

Но в этот раз будет ещё интереснее: у всех этих семейств разные поддерживаемые частоты при работе с оперативной памятью — 2133, 2400 и 2666 соответственно, а также разный теплопакет. Любопытно посмотреть, как это повлияет на результаты тестов и повлияет ли вообще. Конечно, предполагаю, что чем выше частота работы с ОЗУ, тем лучше процессор будет проходить тесты.

Особый интерес вызывают E3-1240v5 и E3-1230v6 с одинаковыми частотами: базовой 3,50 ГГц и 3,90 ГГц в Турбобусте. Предполагаю, что они должны показать идентичные или близкие результаты, так как отличаются только теплопакетом и частотой памяти.

Что же касается моих прогнозов относительно Xeon E, думаю, что результаты однопоточных тестов E-2134 и E-2136, также должны быть одинаковыми или очень близкими по показателям — хоть базовая частота и отличается, но частоты в «бусте» у них совпадают. Ну и конечно результаты обоих Xeon E, я уверен, будут лучше их предшественников: 4.5 ГГц на максималках и 6 ядер у E-2136 однозначно себя покажут. А теперь «будем посмотреть», насколько я окажусь прав.

Результаты тестов



В тесте Sysbench E3-1240v5 и E3-1270v5 идут вровень. С E3-1230v6 начинается рост, который заканчивается резким взлётом Е-2136. E-2136 на 36% лучше в данном тесте, чем E3-1270v6, и на 43%, чем E3-1230v5. E-2134 всего на 4% обгоняет E3-1270v6 и на 14% E3-1230v5. Разница у E3-1240v5 и E3-1230v6 на 2,4% в пользу E3-1230v6.




В однопоточном тесте Geekbench наблюдается рост в пределах каждого семейства, за исключением семейства Xeon E: E-2134 обгоняет E-2136 на 4,5%.

В многопоточном тесте тенденция роста сохраняется во всех трёх семействах: E-2136 на 14,6% обгоняет E-2134. В однопоточном тесте E3-1240v5, E3-1270v5 и E3-1230v6 идут вровень, а в многопоточном E3-1230v6 обгоняет E3-1240v5 на 2,5%

Ссылки на результаты тестов Geekbench:

Xeon E3-1230v5
Xeon E3-1240v5
Xeon E3-1270v5
Xeon E3-1230v6
Xeon E3-1240v6
Xeon E3-1270v6
Xeon E-2134
Xeon E-2136



Результаты многопоточного John The Ripper очень похожи на результаты теста Sysbench: E3-1240v5, E3-1270v5 и E3-1230v6 выдают почти одинаковые показатели и E-2136 на 33% быстрее, чем E-2134. Хорошо виден стабильный прирост в показателях E3-1240v6, E3-1270v6 и переход на следующее поколение — E-2134.



В тесте C-ray самый высокий результат у E-2136, самый низкий — у E3-1230v5, что вполне логично хронологически. Второе место у новинки E-2134. А вот E3-1240v5, E3-1270v5 и E3-1230v6 опять идут вровень.



Однопоточный тест Himeno почти в точности повторяет результаты однопоточного теста Geekbench: наблюдается рост в пределах каждого семейства, за исключением Xeon E: E-2134 обгоняет E-2136 на 2,4%. Разница между E3-1240v5, E3-1270v5 и E3-1230v6 на уровне погрешности.



В тесте 7zip наблюдаем красивую «лестницу» и рост во всех семействах. Разница между E3-1240v5, E3-1270v5 на уровне погрешности. E3-1230v6 почти на 4% лучше проходит этот тест, чем E3-1240v5. E-2134 на 21% опережает E3-1230v5, на 16% — E3-1270v5 и на 6,6% — E3-1270v6. А E-2136 — лучше всех :-)



Аналогичная тенденция наблюдается в тесте pbzip2, выбивается лишь E3-1230v6.



Хотелось бы сказать, что тест mp3 показывает равномерную «лестницу вниз», но разница даже между крайними в графике E3-1230v5 и E-2136 всего 9,5%, так что называть это «лестницей» не очень-то правильно. Тем более, что E3-1230v6 вносит свои коррективы, а E3-1240v5 и E3-1270v5 только добавляют графику пологости.



В многопоточном тесте ffmpeg «лестница вниз» уже без всплесков и с почти ровной площадкой в районе E3-1240v5, E3-1270v5 и E3-1230v6. E-2136 в этом тесте лучше E-2134 на 19%, E3-1230v5 на 32%, E3-1270v5 на 29% и E3-1270v6 на 22%.



Тест OpenSSL показывает «лестницу вверх» с площадкой на E3-1240v5, E3-1270v5, E3-1230v6 и заметным отрывом на E-2136. E-2134 на 14% лучше E3-1230v5.
E-2136 на 43% опережает E3-1230v5, на 36% — E3-1270v6 и на 33% — E-2134.



В тесте Apache разница между процессорами семейства V5 минимальна. В семействе V6 «лестница вверх»: E3-1270v6 на 8,8% лучше, чем E3-1230v6. Семейство Xeon E продолжает тенденцию роста и добавляет «ступеней»: E-2136 на 3% обгоняет E-2134, на 8% опережает E3-1270v6 и на 22% — E3-1270v5. Разница между первым представителем V5 и новым E-2136 составляет 24%. E3-1240v5 и E3-1270v5 на уровне погрешности. Заметный скачок на переходе от семейства V5 к V6: разница между E3-1230v6 и E3-1240v5 в 7%.



В тесте на время компиляции GCC последнее место у E3-1230v5, предпоследнее место делят между собой E3-1240v5 и E3-1270v5. Победа остаётся за шестиядерным E-2136.



Если в предыдущей статье, где тестировал Core, я писал, что не удивлён результатами — они были предсказуемы, то и в этот раз не удивлён :-)

Но сначала немного предыстории.

Надо сказать, что все тесты для E3-1230v6 мне пришлось переделать. И все из-за того, что в первый раз я допустил ошибку — представитель из семейства V6 прошёл тестовый полигон с ОЗУ в одноканальном режиме. В итоге вложенный индекс в тесте Geekbench — Memory Score, получился ниже, чем у E3-1240v5, что сильно повлияло на общий результат всего теста. E3-1240v5 по показателям значительно обгонял E3-1230v6.

Аналогичная картина нарисовалась во всех однопоточных тестах. Долго морщил мозг, чтобы дать хоть сколько-нибудь внятное объяснение сложившейся ситуации (и даже нашёл его!), пока не протёр глаза и не переделал все тесты, но уже с двухканальной памятью. А теперь к выводам.

Ожидания vs реальность

Первое, что я ожидал увидеть, так это одинаковые показатели у E3-1240v5 и E3-1230v6. И увидел. Во всех тестах, кроме mp3 и pbzip2, E3-1230v6 лучше или равен E3-1240v5. Лично я не считаю, что это чистый прирост микроархитектуры. Скорее всего, такой результат получается за счёт большей тактовой частоты оперативной памяти. Одно могу сказать точно: память в одном канале существенно влияет на результаты в тестах, так что будьте внимательны :)

Вторая моя гипотеза касалась двух представителей семейства V5 — E3-1240v5 и E3-1270v5. Честно говоря, надеялся обнаружить между ними хотя бы небольшую разницу, но по итогам тестирования она оказалась никакая от слова совсем. Влияние дополнительных 100 MHz приходится искать под микроскопом в подавляющем большинстве тестов.

При этом те же 100 MHz вполне видны невооружённым глазом при сравнении E3-1270v5 и E3-1240v6. Полагаю, опять же, сказываются частоты памяти.

Переходим к свежим Xeon E. Я был совершенно не готов к тому, что в однопоточных тестах E-2136 будет уступать E-2134. Хоть базовая частота у старшей модели и ниже на 200 MHz, но частота в «бусте» у них одинаковая. Я повторил каждый тест по несколько раз с каждым процессором, чтобы получить ожидаемый мной результат, но достичь его так и не смог :) Очень не люблю делать выводы и заключения, поэтому с удовольствием узнал бы мнения уважаемых читателей: с чем могут быть связаны такие необычные результаты?

Вот где ожидания совпали с реальностью, так это при сравнении нового семейства Xeon E с предшественниками — тут прогнозы, что новые Е обойдут старых добрых Е3 просто подтвердились тестами. И если четырёхъядерный E-2134 делает это за счёт более высокой частоты в «бусте», то E-2136 ещё сильнее отрывается за счёт своих честных шести ядер.

В целом, картина получилась следующая. Новые Xeon E действительно можно рассматривать как хорошую альтернативу семейству Е3. Тем более, что стоят они почти столько же, сколько V6 — производительность выше за те же деньги. Если же ищете более бюджетный вариант, то можно смело выбирать из тройки E3-1240v5, E3-1270v5 и E3-1230v6. По результатам тестов, они оказались вполне взаимозаменяемыми.

В тестировании использовались серверы на базе процессоров Intel Xeon E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6, E3-1270v6, E-2134 и E-2136 с 1dedic.ru.

До 1 мая серверы с новыми Xeon E можно заказать со скидкой 25% на 1 месяц по промокоду XEONE_HABR. Промокод сгорит в полночь 30 апреля 2019 года.

Для любого выделенного сервера скидка 10% при оплате за год.

Для вас тестировал и писал Trashwind, системный администратор FirstDEDIC.

+16
14k 23
Comments 17
Top of the day