TashaFridrih May 31 2018 at 16:46

Второе поколение AMD Ryzen: тестирование и подробный анализ

57 min

56K

ua-hosting.company corporate blogComputer hardwareCPU

Translation

С окончанием 2017 года, в котором процессор Ryzen стал одним из самых успешных продуктов AMD, возник закономерный вопрос: что же дальше? В начале 2018 года были озвучены планы: Ryzen второго поколения должен появиться в середине года, после чего выйдет второе поколение Threadripper, на 12-нм процессе GlobalFoundries. Это еще не следующая новая микроархитектура AMD, которая, как мы знаем, будет Zen 2 на 7 нм техпроцессе. Это выпуск компонентов с некоторыми улучшениями, плюс возможность использовать производственный процесс, который позволяет поднять лимит частоты и производительности. Сегодня AMD запускает четыре процессора, мы протестировали их все.

Сразу к сути: новые процессоры

Для читателей, которые желают сразу перейти к сути, сообщаем: AMD запускает Ryzen 7 2700X, Ryzen 7 2700, Ryzen 5 2600X и Ryzen 5 2600.

Теперь Ryzen 7 2700X занимает первое место, смещая с пьедестала Ryzen 7 1800X, и ценой дополнительных 10 Вт TDP выдает базовую частоту 3,7 ГГц и турбо частоту 4,3 ГГц на восьми ядрах с одновременной многопоточностью. Это дополнительно +100 МГц и +300 МГц соответственно, что выше средних пределов разогнанного 1800X.

Важная новость: с 2700X AMD снизила максимальную стоимость топового процессора AM4 Ryzen: при запуске 1800X стоил 499 долларов и поставлялся без кулера. Да, совсем недавно 1800X упал в цене до 349 долларов, чтобы составить конкуренцию мощным процессорам Intel. 2700X заткнул за пояс обоих чемпионов, выйдя на рынок с рекомендованной розничной ценой 329 долларов США, к тому же в комплекте с лучшим кулером бизнес класса: AMD Wraith Prism RGB. AMD решительно наступает по всем фронтам: агрессивное ценообразование, максимальная производительность и лучшая комплектация, все за один раз и в одном продукте.

Ryzen 5 2600X — это шестиядерный вариант процессора, также с агрессивной частотной стратегией: 3,6 ГГц и 4,2 ГГц турбо. При 95 Вт TDP и рекомендованной розничной цене $ 229 он поставляется в комплекте с кулером AMD Wraith Spire, который, опять же, является весьма впечатляющим стоковым продуктом.

Ryzen 7 2700 и Ryzen 5 2600 — это 65-ватные версии X-аналогов, предлагающие почти те же частоты на 30 долларов дешевле. Все процессоры будут поддерживать двухканальную память DDR4-2933, что выше максимальной частоты поддержки памяти DDR4-2666 процессоров Ryzen 2017 года. Одно из главных изменений заключается в том, что теперь каждый процессор поставляется в комплекте с кулером, начиная от моделей Silent 65W Stealth и заканчивая большим Prism RGB, каждый из которых достаточен для стабильной работы процессора в турборежиме.

Планируемая AMD линейка AM4 Ryzen теперь будет выглядеть следующим образом:

Взлетая на вершину Олимпа, 2700X лишает первенства 1700X и 1800X. AMD пересмотрела свою линейку продуктов и заменила три продукта прошлого поколения двумя новыми Ryzen, возможно, исходя из показателей продаж. Как будет видно из нашего обзора, 2700X выжимает из текущего кремниевого процесса все до предела.

Полный список в конечном счете представляет собой сочетание процессоров серии Ryzen 2000 (новые), APU Ryzen серии 2000, плюс пара продуктов серии Ryzen 1000. Мы уже подробно изучили APU в недавних обзорах, и показали, что они вполне успешно заменили некоторые из оригинальных моделей первого поколения. Итак, четыре новых процессора серии 2000 теперь занимают вершину списка, но AMD часто фокусируется на новых продуктах, поэтому со временем (вполне вероятно) появится еще несколько новинок серии 2000.

Другая информация из сегодняшнего обзора

Конечно, наш обзор только начинается, ведь мы еще не поговорили об опциях. AMD использует 12-нм производственный процесс GlobalFoundries, преимущества которого очевидны. Имеется множество улучшений встроенного ПО, обновленные функции и роли для технологий AMD Precision Boost и XFR, которые могут иметь непосредственное влияние на производительность. Есть новый чипсет (вместе с 30 + материнскими платами), готовый работать с новой линейкой процессоров, а также новые или переименованные функции, такие как StoreMI. Мы хотим изучить, как эти новые продукты вписываются в долгосрочные планы AMD и соответствуют ли им в целом.

Рассмотрим эти вопросы в статье. Здесь же вы найдете и результаты тестирования.

Конкурент AMD Ryzen 2000: Intel’s Coffee Lake

В рамках запуска нового продукта, AMD предоставила обширную информацию о тестировании своих новых чипов. Из представленных данных было совершенно ясно, что новые процессоры нацелены составить конкуренцию самым современным процессорам Intel: Coffee Lake. Это контрастирует с тем, что серия Ryzen 1000, вышедшая в прошлом году, противопоставляла восьмиядерный Ryzen 7 1800X Интеловскому 8-ядерному Broadwell-E: примерно в это время Intel обновила основную линейку процессоров до шести высокочастотных ядер.

В итоге, теперь AMD предлагает сравнить Ryzen 7 2700X с Core i7-8700K и Ryzen 5 2600X с Core i5-8500K. Это важный момент — сейчас оба основных игрока на рынке процессоров x86 столкнули свои последние продукты друг против друга, лоб в лоб. Такого не случалось уже несколько поколений. Тем не менее некоторые показатели остались на своих местах с выпуска прошлого года:

Ожидается, что Intel имеет преимущество в частоте и IPC
AMD не особо отстанет по частоте и предложит больше ядер по той же цене

Корона многопоточности AMD особенно сверкает на внутреннем тестировании, однако производительность одного потока все еще отстает от конкурента. Ряд новых функций серии Ryzen 2000 должен исправить ситуацию: несколько более высокий IPC, более высокие частоты, более высокий TDP и улучшенная модель динамического повышения частоты. Мы рассмотрим их на следующих нескольких страницах.

Частота и количество ядер – это лишь часть уравнения. То, что AMD и Intel имеют разные модели кэша, сыграет значительную роль. Один из моментов, который мы увидим в этом анализе, — это сравнительные показатели кэш-памяти, и настройка, которую AMD сделала, чтобы закрыть проблемные места. Что касается цены, AMD Ryzen 7 2700X дешевле i7-8700K, + добавлен кулер Wraith Prism RGB, который легко заменяет кулер стоимостью 30-40 долларов, экономя деньги потребителя.

Показатели Ryzen 5 2600X и Core i5-8600K более схожи, чем у их старших братьев. Эти процессоры не отличаются количеством ядер, хотя у Ryzen 5 вдвое больше потоков. Для любой многопоточной рабочей нагрузки, которая в состоянии использовать одновременную многопоточность, это, вероятно, важный показатель. Core i5-8600K имеет чуть более высокую частоту ядра и, как и ожидалось, преимущество IPC. Опять же, AMD предлагает процессор, оснащенный хорошим кулером, тогда как предложение Intel – «голый» процессор.

В целом, AMD заявляет, что ее новые высококлассные процессоры покажут результаты в пределах 1-2% от конкурентов при играх 1440p, но дадут прирост 20% в «творческой производительности». У нас есть несколько способов проверить это.

Статьи в этом обзоре:

AMD запускает Ryzen 7 2700X, Ryzen 7 2700, Ryzen 5 2600X и Ryzen 5 2600
Говоря о 12nm и Zen +
Усовершенствование иерархии кэша
В переводе на IPC (instructions per cycle): все это ради 3%?
Precision Boost 2 и XFR2: Нужно больше герц
Новые чипсеты и материнские платы X470
StoreMI путь к более быстрому JBOD
Параметры тестирования
Системные тесты CPU
CPU Rendering Tests
CPU Web Tests
CPU Encoding Tests
CPU Office Tests
CPU Legacy Tests
Gaming Performance: Civilization 6
Gaming Performance: Shadow of Mordor
Gaming Performance: Rise of the Tomb Raider
Gaming Performance: Rocket League
Gaming Performance: Grand Theft Auto
Выводы: бремя конкуренции

Говоря о 12nm и Zen +

Одним из основных моментов запуска серии Ryzen 2000 является то, что эти процессоры используют производственный процесс GlobalLoundries 12LP, после процесса 14LPP первого поколения процессоров Ryzen. Как AMD, так и GlobalFoundries обсудили различия в процессах, однако стоит понимать, что цели компаний разные: AMD должна продвигать только то, что помогает ее продуктам, тогда как GlobalFoundries — крупный производитель полупроводниковой продукции с большой «клиентской базой», и может предоставлять цифры и данные «идеального сценария». В этом году мы были приглашены в GlobalFoundries Fab 8 (северной части штата Нью-Йорк), там мы смогли взять интервью у доктора Гэри Паттона, технического директора.

В этом интервью было освещено несколько интересных моментов. Во-первых, технический директор не обязательно должен заботиться о том, как называются определенные техпроцессы: их клиенты знают производительность данного процесса независимо от объявленной цифры «nm» на основании предоставленных им инструментов разработки. Во-вторых: 12LP представляет собой всего лишь несколько улучшенный процесс 14LPP – минорные изменения для улучшения производительности. Апгрейд получен в результате частичного оптического уменьшения и незначительного изменения правил производства в бек-энде и средней части производственного процесса. В прошлом такие изменения, возможно, не стали бы причиной столь громких новостей, однако клиенты GF хотят получить преимущество за счет улучшенного процесса.

В целом, GlobalFoundries заявила, что ее 12LP-процесс обеспечивает 10% -ное улучшение производительности и 15% -ное улучшение плотности элементов в сравнении с 14LPP.

Это было интерпретировано различными способами, такими как дополнительная 10% частота при той же мощности или более низкая мощность для той же частоты, или как возможность создавать чипы меньшего размера.

В рамках сегодняшнего запуска AMD разъяснила, что означал переход на 12LP процесс для серии Ryzen 2000:

Рост максимальной тактовой частоты на ~ 250 МГц (~ 6%)
Работа ядер в турбо режиме на частоте 4,2 ГГц
Снижение напряжения на ядре на ~ 50 мВ

AMD терпеливо объясняет, что на той же частоте новые процессоры серии Ryzen 2000 потребляют на 11% меньше энергии, чем серия Ryzen 1000, а это означает +16% производительности при той же мощности. Все же заявления немного неоднозначны, так как у AMD есть другие новые технологии в серии 2000, которые повлияют на производительность.

Один интересный момент заключается в том, что, хотя GF утверждает, что произошло улучшение плотности на 15%, AMD заявляет, что эти процессоры имеют те же размер матрицы и количество транзисторов, что и предыдущее поколение. В конечном итоге это, похоже, противоречит здравому смыслу – неужели AMD не захочет использовать меньшие матрицы, чтобы вместить больше чипов на пластину?

В конечном счете, новые процессоры являются почти точными копиями старых, как с точки зрения дизайна, так и микроархитектуры. AMD называет дизайн ядер Zen +, чтобы отличать их от дизайна предыдущего поколения Zen, в основном это связано с тем, как функции микроархитектуры расположены на кремнии. Многие из ключевых функций не изменились — они просто занимают меньше места, оставляя пустой кремний между элементами.

Вот очень грубое представление функций, привязанных к пути данных. Слева — дизайн 14LPP, и каждая из шести функций имеет определенный размер и подключается к шине. Между элементами находится «темный кремний» — неиспользуемый кремний, который либо рассматривается как бесполезный, либо может использоваться в качестве теплового буфера между элементами с высоким выделением энергии. Справа — представление дизайна 12LP: каждая из функций была уменьшена по размеру, попросту оставляя «темный кремний» между элементами (белые квадраты показывают оригинальный размер функции). В этом контексте количество транзисторов не изменилось, как и размер матрицы. Но если где-то в дизайне возникали термические ограничения из-за близости «горячих» элементов, теперь между ними расстояния больше, дабы элементы не мешали друг другу.

Для справки, AMD озвучивает размеры этих новых процессоров как 213 мм2, содержащие 4,8 миллиарда транзисторов, идентично дизайну кремния первого поколения. AMD подтвердила, что использует 9T-транзисторные библиотеки, как и в предыдущем поколении, хотя GlobalFoundries также предлагает дизайн 7.5T.

Итак, Zen +: новая микроархитектура или изменение технологического узла?

В конечном счете, ничего в большей части физического дизайна Zen + не является новым. Помимо изменения узла производственного процесса и вероятных незначительных корректировок, основные улучшения находятся в прошивке и поддержке:

Корректировка задержек кэша, приводящая к + 3% IPC
Поддержка увеличенной частоты DRAM для DDR4-2933
Улучшенные кривые напряжения / частоты, приводящие к + 10% производительности в целом
Улучшенная производительность при использовании Precision Boost 2
Лучшая тепловая реакция с XFR2

Усовершенствование иерархии кэша

Наибольшее внутреннее изменение у процессоров серии Ryzen 2000 — снижение времени ожидания кэша. AMD утверждает, что они смогли убрать один цикл из кэшей L1 и L2, несколько циклов из L3 и улучшить производительность DRAM. Поскольку чистая базовая IPC тесно переплетается с кэшами (размер, латентность, пропускная способность), эти цифры приводят AMD к утверждению, что новые процессоры могут обеспечить + 3% прирост IPC по сравнению с предыдущим поколением.

Цифры, предоставленные AMD:

13% улучшение латентности L1 (1.10ns против 0.95ns)
34% улучшение латентности L2 (4.6ns против 3.0ns)
16% улучшение латентности L3 (11.0ns против 9.2ns)
11% улучшение латентности памяти (74ns против 66ns на DDR4-3200)
Поддержка увеличенной частоты DRAM (DDR4-2666 против DDR4-2933)

Интересно, что в официальной презентации AMD упоминает латентность, измеряемую как время, хотя в частных беседах на нашем брифинге это обсуждалось в терминах тактовых циклов. В конечном счете латентность, измеряемая временем, может использовать преимущества других внутренних улучшений; однако настоящий инженер предпочитает обсуждать тактовые циклы.

Естественно, мы рассмотрели два аспекта этого уравнения: действительно ли показатели кэша ниже, и получим ли мы повышение IPC?

Так что там насчет кэша?

Для тестирования мы используем средство проверки латентности памяти на каждом шагу иерархии кэша одного ядра. Для этого теста мы использовали следующее:

Ryzen 7 2700X (Zen+)
Ryzen 5 2400G (Zen APU)
Ryzen 7 1800X (Zen)
Intel Core i7-8700K (Coffee Lake)
Intel Core i7-7700K (Kaby Lake)

Наиболее наглядно сравнение между процессорами AMD. Здесь у нас есть Ryzen 7 1800X первой серии, Ryzen 5 2400G APU, который объединяет ядра Zen с графикой Vega, и новый процессор Ryzen 7 2700X.

Этот график логарифмичен в обеих осях

Этот график показывает, что на каждой фазе дизайна кэша новейший Ryzen 7 2700X требует меньше циклов ядра. Самое большое различие заключается в латентности кэша L2, но L3 также имеет значительный прирост. Причина, по которой выигрыш L2 настолько велик, особенно между 1800X и 2700X, — весьма любопытна.

Когда AMD впервые запустила Ryzen 7 1800X, латентность L2 была протестирована и определена в 17 циклов. Это было довольно много — оказалось, что инженеры изначально предполагали, что L2-латентность будет 12 циклов, но нехватка времени для настройки прошивки и компоновки, прежде чем отправлять проект в производство, вынудила оставить 17 циклов как лучший компромисс, что бы дизайн был работоспособен и не вызывал проблем. С Threadripper и APU Ryzen AMD подправила дизайн достаточно, чтобы достичь латентности L2 в 12 циклов, однако в то время этот факт не освещался, несмотря на преимущества, которые он предоставляет. Теперь с серией Ryzen 2000 AMD сократила латентность до 11 циклов. Нам сказали, что это связано как с новым производственным процессом, так и с дополнительными настройками, обеспечивающими согласованность сигналов. В нашем тестировании мы фактически видели среднюю латентность L2 в 10,4 цикла, по сравнению с 16,9 циклами на Ryzen 7 1800X.

Разница в латентности L3 немного неожиданна: AMD заявила об уменьшении задержки на 16%: с 11,0 нс до 9,2 нс. Мы увидели изменение с 10,7 нс до 8,1 нс, что означает снижение с 39 до 30 циклов.

Конечно, мы не могли обойтись без сравнения AMD с Intel. И сравнение оказалось очень интересным. Теперь конфигурации кэша между Ryzen 7 2700X и Core i7-8700K различны:

AMD имеет больший кэш L2, однако кэш AMD L3 — это не инклюзивный victim-кэш, что означает, что он не может использовать предвыборку (prefetching) в отличие от кэша Intel L3.

Результат был неожиданный, ведь стало очевидным, что AMD имеет преимущество во времени ожидания в кэшах L2 и L3. В DRAM существует значительная разница, однако основные показатели производительности здесь находятся в нижних кэшах.

Мы можем расширить тест, включив в него три чипа AMD, а также ядра Intel Lake Lake и Kaby Lake.

Это график, использующий циклы, а не временную задержку. У Intel небольшое преимущество в L1, однако более крупные кэши L2 в проектах AMD Zen означают, что Intel достигнет более высокой задержки L3 раньше. И все же Intel делает свою работу быстро за счет малой задержки DRAM.

В переводе на IPC (instructions per cycle): все это ради 3%?

Вопреки распространенному мнению, увеличение IPC очень непростая задача. Попытка гарантировать, что каждый порт задействован в каждом цикле, требует наличия широких декодеров, больших очередей инструкций, быстрых кэшей и правильной конфигурации порта исполнения. Может показаться, что это легко скомпилировать, но как физика, так и экономика говорят «нет»: чип еще должен быть термически эффективным, и он должен приносить деньги компании. Каждое обновление дизайна процессоров будет направлено на то, что называют «низко висящими фруктами»: небольшие изменения, которые приносят наибольший выигрыш при минимальных усилиях. Обычно сокращение латентности кэша не является самой легкой задачей, а для инженеров не из «полупроводниковой» сферы (включая меня), это вообще звучит как большой труд ради маленького выигрыша.

Для тестирования IPC мы используем следующие правила. Каждый процессор выделяет четыре ядра без дополнительных потоков, а режимы питания отключены, так что ядра работают только на определенной частоте. DRAM настроен так, как официально поддерживает процессор, поэтому в новых процессорах это DDR4-2933, а для предыдущего поколения DDR4-2666. Недавно велись споры на тему, справедливо это или нет, и вот мнение: это тест IPC, а не тест эффективности системы. Официальная поддержка DRAM является частью технических характеристик оборудования, равно как и размер кэшей или количество портов выполнения. Запуск двух процессоров на той же частоте DRAM дает несправедливое преимущество одному из них: это либо большой оверклок / андерклок, либо отклонение от предполагаемого дизайна.

Итак, для теста был взят новый Ryzen 7 2700X, первое поколение Ryzen 7 1800X и до-Zen Bristol Ridge на базе A12-9800, основан на платформе AM4 и использует DDR4. Мы используем каждый процессор на четырех ядрах, без многопоточности, на частоте 3,0 ГГц. Приступим к тестам.

В этом графике мы использовали первое поколение Ryzen 7 1800X в качестве 100-процентного маркера, а синие столбцы — как Ryzen 7 2700X. Проблема с попыткой определить увеличение IPC на 3% состоит в том, что 3% могут легко затеряться в шуме контрольного прогона: если кэш не будет полностью установлен до запуска, мы можем столкнуться с разной производительностью. Как показано выше, большее количество тестов приходится на диапазон ± 2%.

Однако при вычислении тяжелых задач преимущество составило 3-4%: здесь есть Corona, LuxMark, CineBench и GeekBench. Мы не включили результаты подтестов GeekBench в вышеприведенный график, но большинство из них показывает прирост 2-5%.

Если мы возьмем результат Cinebench R15 nT и тесты памяти Geekbench, среднее значение прироста по всем тестам составит + 3,1% для нового Ryzen 2700X. Звучит, как звон монет для AMD.

Возвращаясь к результату Cinebench R15 nT, который показал 22-процентный прирост: у нас также было несколько других тестов IPC, выполненных на 3,0 ГГц, но с 8C / 16T (которые мы не могли сравнить с Bristol Ridge), и некоторые другие тесты также показали 20% + прирост. Вероятно, это признак того, что AMD также отрегулировала управление одновременной многопоточностью. Этот вопрос требует дальнейшего тестирования.

Общее улучшение на 10%

С учетом преимуществ нового производственного процесса 12LP у нас возник вопрос, почему AMD не переработала некоторые элементы микроархитектуры для получения еще более высокого результата. В конечном счете оказывается, что «дармовое» увеличение частоты достаточно просто перенести на тот же дизайн (как уже упоминалось ранее, дизайн 12LP основан на 14LPP с улучшением производительности). В прошлом такое решение, возможно, не упоминалось бы как отдельная линейка продуктов. Таким образом, продвижение продукта по одному и тому же дизайну — это легкая победа, позволяющая командам сосредоточиться на следующем крупном редизайне ядра.

Подытожив вышесказанное, AMD ранее уже заявляла о своих намерениях касательно Zen + Core — на CES в начале года AMD сказала, что хочет, чтобы Zen + и будущие продукты вышли за пределы «отраслевого стандарта» 7-8% производительности каждый год.

Очевидно, что 3% IPC недостаточно, поэтому AMD сочетает в себе прирост производительности с увеличением частоты +250 МГц, что составляет примерно еще 6% -ный прирост пиковой частоты, с лучшей работой в турборежиме с Precision Boost 2 / XFR 2. Это около 10% прироста, но по крайней мере, на бумаге. Посмотрим, что скажут тесты.

Precision Boost 2 и XFR2: Нужно больше герц

Одно из самых серьезных изменений в новой серии Ryzen-2000 – реализация турбо режима процессора. До этого момента (за исключением недавнего запуска APU) процессоры полагались на пошаговую реализацию функции: система определяет, сколько потоков загружено, пытается реализовать определенную частоту на этих ядрах, если это возможно, а затем обращается к справочной таблице отношения количества потоков к частоте. Цель AMD Precision Boost 2 — сделать этот процесс более динамичным.

На слайде от AMD представлена эта функция: система будет определять, какая часть запаса производительности все еще доступна, и турбировать процессор, насколько это возможно, пока не достигнет одного из ограничивающих факторов. Этими факторами могут быть любые из нижеперечисленных (хотя и не только они):

Общая пиковая мощность чипа
Индивидуальное напряжение / частотный отклик
Тепловые взаимодействия между соседними ядрами
Ограничения мощности для отдельных ядер / групп ядер
Общие тепловые характеристики

Новое программное обеспечение AMD Ryzen Master 1.3, используемое на процессоре серии Ryzen 2000, имеет несколько индикаторов для определения предельных факторов. По большей части, способ турбирования процессора и реагирования на окружающую среду будет прозрачным для пользователя.

Лучший способ проверить это в действии, с моей точки зрения, — взглянуть на энергопотребление процессоров первого и второго поколения Ryzen. Мы можем рассматривать внутреннее расчетное энергопотребление каждого ядра индивидуально, так как, к счастью, AMD оставила эти регистры открытыми, и мы получили следующие данные:

Это только потребляемая мощность ядер, а не всего процессора, которая будет включать контроллер DRAM, Infinity Fabric и процессор IO. Это означает, что мы получаем цифры, отличающиеся от номинального TDP, но опасность здесь в том, что у Ryzen 7 2700X на 10 Вт TDP выше, чем у Ryzen 7 1800X, где 2700X потребляет больше энергии, и может показаться, что это ответ TDP.

Построение графика потребления энергии дает такую картину:

Даже в этом случае ясно, что Ryzen 7 2700X потребляет больше энергии, до 20 Вт, при различном количестве потоков. Давайте изменим график как функцию пиковой мощности:

Результаты уже не так очевидны: похоже, 1800X потребляет в процентах от максимальной мощности больше при низком количестве потоков, но 2700X потребляет больше на среднем количестве потоков.

Стоит отметить, что конечный результат Precision Boost 2 имеет две стороны: более высокая производительность, но также повышенное энергопотребление. Пользователи, которые хотят разместить процессор с низким энергопотреблением в системе небольшого форм-фактора, могут захотеть отключить этот режим и вернуться к стандартной пошаговой функции для контроля термального режима.

Замечание — несмотря на то, что маркетинговое название звучит как Precision Boost 2, внутреннее имя функции в BIOS «Core Performance Boost». Он похож на Multi-Core Enhancement, который является особенностью некоторых материнских плат Intel, предназначенных для выхода за лимиты турбо режима процессора. Однако, это всего лишь стандартная PB2 от AMD: при отключении «Core Performance Boost» отключит PB2. Первоначально мы отключили его, думая, что это инструмент производителя материнских плат, чтобы провести некоторые чистые тесты. Выглядит как странное разногласие между инженерами и маркетингом AMD.

Extended Frequency Range 2 (XFR2)

Для серии Ryzen 2000 AMD изменила работу XFR. В предыдущем поколении он применялся на некоторых процессорах, позволяя им превышать максимальную частоту турбо режима, когда тепловая ситуация способствует более высоким частотам и более высокому напряжению в состояниях с низким количеством потоков. У нового поколения XFR по-прежнему имеет отношение к тепловому режиму, однако теперь применяется к любой нагрузке на ядро: если температура процессора до 60ºC, частота может увеличиваться независимо максимальной частоты Precision Boost 2 (так почему бы не получить больше от применения PB2?). Тем не менее ядро все же должно находиться в подходящем диапазоне напряжения / частоты, чтобы сохранить стабильность.

На некоторых материнских платах, таких как ASUS Crosshair VII Hero, есть дополнительные возможности для поддержки XFR2 за пределами реализации AMD. ASUS не вникает в конкретные детали, однако я подозреваю, что он реализует более агрессивную версию, возможно, расширяя кривую напряжения / частоты, поднимая пределы мощности и / или регулируя температурный предел.

Новые чипсеты и материнские платы X470

Фокус на мощности

Для наших обзоров продукции AMD мы получили две материнские платы: ASUS ROG Crosshair VII Hero (Wi-Fi) и MSI X470 Gaming M7 AC. Это две high-end материнские платы на новом чипсете X470.

Катамари любит материнские платы. Или просто любит сидеть на образцах для обзоров

Новый чипсет X470 должен занять место над чипсетом X370, хотя, глядя на спецификации, пользователи могут даже не заметить разницы. Технически X470 имеет ту же поддержку PCIe и SATA, что и в более старом наборе микросхем X370, и некоторое время AMD будет реализовывать оба чипсета одновременно для основных производителей материнских плат. Обе материнки будут использовать сокет AM4, который AMD поддерживает уже несколько поколений.

Основные изменения в чипсете касаются энергопотребления. В настоящее время чипсет X370, построенный на 55-нм производственном процессе с использованием ASMedia IP, работает на 6,8 Вт TDP (при полной нагрузке). Касательно X470 нам сообщили, что это тот же процесс и IP, но чип теперь будет потреблять на пике 4,8 Вт и 1,9 Вт в режиме ожидания. Это связано с улучшенной инфраструктурой питания внутри чипа, и AMD также утверждает, что общая пропускная способность улучшена. Микропрограммное обеспечение чипсета также настроено на обеспечение лучшей поддержки overclocked памяти и её стабильности.

Следующая важная составляющая — StoreMI, чему мы посвятим следующую статью. Эта новая опция технически не требует поддержки чипсета, однако установщик проверяет наличие чипсета X470 перед предоставлением бесплатной лицензии, в противном случае программное обеспечение обойдется в 20 долларов США, и будет без брендинга AMD.

Все платы X470 и платы X370 с последними обновлениями BIOS будут поддерживать новые процессоры Ryzen 2nd Gen. Новые материнские платы X370, у которых уже обновлен BIOS, будут иметь логотип «Ryzen 2000 Desktop Ready» на коробке, однако платы X470 поддерживают новые процессоры в любом случае.

Boot Kit AMD

Для покупателей материнских плат X370 / B350 / A320, имеющих старую прошивку, AMD предлагает решить проблему через страницу поддержки. Потребители должны сначала попытаться заменить плату на новую с обновленным BIOS у розничного поставщика, но в случае неуспеха пользователи с зарегистрированными покупками могут получить «загрузочный комплект AMD» — процессор A-серии в краткосрочную аренду, с помощью которого можно обновить BIOS под свой новый процессор.

AMD предоставит комплект бесплатно, если пользователь:

Покажет фото новой материнской платы серии 300,
Покажет фото нового процессора серии Ryzen 2000,
С номерами моделей / уникальными серийными номерами в кадре и,
Копию счет-фактуры на покупку.

Это означает, что пользователям, которые хотят воспользоваться преимуществами Boot Kit, придется покупать компоненты в розницу, и бывшие в употреблении. В комплект входит процессор A-серии (Bristol Ridge) и кулер, а также предварительно оплаченная маркировка для возврата оборудования. Такой щедрый набор для обновления BIOS материнской платы – неслыханное ранее предложение. До этого пользователям приходилось решать вопрос через продавца и платить за RMA. Однако можно предположить, что AMD имеет достаточное количество процессоров серии A, чтобы это не было проблемой, а положительная реакция от такого сервиса перевешивает затраты на отправку и возврат.

Пользователи, которым нужен Boot Kit, могут перейти по этой ссылке, чтобы найти официальные данные.

Материнские платы X470

Каждый производитель уже анонсировал несколько новых материнских плат под чипсет, хотя ясно, что это далеко не полный стек.

Большинство продавцов будут предлагать X470 и X370 одновременно, и X470 займет нишу премиум — продукта.

ASUS ROG Crosshair VII Hero

Первая материнка, которую мы открыли, была ASUS ROG Crosshair VII Hero (Wi-Fi). Упаковка оказалась изрядно потрепанной – то ли при доставке, то ли при хранении.

С первого взгляда мы видим несколько отличных опций: комбинированную 12-фазную подачу питания (вероятнее всего 10 + 2) на CPU, с двумя слотами M.2 и усиленным PCIe для работы с SLI x8 / x8. Задняя панель ввода-вывода предварительно прикреплена к системе с помощью кожуха, и имеется небольшой кабель, соединяющий встроенные светодиоды на материнской плате.

Сокет не изменился: AM4 с 1331 отверстием для процессора. Механизм защелки тот же, как и размеры кулера.

ASUS добавила на плату ряд RGB-разъемов, а также что-то, что выглядит как удобные точки считывания напряжения (или точки, позволяющие использовать любую 5-вольтовую систему, например, подсветку с холодным катодом?).

Из двух сокетов M.2 один — PCIe 3.0 x4 от CPU, а другой — PCIe 2.0 x4 от чипсета. Для подключения устройств хранения также имеется шесть портов SATA.

На плате находятся различные USB 3.1, USB 3.0 и USB 2.0 порты, хотя мне показалось довольно забавным, что ASUS решила подписать порты «Native USB», чтобы подчеркнуть, что это относится к чипсету, а не контроллеру. Это имеет смысл для VR, для которого требуются собственные порты, что позволяет пользователю устанавливать разъемы передней панели в нативные USB-разъемы.

Что бы премиум-плата сияла ещё ярче, ASUS разместила свою звуковую карту SupremeFX. Она базируется на кастомном кодеке Realtek ALC1220A, аудиоконденсаторах Nichicon, экранах EMI, разъединении PCB и комплекте софта.

На обратной стороне мы имеем: кнопку ASUS BIOS Flashback, так что пользователи могут обновлять BIOS без установки CPU / GPU / DRAM; кнопку Clear CMOS; 802.11ac Wi-Fi; два порта USB 2.0; комбинированный PS/2, восемь портов USB 3.0, два порта USB 3.1 (один тип-C), порт гигабитного Ethernet и аудиоразъемы.

MSI X470 Gaming M7 AC

В отличие от предыдущей, упаковка MSI X470 Gaming M7 AC не была испорчена, и продемонстрировала изображение материнской платы непосредственно на лицевой стороне. Обычно мы привыкли наблюдать имена «MSI» и «ACK» на материнских платах Gaming M7 с Wi-Fi, что указывает на использование сетевого контроллера Killer, но не здесь.

С первого взгляда материнская плата выглядит менее сосредоточенной на «стиле», чем ASUS, хотя MSI тоже бросается в глаза. Очевидными функциями являются поддержка DRAM, множество дросселей питания и U-образный радиатор, который скрывает два слота M.2.

Близкий взгляд на разъемы DRAM показывает, что именно так MSI развивает свою концепцию «усиленного слота памяти». Мы можем спорить, имеет ли смысл вышеуказанная концепция (это, безусловно, помогает PCIe), но здесь явно нашлось место для эстетики.

Я подсчитал 14 дросселей на этой материнской плате, и это, возможно, крупнейшая опция доставки питания на любой материнской плате AM4. Теплоотводы питания не соединены вместе, что, возможно, свидетельствует о стоимости, или уверенности MSI в эффективности подачи электроэнергии. Стоит отметить, что MSI использует здесь 8-контактное подключение питания к CPU, по сравнению с 8 + 4-контактным расположением на ASUS ROG.

Одной из наиболее эзотерических особенностей последних материнских плат MSI является эта большая ручка, с цифрами до 11. Это функция разгона Game Boost от MSI, разработанная таким образом, что каждый поворот дает больший уровень разгона процессору. Раньше такая функция была бы слишком тяжелой для большинства процессоров, в попытке повысить частоту как можно больше, ранее мы никогда не могли выйти за рамки «2» при воздушном охлаждении. К счастью, рядом с ручкой есть кнопки выключения питания / перезагрузки.

Брендированный MSI Audio Boost 6 аудио не особо отличается от конкурентов: кодек Realtek ALC1220 со специализированными аудиоконденсаторами, экраном EMI и разъемом PCB. MSI добавляет программное обеспечение по лицензии компании Nahimic, которое предлагает различные настройки эквалайзера и дополнительные преимущества для геймеров.

Как и ASUS, MSI предлагает функцию обновления BIOS без установленного CPU / GPU / DRAM. На задней панели мы видим два порта USB 2.0: порт PS/2, четыре порта USB 3.0, модуль Wi-Fi 802.11ac, два порта USB 3.1, порт Gigabit Ethernet и аудиоразъемы.

Несколько интересных замечаний касательно задней панели платы — около области радиатора чипсета, MSI разместила предупреждение о том, винты-стойки не должны кататься материнской платы. Поскольку большинство корпусов предназначены для размещения любых форм-факторов материнской платы, пользователи, которые используют более старые корпуса и не удаляют ненужные опорные винты, могут вызвать короткое замыкание и, возможно, разрушение аппаратной части. Хотя, если пользователь не удаляет старые опоры, я сомневаюсь, что он озаботиться чтением текста на обратной стороне материнской платы.

Вот приятное дополнение к материнской плате: пользователю сообщают количество слоев PCB. В данном случае шесть. Что бы было понятнее, самые дешевые материнские платы обычно имеют три или четыре слоя, большинство основных плат будет иметь шесть или иногда восемь, а хай-энд материнки для настольных ПК обычно имеют восемь или десять. Материнские платы, для которых цена не является аргументом, например, серверные системы, могут иметь двенадцать. Дополнительные опции, такие как двойная медь или защита от высокой влажности, могут добавить + 50% к стоимости чистой печатной платы.

StoreMI путь к более быстрому JBOD

Когда AMD выпустила APU Ryzen в начале этого года, одним из второстепенных анонсов стало продвижение программного обеспечения под названием FuzeDrive от Enmotus. Софт предлагался потребителям за дополнительные 20 долларов. Для новых десктоп процессоров серии Ryzen-2000 и платформы X470 это программное обеспечение стало частью программного стека AMD и может быть бесплатно загружено с сайта AMD под брендом StoreMI.

Преимущества кэша

Принцип работы StoreMI заключается в том, что пользователь может взять систему среднего уровня, работающую на медленном диске, и добавить небольшой, но быстрый привод, чтобы увеличить скорость работы с наиболее часто используемыми файлами. Программное обеспечение создает «систему хранения» из быстрого и медленного привода, предоставляя пользователю один диск с общей емкостью двух дисков, в то время как софт реализует распознавание паттернов, чтобы понять, какие файлы нужно разместить на быстром диске для максимального ускорения системы.

Многоуровневое хранилище не новость — оно используется во многих корпоративных системах хранения, поддерживаемых сложным программным обеспечением. Быстрые системы хранения несколько затратны, в то время как объем данных обычно велик: сети доставки контента (CDN), такие как Netflix или Steam, используют многоуровневое хранилище и кэширование. Таким образом часто используемые фильмы или игры доступны из хранилища, которое находится рядом с пользователем и одновременно является самым быстрым из доступных.

В современном компьютере самым быстрым хранилищем является встроенная память / DRAM. Сюда загружаются файлы и программы, когда процессору необходимо получить доступ к данным или держать данные «близко» для постоянного доступа. Так было в течение всей истории программного обеспечения. В последние годы некоторые энтузиасты использовали RAMDisks, создавая дисковое пространство с использованием оперативной памяти, чтобы получить быстрый репозиторий. Единственным недостатком такого метода является то, что данные теряются при перезагрузке, поскольку данные, хранящиеся в DRAM, являются неустойчивыми (или не постоянными).

Машина современного энтузиаста скорее будет включать какой-то твердотельный накопитель (SSD) на основе флэш-памяти NAND: либо диск, подключенный через полосы PCIe, как супербыстрое хранилище, либо подключенный через порт SATA. Эти же пользователи часто имеют механический жесткий диск, основанный на вращающихся пластинах, в качестве резервного хранилища для больших объемов, обычно называемый жестким диском (HDD), а скорость ограничена тем, как система считывает данные с диска, который вращается со скоростью 7200 или 5400 раз в секунду. Многие машины по-прежнему поставляются с жесткими дисками в качестве основного и массового хранилища, что очень беспокоит пользователей, которых привлекают преимущества использования SSD.

С StoreMI пользователь может использовать любую конфигурацию PCIe SSD, SATA SSD или HDD и реализовать их виде многоуровневого накопителя. Объединенный одиночный привод будет иметь емкость всех дисков в стеке, и программное обеспечение будет управлять тем, какие данные следует переместить в быстродействующий накопитель. Этот процесс является постепенным, программному обеспечению потребуется время, чтобы узнать, какие файлы являются самыми важными – а это значит, что эффект не будет заметен сразу, но после третьей или четвертой загрузки программного обеспечения или игры, система должна показать хорошие результаты.

Инструмент StoreMI также позволяет пользователю добавлять до 2 ГБ оперативной памяти в стек хранилища. Этот процесс не добавляет дополнительной емкости «единому диску», но DRAM действует как самый быстрый кэш и будет хранить только копии данных, хранящихся на других дисках, чтобы избежать потери данных. Как упоминалось выше, поскольку встроенная память нестабильна, кэш в памяти для ускорения работы будет потерян при перезапуске. В беседе с AMD нам сообщили, что 2 ГБ является хорошим объемом памяти для кэша DRAM: из-за особенностей работы программного обеспечения, больший кэш не покажет ощутимого прироста, по словам кампании. Софт позволяет даже системам с всего лишь 8 ГБ общей системной памяти использовать программное обеспечение.

Конфигурации

В отличие от технологии кэширования RST (которая недавно поддерживала кэширование на незагрузочных дисках), StoreMI от AMD можно использовать в любое время жизненного цикла системы. Для любого пользователя, который хочет отложить покупку SSD-накопителя NVMe или SSD SATA, или повременить с покупкой более крупного диска, есть возможность не спешить и добавить новый диск в многоуровневое хранилище позднее.

StoreMI может поддерживать практически любую конфигурацию, с участием загрузочных дисков и дисков хранения. При работе с загрузочным диском AMD рекомендует сначала установить операционную систему на более медленный и вместительный диск, а после произвести добавление чистого SSD в качестве уровня быстрого доступа, хотя противоположное также возможно для пользователей, которые хотят добавить более объемный диск позже (могут быть дополнительные шаги для завершения процесса). Единственное различие заключается в том, что программное обеспечение, скорее всего, переместит большое количество данных в начале работы.

Конфигурации, которые предлагаются для StoreMI:

HDD + DRAM
HDD + SATA SSD
HDD + SATA SSD + DRAM
HDD + NVMe SSD
HDD + NVMe SSD + DRAM
SATA SSD + DRAM
SATA SSD + NVMe SSD + DRAM
NVMe SSD + DRAM

Наибольшее заметное улучшение должно произойти в конфигурации 4, когда SSD NVMe сопряжен с механическим жестким диском.

AMD заявляет, что если стек хранилища распространяется от родного чипсета до портов SATA на базе контроллера, программное обеспечение, скорее всего, перенесет файлы, связанные со спящим режимом, на диск на родных портах SATA для обеспечения стабильности; этот процесс может занять до 30 минут.

Пользователи также могут удалять диски из многоуровневого хранилища, если есть достаточно места для размещения всех данных на диске, который остается в уровне. Удаленный диск останется с нулевыми данными и может быть удален из системы или использован для других целей.

Серьезное ограничение: 256 ГБ на Fast Tier

Важный момент, не упомянутый в наших первоначальных брифингах, когда FuzeDrive был запущен вместе с APU, но ясно освещенный в руководстве пользователя StoreMI, заключается в том, что совместная лицензия AMD и Enmotus оговаривает, что более быстрый диск в уровне может иметь размер не более 256 ГБ.

При добавлении диска размером более 256 ГБ в качестве уровня быстрого доступа, система автоматически разбивает пустой диск, предлагая дополнительную емкость как отдельную букву диска.

Добавление емкого жесткого диска в качестве медленного уровня к загрузочному диску SSD приведет к проблемам только в том случае, если емкость SSD больше 256 Гб. Пользователям в этом случае потребуется перенести операционную систему (используя другое программное обеспечение) с SSD на HDD, затем загрузить систему с жесткого диска, и добавить (теперь пустой) SSD в качестве быстрого уровня доступа.

Некоторые пользователи могут решить, что здесь требуется слишком много усилий — добавление 3Гб жесткого диска к SSD-накопителю размером 512 ГБ не должно быть таким сложным. Как решение — оставить диски разделенными, и такие элементы, как папка Steam, вручную разнести на разные диски, оставив любимые игры на SSD. Однако StoreMI больше ориентирован на системы, которые изначально имеют емкий жесткий диск, — для добавления небольшого быстрого SSD, скажем, 64 ГБ-128 ГБ. Такой случай рассматривается как наиболее вероятный.

Частота отказов: недостатки JBOD

Большинство вариантов объединения дисков в массиве модифицируют элемент скорости (чтение данных по многим дискам одновременно), и защиту от сбоев (данные реплицируются или вводится бит четности). Обычно параметры массива хранилища объединяют обе функции, при этом фокусируясь на одной функции в ущерб другой. Для пользователей, которым нужно хранить файлы, один из вариантов объединения дисков известен как JBOD или «просто куча дисков». JBOD не предлагает ни дополнительной скорости, ни защиты от сбоев.

Массив JBOD делает одно: он объединяет диски в массив, чтобы отображать их как одно общее файловое пространство, и воспринимает массив именно так. Включение восьми дисковых накопителей на 10 ТБ в JBOD будет видно системе как один диск на 80 Тбайт. Однако он не считывает и не записывает на диски одновременно — JBOD будет попросту записывать данные последовательно, и считывать данные с диска, на котором они находятся. В результате он по-прежнему работает только с одним приводом, но, если один из дисков в массиве JBOD выходит из строя, массив теряет целостность и разрушается. Без специализированных инструментов все данные из всего массива, как и данные на этом конкретном диске, почти наверняка будут потеряны. И если один привод имеет среднюю частоту отказа, то ожидаемая частота отказа при работе восьми накопителей одновременно будет в восемь раз выше, чем для каждого диска отдельно.

В этом контексте хорошо видно, что StoreMI страдает от такой же недостаточной защиты от сбоев дисков. Нет механизма, с помощью которого данные будут защищены, и, если один диск в стеке выйдет из строя — данные на всех дисках теряются. Если загрузочный диск – это дешевый SSD с NAND низкого качества, или жесткий диск устарел, то потеря данных на обоих дисках оказывается реальной возможностью.

Первоначально я считал, что это серьезная проблема. Например, если пользователь хочет разместить 10 дисков в стеке, это может означать катастрофу. Однако критичность проблемы сильно упала, когда я узнал о максимальном размере быстрого уровня в 256 ГБ. Это означает, что большинство пользователей, по всей вероятности, смогут только соединить только два диска в один уровень. Реакция AMD на угрозу сбоев состояла в том, чтобы показать, что пользователи должны использовать резервное копирование в любом случае, и никаких конкретных комментариев не было сделано на тему увеличения частоты отказов двухдискового стека в сравнении с одним диском. Поскольку StoreMI перемещает данные между SSD и жестким диском, может возникнуть дополнительная проблема. В этом случае происходит больше записей данных на SSD с течением времени, чем у отдельного загрузочного диска обычного пользователя, в результате NAND быстрее изнашивается. Ни AMD, ни AnandTech не воспринимают этот недостаток как-нибудь серьёзно, учитывая, что современные твердотельные диски MLC и TLC очень хорошо справляются с управлением поврежденными блоками данных и имеют встроенное избыточное представление.

А тесты !?

В настоящее время мы не успели напрямую протестировать StoreMI, сосредоточившись на других проектах и предстоящих событиях. Если у нас будет время, мы предоставим полноценную статью о StoreMI.

Параметры тестирования

Тестирование с установленными патчами Spectre и Meltdown

Для нашего тестирования новых процессоров AMD Ryzen 2000 и процессоров Intel мы использовали последнюю версию Microsoft Windows с последними обновлениями, а также обновления микрокода BIOS, чтобы быть уверенными, что уязвимости Spectre и Meltdown были пропатчены, как это могло бы быть. Это означает, что некоторые данные, используемые в этом обзоре, не сопоставимы с предыдущими ревью, однако со временем мы планируем обновить свою базу данных последними исправлениями.

Тестовый стенд

В соответствии с нашей политикой тестирования процессора мы берем материнскую плату категории премиум-класса, подходящую для сокета, и оснащаем систему подходящим объемом памяти, работающим на максимальной поддерживаемой частоте производителя.

Отмечается, что некоторые пользователи оспаривают такой подход, упоминая, что иногда максимальная поддерживаемая частота является довольно низкой, или более быстрая память доступна по аналогичной цене, или что использование поддерживаемых частот может снижать показатели производительности. Хотя эти комментарии имеют смысл, в конечном итоге очень немногие потребители используют профили памяти (XMP или другие), поскольку они требуют взаимодействия с BIOS, и большинство пользователей отказываются от поддерживаемых скоростей JEDEC — сюда относятся как домашние пользователи, так и поставщики, которые могут захотеть снизить наценку на пару центов или остаться в пределах, установленных производителем. Там, где это возможно, мы расширим тестирование, чтобы добавить более быстрые модули памяти — либо в этом обзоре, либо позднее.

Анализ мощности

Один из ключевых дебатов вокруг питания сводится к тому, как интерпретируется TDP, как он измеряется и что именно должен означать. TDP или Thermal Design Power, обычно используется как значение требуемой способности рассеивания тепла для используемого кулера, а не потребляемой мощности. Есть несколько тонких физических различий у этих двух понятий, но для простоты большинство пользователей рассматривают TDP как номинальное энергопотребление процессора.

То, что на самом деле обозначает показатель TDP, достаточно сложно определить. Для любого процессора Intel номинальный TDP — это фактические требования к тепловому рассеиванию (или потребляемая мощность), когда процессор работает на своей базовой частоте. Поэтому для чипа, такого как Core i5-8400, который рассчитан на 65 Вт, это означает, что рейтинг 65 Вт применим только на частоте 2,8 ГГц. Весьма удивляет то, что официальное значение TDP для турбо-режима Core i7-8700 рассчитывается для 3,8 ГГц на всех ядрах, что намного выше указанной базовой частоты. По правде говоря, если процессор ограничен в прошивке до 65 Вт, мы увидим максимум 3,2 ГГц, если загружены все ядра. Это важный момент для термически ограниченных сценариев, но это также означает, что без этого предела в прошивке потребление энергии не привязано к TDP: Intel не предоставляет значение TDP выше базовой частоты, несмотря на то, что в реальности частота (в турбо-режиме) намного выше.

У AMD TDP вычисляется несколько иначе. Раньше это определялось как пиковая потребляемая мощность ЦП, включая турбо режим, при загрузке всех ядер (такое возможно при вирусе в системе). Теперь TDP является скорее мерой измерения охлаждения. AMD определяет TDP как разницу между температурой крышки процессора и температурой заборника вентилятора, разделенной на минимальную требуемую производительность кулера. Или, говоря иначе, минимальная производительность охладителя определяется как разность температур, деленная на TDP. В результате мы получаем скользящую шкалу: если AMD хочет определить кулер с более высокой тепловой производительностью, это снизит TDP.

Для Ryzen AMD диктует, что эта разность температур составляет 19,8ºC (61,8 ºC на процессоре, когда на заборнике вентилятора 42ºC), что означает, что для 105 Вт TDP тепловые характеристики охладителя должны выдерживать 0,189 ºC на ватт. При более холодных тепловых характеристиках 0,4 ºC / Вт TDP будет рассчитан как 50 Вт, или значение 0,1 даст 198 Вт.

Это, в конечном счете, делает TDP AMD в большей части показателем производительности охлаждения, чем энергопотребления.

При тестировании мы также зависимы от прихотей производителя материнской платы. В конечном итоге для некоторых процессоров турбо-режимы определяются справочной таблицей. Если система использует X-ядер, то процессор должен работать на частоте Y. Производители материнских плат не только могут изменить эту таблицу в каждой версии прошивки, но Intel ещё и прекратила делать эти данные официальными. Таким образом, мы не можем сказать, соответствует ли производитель материнской платы спецификациям Intel или нет. В некоторых обзорах у нас было три разных производителя материнских плат, у которых разные таблицы поиска, но все три заявили, что следуют спецификациям Intel. Ок, хорошо когда всё просто и понятно.

Если этого мало, стоит заметить, что мы ещё зависим и от прихоти случая. Даже в случае, когда два процессора произведены одинаково, реакция процессоров на напряжение и частоту на самом деле может быть очень разной. Штамп на коробке — это всего лишь гарантированный минимум, а фактическая производительность или тепловые характеристики процессора могут варьироваться от этого самого минимума до чего-то действительно, действительно хорошего. Как AMD, так и Intel проходят процесс под названием «биннинг», благодаря чему каждый процессор с производственной линии тестируется в соответствии с определенными стандартами — если он превосходит лучшие стандарты, он маркируется как лучший процессор. Если же он не соответствует этим стандартам, он может быть помечен как что-то еще. Известен также факт, что если изготовителю нужно большее количество процессоров среднего класса, он может уменьшить процент компонентов, которые соответствуют высокому стандарту, и те же высококачественные процессоры будут маркироваться, как если бы они соответствовали среднему стандарту. Так что процессор — это лотерея.

В нашем тестировании мы считываем значения мощности из внутренних регистров процессора, предназначенных для оценки энергопотребления и применения параметров турбо- и кулера. Этот метод, строго говоря, не самый точный – и поэтому мы будем применять собственные мультиметры. И всё же первый метод дает нам больше информации, чем мультиметры. Современные многоядерные процессоры используют разные планы напряжений для разных частей процессора или даже для каждого ядра, поэтому показания программного обеспечения дают нам хорошее понимание разделения мощности для разных частей процессора. Очень удобно, если процессор делает такую информацию доступной, но это не всегда так. В большинстве ситуаций мы можем получить только два основных важных параметра: расчетное энергопотребление всего чипа и расчетное энергопотребление всех ядер (без контроллера памяти или интерконнекта).

Есть очень заметная разница между чипами Intel и AMD, — разница между мощностью ядер и мощностью всего чипа. Интерконнект AMD, Infinity Fabric, в сочетании с другими не-ядерными компонентами чипа, потребляет намного больше энергии, чем чипы Intel. И это, возможно, оставляет больший запас энергии для Intel, чтобы поднять частоты. Как было сказано, AMD привязывает энергопотребление к значению TDP: наш Ryzen 7 2700 показал очень высокую эффективность, хотя мы, похоже, видим средние показатели на Ryzen 5 2600. Напротив, Intel Core i7-8700K очень легко вырывается за пределы своего TDP, тогда как более старые процессоры Kaby Lake больше соответствуют собственным значениям TDP.

Наши благодарности

Спасибо Sapphire за предоставленные нам нескольких видеокарт AMD. Мы встретились с Sapphire на Computex 2016 и обсудили платформу для будущего тестирования с графическими процессорами AMD на их оборудовании в нескольких предстоящих проектах. Sapphire передал пару RX 460, которые мы используем в качестве карт тестирования процессора. Объем потребляемой мощности GPU может напрямую влиять на производительность ЦП, особенно если процессор должен тратить все свое время на работу с графическим процессором. RX 460 – очень хорошая карта для наших тестов, так как она мощная, имеет низкое энергопотребление и не требует каких-либо дополнительных разъемов питания. Sapphire Nitro RX 460 2GB как и прежде следует философии Nitro, и в этом случае представляет собой мощную карту по низкой цене. Его 896 SPs работают на частотах 1090/1216 МГц, и она сопряжена с 2 ГБ GDDR5 с эффективными 7000 МГц.

Мы также должны поблагодарить MSI за предоставление нам GPU GTX 1080 Gaming X 8GB. Несмотря на размер AnandTech, обеспечение высокопроизводительных графических карт для проведения гейм-тестов CPU — довольно сложная задача. MSI очень любезно предоставила нам пару своих хай-энд видеокарт. Графическая карта MSI GTX 1080 Gaming X 8GB является превосходным продуктом с воздушным охлаждением, занимающим место ниже Seahawk с водяным охлаждением, но выше версий Aero и Armor. Карта достаточно большая, с двумя вентиляторами Torx, индивидуальным дизайном печатной платы, технологией Zero-Frozr, улучшенной PWM и большой задней панелью для облегчения охлаждения. Карта использует кремниевую матрицу GP104-400 на 16-нм TSMC-процессе, содержит 2560 ядер CUDA и может работать на частоте до 1847 МГц в режиме OC (или 1607-1733 МГц в режиме Silent). Интерфейс памяти составляет 8 ГБ GDDR5X, работающей на частоте 10010 МГц. Весьма продолжительное время GTX 1080 оставалась картой №1.

Спасибо Crucial за предоставленные нам SSD MX200. Критический компонент для нашей задачи, так как список тестов растет с новыми бенчмарками и играми, а 1TB MX200 – сильное подспорье. Основанные на контроллере 88S9189 от Marvell и использующие микросхему Micron с 16-нм 128-Гбит MLC, это 7-миллиметровые, 2,5-дюймовые приводы, рассчитанные на 100K случайных считываний IOP и с 555/500 МБ/с последовательной скорости чтения и записи. Модели 1TB, которые мы используем здесь, поддерживают шифрование TCG Opal 2.0 и IEEE-1667 (eDrive) и имеют номинальную выносливость 320 Тбайт с трехлетней гарантией.

Спасибо Corsair за предоставленные блоки питания AX1200i. AX1200i был первым источником питания, предлагающим цифровой контроль и управление через систему Corsair Link, но под капотом он выдает рейтинг 1200 Вт при 50 ° C с Platinum сертификацией. Это позволяет обеспечить минимум 89-92% эффективности при 115 В и 90-94% при 230 В. AX1200i полностью модульный, с более крупной 200-миллиметровой конструкцией, с двойным шарикоподшипниковым 140-мм вентилятором для высокопроизводительного использования. AX1200i спроектирован как рабочая лошадка, с 8 разъемами PCIe для работы с 4 х GPU системами. AX1200i также оснащен режимом Zero RPM для вентилятора, который позволяет выключить вентилятор, если источник питания работает под нагрузкой менее 30%.

Спасибо G.Skill за предоставленную память. На протяжении многих лет G.Skill поддерживает AnandTech в тестировании процессоров и материнских плат, даже если обзор не касается памяти. Мы сообщал об их высокопроизводительных и высокочастотных наборах ОЗУ, и о том, что каждый год на Computex G.Skill проводится мировой турнир по разгону с жидким азотом прямо на выставочном этаже.

Системные тесты CPU

Наш первый набор тестов — общие системные тесты. Этот набор тестов призван эмулировать по большей части то, что люди обычно делают с компьютером, например, открытие больших файлов или обработка небольших стеков данных. Это несколько отличается от нашего офисного тестирования, где используются тестирование по индустриальным стандартам. Так же некоторые из тестов здесь относительно новые и необычные.

Обработка FCAT

Одной из наиболее интересных нагрузок, которая используется на нашем стенде в последних кварталах, является FCAT — инструмент, который мы используем для измерения задержек в играх из-за упавших или пропущенных кадров. Процесс FCAT требует включения цветного оверлея в игру, записи игрового процесса и последующего анализа видеофайла с помощью соответствующего программного обеспечения. Такой софт обычно однопоточный, поскольку видео в примитивном RAW формате, что предполагает большой размер файла, и требует перемещения большого количества данных. Для нашей проверки мы берем 90-секундную запись теста Rise of the Tomb Raider, работающего на GTX 980 Ti на 1440p, размер которой составляет около 21 ГБ, и измеряем время, необходимое для обработки с помощью инструмента визуального анализа.

FCAT — только однопоточная задача, и она показывает преимущества высокочастотных компонентов и высокого IPC от Intel. Со стороны AMD, Ryzen 5 показывает себя лучше, чем Ryzen 7, но результаты находятся в пределах погрешности.

Dolphin Benchmark

Многие эмуляторы связаны однопроцессорной производительностью процессора, а общие отчеты, как правило, предполагают, что Haswell значительно повысил производительность эмулятора. Этот бенчмарк запускает программу Wii, в которой луч отслеживает сложную трехмерную сцену внутри эмулятора Dolphin Wii. Результаты этого теста – вполне надежный показатель скорости процессорной эмуляции Dolphin, которая представляет собой интенсивную одноядерную задачу, использующую большинство аспектов процессора. Результаты приведены в минутах, где сам Wii показал результат 17,53 минуты (1052 секунды).

Dolphin также является однопоточным тестом и исторически предоставляет преимущество процессорам Intel. Новая серия Ryzen-2000, с выросшими IPC и частотой, всё продвигается вперед, обгоняя Skylake от Intel.

3D Movement Algorithm Test v2.1

Это последняя версия написанного нами 3DPM бенчмарка. Цель 3DPM – симулировать частично оптимизированные научные алгоритмы, взятые непосредственно из моей докторской диссертации. Версия 2.1 отличается от 2.0 тем, что передает основные структуры частиц ссылкой, а не значением, и уменьшает количество преобразований double->float->double, выполняемых компилятором. Это дает ускорение на 25% по сравнению с версией 2.0, что означает новые данные.

В этом многопоточном тесте новый 8-ядерный Ryzen 7 2700X поднялся еще на одну голову выше 8-ядерного Skylake-X от Intel — по сравнению с 1800X. Однако шестиядерный Coffee Lake i7-8700K зажат между Ryzen 5 2600X и Ryzen 5 2600.

Agisoft Photoscan 1.3:

Photoscan остается в нашем тестовом наборе из предыдущей версии тестов, однако теперь мы работаем в Windows 10, поэтому в игру вступают такие функции, как Speed Shift на новейших процессорах. Концепция Photoscan – преобразование множества 2D-изображений в 3D-модель — поэтому чем более детализированы изображения, и чем больше таковых, тем лучше модель. Алгоритм состоит из четырех этапов: нескольких однопоточных и нескольких многопоточных, а также имеет некоторую зависимость от кэша и памяти. Для некоторых более разнообразных рабочих задач с многопоточными функциями такие опции, как Speed Shift и XFR, смогут использовать преимущества ожидания или простоев CPU, давая значительный прирост производительности на новых микроархитектурах.

Photoscan — это тест с переменной многопоточностью, эволюция от 1800X до 2700X показывает, что дополнительные TDP и Precision Boost 2 могут буквально сбривать минуты с теста. Более медленная сетчатая архитектура Intel в Skylake-X на 8-ядерном 7820X по сравнению с кольцевой архитектурой Coffee Lake 8700K означает, что два меньших ядра на 8700K позволяют ему подняться повыше, и всё же он по-прежнему проигрывает около четырех минут Ryzen 7 2700X. Для победы Intel здесь нужен большой 18-ядерный процессор, i9-7980XE.

Civilization6 AI Test

В нашем тесте Civilization AI используется Стим версия Civilization 6 и выполняется внутриигровой тест AI для обработки 25 раундов сохранения поздней стадии игры. Мы запускаем бенчмарк на нашем GTX 1080 на 1080p, чтобы гарантировать, что рендеринг не является лимитирующим фактором, а результаты приведены как среднее геометрическое для 25 раундов, чтобы получить среднее время обработки одного раунда AI.

Хотя в тесте AI все же используется несколько потоков, однако высокие одноядерные характеристики Intel приводят эти процессоры к победе.

CPU Rendering Tests

Рендеринг тесты – давно признанный фаворит обзоров и тестов, поскольку код, используемый пакетами рендеринга, обычно оптимизирован, чтобы выжать каждый бит производительности. Иногда рендеринг программ также сильно зависит от памяти — когда у вас есть много потоков, переносящих тонны данных, память с малой задержкой отклика может быть ключом ко всему. Здесь мы берем несколько обычных пакетов рендеринга под Windows 10, а также несколько новых интересных тестов.

Corona 1.3

Corona — это автономный пакет, предназначенный для поддержки программного обеспечения, такого как 3ds Max и Maya, фотореализмом с помощью трассировки лучей. Это просто – направляешь лучи, получаешь пиксели. Ладно, немного сложнее, но этот бенчмарк рендерит фиксированную сцену шесть раз, и выдает результаты в разрезе времени и количества лучей в секунду. В официальных таблицах бенчмарка представлены результаты пользователей с точки зрения времени, однако я считаю, что «лучей в секунду» является лучшим показателем (да и в общем, результаты, где «больше означает лучше», проще объяснять). Corona любит нагромождать потоки, поэтому результаты оказываются в сильной зависимости именно от количества потоков.

Blender 2.78

Старик в мире рендеринг-тестов, Blender всё еще очень популярный инструмент. Нам удалось запустить стандартную рабочую нагрузку на билде Blender от 5 февраля, и измерить время, необходимое для рендеринга первого кадра сцены. Блендер является одним из крупнейших инструментов с открытым исходным кодом, это означает, что как AMD, так и Intel работают активно, чтобы помочь улучшить кодовую базу, что может идти как на пользу, так и во вред их собственной микроархитектуре.

Это тот многопоточный тест, в котором 8-ядерный процессор Intel на базе Skylake выигрывает у нового AMD Ryzen 7 2700X; переменная многопоточность Blender означает, что здесь хорошо себя показывают сеточная архитектура и пропускная способность памяти. Хотя по соотношению цены и результата Ryzen 7 2700X легко выигрывает у лучших исполнителей. Ryzen 5 2600 легко обходит Core i7-6700K.

LuxMark v3.1

Как синтетический, LuxMark может показаться несколько ненадежным в качестве средства визуализации, учитывая, что он в основном используется для тестирования графических процессоров. Однако он предлагает как OpenCL, так и стандартный режим C ++. В этом случае, помимо сравнения в каждом варианте кодирования ядер и IPC, мы также видим, что код C ++ и OpenCL показывают разную производительность на одних и тех же процессорах.

POV-Ray 3.7.1b4

Еще один регулярный бенчмарк в большинстве наборов, POV-Ray. Еще один трассировщик лучей с многолетней историей. Как это часто случается, во время подготовки AMD к запуску Ryzen, база кода стала активно обновляться, так как разработчики вносят изменения в код и выпускают новые апдейты. Наша версия для тестов была взята как раз перед началом таких событий, но со временем мы видим, что код POV-Ray корректируется в соответствии с новыми требованиями.

Cinebench R15

Последняя версия CineBench также стала одной из тех программ, которые использовались везде, в частности, как индикатор производительности одного потока. Высокий уровень IPC и высокая частота дают производительность в ST, тогда как наличие хорошего масштабирования и многих ядер — это результат теста MT.

Intel по-прежнему остается однопоточным чемпионом в таких тестах, как CineBench, но, похоже, Ryzen 7 2700X занял лидерство в многопоточном тесте.

CPU Web Tests

Одна из проблем при запуске веб-тестов — это привычка современных браузеров автоматически устанавливать обновления. Это означает, что в любой продолжительный период бенчмаркинга правило «обновляй это за пределами состояния сравнения» будет всегда нарушено, особенно когда браузеры начинают обновляться, если вы дадите им хоть полсекунды подумать об этом. Несмотря на это, нам удалось найти ряд команд для создания необновляемой версии Chrome 56 для нашего тестового набора 2017. И хотя это означает, что мы не можем быть в ногу со временем с последней версией браузера, это делает оценки сравнения процессоров сопоставимыми.

SunSpider 1.0.2:<a href="">link

Самый старый веб-тест в этой части нашего обзора – SunSpider. Это очень простой инструмент на основе JavaScript-алгоритма, и в конечном итоге является более мерилом IPC и быстродействия памяти, чем что-либо еще, причем большинство высокопроизводительных процессоров показывают примерно равный результат. Базовый тест выполняет 10 циклов и выдает среднее значение. Мы выполняем этот базовый тест 4 раза.

Mozilla Kraken 1.1:link

Kraken — это еще один тест на основе Javascript, использующий тот же тестовый набор, что и SunSpider, но сосредоточенный на более строгих реальных случаях использования и библиотеках, таких как обработка звука и фильтры изображений. Опять же, основное тело теста проходит 10 циклов, и мы выполняем этот базовый тест четыре раза.

Google Octane 2.0:link

Крупнейшие разработчики браузеров, такие как Google и Mozilla, знают, что максимальная производительность JS зачастую является критическим моментом при сравнении с другими разработчиками ОС. Точно так же, как SunSpider является очень ранним тестом JS, а Kraken немного новее, Octane стремится быть более релевантным для реальных рабочих нагрузок, особенно в устройствах с ограниченными возможностями, таких как смартфоны и планшеты.

WebXPRT 2015:link

В то время как предыдущие три теста выполняют вычисления в фоновом режиме, а затем показывают набранные очки, WebXPRT предназначен для лучшей интерпретации визуальных рабочих нагрузок, с которыми сталкиваются профессиональные пользователи. Например, приложения на основе браузера, графические изображения, редактирование изображений, сортировка и анализ данных, научный анализ и финансовые инструменты.

CPU Encoding Tests

Одним из интересных элементов современных процессоров является производительность кодирования. Это включает в себя шифрование / дешифрование, а также перекодирование видео из одного видеоформата в другой. В случае шифрования / дешифрования производительность по-прежнему актуальна для шифрования конфиденциальных данных «на лету» — процесса, с помощью которого современные устройства обычно обеспечивают безопасность программного обеспечения. Использование перекодирования видео для подгонки качества, размера файла и разрешения видеофайла испытывает настоящий бум в последнее время. Это необходимо для подгонки видео под девайс потребителя, или для гейм-стримеров, которые желают выгружать перекодированный поток видео с камеры в режиме реал-тайм. По мере того, как мы переходим в живое 3D-видео, эта задача будет еще более приоритетной, и оказывается, что быстродействие определенных алгоритмов определяется функцией ввода / вывода содержимого.

7-Zip 9.2:link

Одним из фриварных архиваторов, позволяющих оценить производительность процессоров, является 7-Zip. Он работает под лицензией с открытым исходным кодом, является быстрым и простым в использовании инструментом для опытных пользователей. Мы запускаем тестовый режим через командную строку, выполняем четыре цикла и получаем результат.

WinRAR 5.40: link

Для тестового пакета 2017 мы воспользуемся последней версией WinRAR в нашем тесте архиваторов. WinRAR в некоторых аспектах более удобен для пользователя, чем 7-Zip, поэтому мы решили включить его в пакет. Вместо использования бенчмарк режима, как в случае с 7-Zip, здесь мы берем набор файлов, представляющих общий стек (33 видеофайла в 1,37 ГБ, 2834 файла меньшего размера в 370 папках по 150 МБ) сжимаемых и несжимаемых форматов. Показанные результаты — это время, затраченное на кодирование файла. Из-за кэширования DRAM мы запускаем тест 10 раз и получаем среднее значение для последних пяти запусков, когда бенчмарк находится в устойчивом состоянии.

WinRAR требует хорошей базы памяти, поэтому мы видим, что четырехканальные процессоры возглавляют список. Высокий IPC Core i7-8700K также прекрасно работает.

AES Encoding

Алгоритмы, использующие AES-кодирование, широко распространились по всему миру в качестве вездесущего инструмента для шифрования. Однако, это еще один тест-для-ЦПУ, а современные ЦПУ имеют расширение системы команд AES для увеличения производительности шифрования. Мы часто рассматриваем масштабирование как по частоте, так и по ядрам с помощью этого бенчмарка. Мы используем последнюю версию TrueCrypt и запускаем его в бенчмарк-режиме с 1 ГБ данных в DRAM. Показанные результаты — это среднее значение GB / s для шифрования и дешифрования.

HandBrake v1.0.2 H264 and HEVC: link

Как упоминалось выше, перекодирование видео (как кодирование, так и декодирование) является горячей темой в показателях производительности, поскольку темпы создания нового контента нарастают. Первое предположение – изменение стандарта форматирования видео, которое может происходить как с потерей, так и без потери качества. Так же возможно уменьшение качества видео в угоду размера файла. Наряду с любимым кодеком Google, VP9, есть еще два других часто используемых: H264, старый кодек, есть практически везде и оптимизирован для видео 1080p, и HEVC (или H265), целью которого является обеспечение того же качества, что и H264, но при более низком размере файла (или более высоком качестве для одного и того же размера). HEVC важен, поскольку способен передавать потоковое видео в качестве 4к, что означает передачу меньшего количества бит для одного и того же качественного контента.

Handbrake является предпочтительным инструментом для перекодирования, поэтому наш тестовый режим покрывает три области.

Низкое качество / разрешение H264: здесь мы перекодируем 2-часовую 640x266 H264 видеозапись и меняем кодировку с Main profile на High profile, используя very-fast предустановку.

Высокое качество / разрешение H264: аналогичный тест, но на этот раз мы берем десятиминутный двойной файл 4K (3840x4320), отображаемый на частоте 60 Гц и перекодированный с Main на High, используя very-fast предустановку.

Тест HEVC: используя то же видео в HQ, мы меняем разрешение и кодек исходного видео с 4K60 в H264 на 4K60 HEVC.

Для перекодирования видео большого размера у HandBrake предыдущего поколения есть проблема с новыми процессорами серии Ryzen-2000, но даже с учетом этого Core i7-8700K впереди с приличным отрывом. Core i5-8400 так же показывает себя хорошо, но уступает процессорам Ryzen.

CPU Office Tests

Офисные программы, которые мы используем для бенчмаркинга, — это не конкретные программы, а отраслевые стандартные тесты, которые имеют вес в профессиональной среде. Цель этих тестов — использовать набор программ и методов, с которыми может столкнуться обычный офисный пользователь, например, видеоконференции, редактирование документов, архитектурное моделирование и так далее и тому подобное.

Chromium Compile (v56)

Наш новый тест компиляции использует Windows 10 Pro, VS Community 2015.3 с Win10 SDK для компиляции ночной сборки Chromium. Мы подготовили тест для сборки в конце марта 2017 года, и в нашем тесте мы запускаем новую полную компиляцию. Компиляция — типичный пример рабочей нагрузки с переменной многопоточностью — некоторые процессы компиляции и привязки линейны, тогда как другие части являются многопоточными.

Проведя тестирование на компиляцию, мы видим, что новые компоненты серии Ryzen-2000 сделали серьёзный шаг вперед по сравнению с первым поколением, вероятно, из-за уменьшения времени ожидания кэша и нового precision boost. Производительность за доллар у 8700K и 2700X, похоже, оказалась примерно одинаковой.

PCMark8: link

Несмотря на то, что PCMark впервые появился на свет в 2008/2009 году, Futuremark поддерживает PCMark8, и он остаётся актуальным в 2017 году. В масштабах сложных задач PCMark больше ориентируется на низкопроцентный диапазон профессиональных нагрузок, что делает его хорошим индикатором того, что люди считают «офисной работой». Мы запускаем бенчмарк из командной строки в «традиционном» режиме, то есть C ++ без OpenCL, чтобы удалить графическую карту из уравнения и сосредоточиться исключительно на процессоре. PCMark8 предлагает Home, Work и Creative рабочую нагрузку, при этом некоторые тесты программного обеспечения являются общими, а другие уникальны для каждого набора тестов.

PCMark 10

GeekBench4

Если вы живете и дышите GeekBench 4, то результаты однопоточных тестов вознесет Intel на первое место. Что касается многопоточных тестов, лучшие компоненты Intel и AMD идут ноздря в ноздрю, однако видно, что четырехъядерные процессоры предыдущего поколения отстают.

CPU Legacy Tests

Наши устаревшие тесты представляют собой контрольные показатели, которые когда-то были впереди своего времени. Некоторые из них являются синтетическими стандартами в промышленности, и у нас есть данные, приходящие в течение уже 10 лет. Все данные здесь были повторно запущены в Windows 10, и мы планируем вернуться к нескольким поколениям компонентов, чтобы узнать, как развилась производительность.

3D Particle Movement v1

3DPM — это написанный нами тест, применяющий базовые алгоритмы 3D-движения, используемые в симуляциях Броуновского движения, и их тестирование на скорость. Высокая производительность вычислений с плавающей точкой, МГц и IPC покажут себя в версии с одним потоком, тогда как многопоточная версия работает с потоками и любит много ядер. Это оригинальная версия, написанная в стиле типичного «не компьютерного» студента, кодирующего алгоритм для теоретической проблемы. Она поставляется без каких-либо неочевидных оптимизаций, которые еще не выполняются компилятором, например false sharing.

CineBench 11.5 and 10

Cinebench — широко известный инструмент для измерения производительности, имеющий отношение к анимационному программному обеспечению MAXON Cinema 4D. Cinebench оптимизировался в течение десятилетия и фокусируется только на мощности процессора. Это означает, что если есть несоответствие характеристик пропускной способности, Cinebench, скорее всего, покажет это несоответствие. Возможно, другое программное обеспечение не использует все доступные инструменты для нагрузки процессора, поэтому релевантность теста для реального мира может быть чисто академической, но, учитывая нашу большую базу данных для Cinebench, трудно игнорировать небольшой пятиминутный тест. В этом тесте мы запускаем современную версию 15, а также старые 11,5 и 10 из-за наших сохраненных данных.

x264 HD 3.0

Аналогично, пакет x264 HD 3.0, который мы здесь используем, также хранится для исторических регрессионных данных. Последняя версия 5.0.1, и она кодирует видеоролик 1080p в высококачественный x264-файл. Версия 3.0 выполняет то же тест в файле 720p, и в большинстве случаев производительность программного обеспечения достигает предела для high-end процессоров, но все еще хорошо работает для среднего и младшего уровня. Кроме того, эта версия выполняется всего несколько минут, тогда как последняя может занять более 90 минут.

Gaming Performance: Civilization 6

Итак, первая игра в наших процессорных гейм-тестах — Civilization 6. Изначально запущенная Sid Meier и его командой, Civ серия пошаговых стратегий стала культовой классикой. Было принесено много извинений за бессонные ночи игроков, которые не могли заставить Ганди начать войну из-за переполнения целых чисел. По правде говоря, я никогда не играл первую версию, но зато играл в каждую часть со второй по шестую, в том числе четвертую, озвученный покойным Леонардом Нимоем. Это игра, в которую легко играть, но трудно играть хорошо.

Бенчмаркинг Civilization всегда был чем-то вроде оксиморона — для пошаговой стратегической игры частота кадров не особенно важна, и при правильном настроении, достаточно всего 5 кадров в секунду для хорошей игры. Однако с Civilization 6 Firaxis ударилась в хардкор и подняла планку визуализации, пытаясь вовлечь вас в игру. В результате, Civilization может потребовать от игрока новую видеокарту и процессор, особенно если играть с высокой детализацией под DirectX 12.

Возможно, более востребованный результат будет виден во время поздней игры, когда, в более старых версиях, Civilization могло потребоваться 20 минут, чтобы сделать ход игроков AI и передать контроль человеку. Новая версия Civilization имеет интегрированный «AI Benchmark», хотя в настоящее время она еще не входит в наш портфель тестов по техническим причинам, которые мы пытаемся решить. Вместо этого мы запускаем графический тест, который обеспечивает пример средних настроек игры в опциях.

Для разрешений 1920x1080 и 4K мы запускаем одинаковые настройки. Civilization 6 имеет слайдеры для MSAA, Использование Производительности и Использование Памяти. Последние два относятся к детализации и размеру текстур соответственно и оцениваются от 0 (самый низкий) до 5 (экстремальный). Мы запускаем наш Civ6-тест в четвертой позиции для производительности (ультра) и 0 в памяти, а MSAA — 2x.

Для обзоров, где мы используем тесты 8K и 16K (Civ6 позволяет сравнивать экстремальные разрешения на любом мониторе) на нашем GTX 1080, мы запускаем тесты 8K, такие же, как 4K, но тесты 16K установлены на самый низкий вариант производительности.

MSI GTX 1080 Gaming 8G Performance

1080p

16K

Shadow of Mordor

Следующее имя в нашей битве производительности – РПГ-экшн с открытым миром Middle Earth: Shadow of Mordor (коротко SoM). Игра создана Monolith на движке LithTech Jupiter EX с множеством дополнительных надстроек. SoM углубляется в детализацию и сложность. Основной сюжет игры был написан тем же писателем, что писал Red Dead Redemption, и SoM получила награду Zero Punctuation's Game of the Year в 2014 году.

Игры 2014 года весьма устарели для современного тестирования, но SoM имеет стабильный код и множество поклонников, и всё еще может дать стрессовую нагрузку на компьютер игрока. В то время SoM был уникальным, предлагая динамическое разрешение экрана, позволяющее пользователям использовать настройки с высоким разрешением, которые затем уменьшаются до возможностей монитора. Эта форма естественной передискретизации была спроектирована так, чтобы позволить пользователю получить более полное представление о том, чего хотели разработчики, если у вас есть достаточно мощное графическое оборудование, но нет монитора под разрешение-4K.

В игре имеется встроенный бенчмарк, и его мы запускаем с применением скрипта, который производит настройку графики, стартует бенчмарк, и парсит результаты, которые тест сбрасывает на диск. Настройки графики включают стандартные параметры, такие как Graphical Quality, Lighting, Mesh, Motion Blur, Shadow Quality, Textures, Vegetation Range, Depth of Field, Transparency и Tessellation. Так же имеются стандартные предустановки.

Мы запускаем бенчмарк на 1080p и нативном 4K, используя наши 4K-мониторы, в настройках Ultra. Результаты усредняются по четырем прогонам, и мы выводим средний FPS, 99 процентиль и time under анализ.

MSI GTX 1080 Gaming 8G Performance

1080p

Rise of the Tomb Raider

Одной из новейших игр в нашем наборе игровых тестов является Rise of the Tomb Raider (RoTR), разработанная компанией Crystal Dynamics, она же сиквел популярного Tomb Raider, который был любим за свой встроенный автоматический бенчмарк режим. Но не обманитесь: бенчмарк режим в RoTR сильно отличается от прошлого.

Визуально предыдущий Tomb Raider поднял планку реализма практически до уровня TressFX, и новый RoTR поднимается еще на ступеньку выше в плане достоверности графики. Это приводит к интересному набору требований к аппаратным средствам: некоторые разделы игры, как правило, ограничены графическим процессором, тогда как другие, с большим количеством физики на больших дистанциях могут быть ограничены ЦП, в зависимости от того, как драйвер распределит рабочую нагрузку DirectX 12.

Там, где у старой игры была одна эталонная сцена, в новой игре есть три разных сцены с разными требованиями: геотермальная долина (1-Долина), Могила Пророка (2-Пророк) и позвоночник горы (3-го гора) — и мы тестируем все три. Это три сцены, которые должны быть взяты из игры, но было отмечено, что сцены, подобные 2-Пророку, показанные в эталонном тесте, могут быть самыми ограниченными из CPU элементами всего этого уровня, а показанная сцена представляет собой лишь небольшую часть этого уровня. Из-за этого мы сообщаем результаты для каждой сцены на каждой видеокарте отдельно.

Настройки графики для RoTR похожи на опции других игры этого типа, предлагая некоторые пресеты или позволяя пользователю настраивать качество текстуры, уровни анизотропного фильтра, качество теней, мягкие тени, окклюзию, глубину резкости, тесселяцию, отражения, листву, блюм и фичи наподобие PureHair, которые позволяет использовать библиотека TressFX.

По-прежнему, мы тестируем игру на разрешении 1920x1080 и 4K, используя наши собственные 4K-дисплеи. На 1080p мы запускаем пресет High, а в 4K мы используем предварительную настройку Medium, которая по-прежнему наносит значительный удар по частоте кадров.

Стоит отметить, что тест RoTR немного отличается от наших других эталонных тестов тем, что игра сохраняет свои графические настройки в реестре, а не стандартный INI-файл, и в отличие от предыдущей игры встроенный бенчмарк TR не может быть вызван из командной строки. Тем не менее, несмотря на сложности, мы подготовили сценарий для автоматического запуска бенчмарка четыре раза и парсинга результатов. Из полученных данных мы выводим средний FPS, 99 процентиль и time under анализ.

MSI GTX 1080 Gaming 8G Performance

1080p

Rocket League

Веселые простые игры в стиле «играй – собирай» отличная забава. По этой причине я большой поклонник франшизы Katamari – просто жмешь «старт» на контроллере, и катишься вперед, подбирая предметы, чтобы вырасти. Чрезвычайно просто. Ну а пока мы не получим версию Катамари на ПК, которую я могу протестировать, мы сосредоточимся на Rocket League.

Rocket League применяет элементы pick-up-and-play, позволяя пользователям вступать в игру с другими людьми (или ботами), чтобы сыграть в футбол без правил на автомобилях. Игра создана на движке Unreal Engine 3, который на данный момент хотя и устарел, но зато позволяет пользователям как запускать игру на низко-производительных системах, так и выжать все ресурсы из систем помощнее. С момента выпуска в 2015 году было продано более 5 миллионов копий игры, которая, похоже, стала звездой в локальных сетях и игровых шоу. Пользователи, которые тренируются играть, становятся очень серьезными, сражаясь в командах и лигах с очень небольшим количеством настроек, и все находятся на одном уровне. Rocket League уверенно становится одним из громких названий в мире киберспорта, а что особенно приятно — когда соревнования можно посмотреть прямо из игрового интерфейса.

Исходя из перечисленных факторов, а также потому, что это эту игру очень приятно запустить и поиграть, мы решили найти лучший способ протестировать её. К сожалению, большая часть автоматических тестов для игр здесь не подойдет. Кроме того, благодаря движку Unreal 3, Rocket League не имеет бенчмарк режима. В этом случае мы должны разработать плотный прогон и записать частоту кадров.

Как уже сказано, у Rocket League нет бенчмарк режима, поэтому мы должны выполнить серию автоматических действий, подобных гоночной игре с фиксированным числом кругов. Мы применяем следующий подход: используя Fraps для записи времени, затраченного на показ каждого кадра (и общей частоты кадров), мы применим инструмент автоматизации, чтобы запустить игру с ботами 4v4, при этом система должна выполнить серию действий во время матча, например, переключение углов камеры и движение.

Так вышло, что описанный метод весьма точно отображает данные по реальному матчу с ботами, включая движение, столкновения, усиления или даже получение внезапной помощи, как бы это ни странно звучало для автоматизированного набора команд. Чтобы поддерживать согласованность, применяемые нами команды не являются случайными, а так же фиксированны по времени. Мы также проводим тесты на одной и той же карте (Aquadome, которая, как известно, является тяжелой картой для графических процессоров из-за воды / прозрачности) и с постоянными настройками автомобиля. Мы начинаем запись сразу после начала матча и записываем в течение 4 минут игрового времени (думаю, 5 кругов DIRT: Rally benchmark), и определяем среднюю частоту кадров, 99-й процентиль и time under.

MSI GTX 1080 Gaming 8G Performance

1080p

Grand Theft Auto

Долгожданная итерация франшизы Grand Theft Auto попала на полки 14 апреля 2015 года, и AMD, и NVIDIA приложили усилия для оптимизации игры. В GTA нет графических пресетов, но все же игра открывает новые возможности для пользователей и расширяет границы современной графики, нагружая даже самые мощные компьютеры до предела при помощи Advanced Game Engine от Rockstar под DirectX 11. Независимо от того, летает ли пользователь высоко в горах, где понадобится прорисовка мира на дальних дистанциях, или имеет дело с сортированным мусором в городе, когда он сгибается до максимума, игра создает потрясающие визуальные эффекты, плюс напряженную работу как для процессора, так и для графической карты.

Для тестирования мы написали несколько скриптов для встроенного в игру бенчмарка. Внутренний бенчмарк включат пять сценариев: четыре коротких панорамных сцены с переменным освещением и погодными эффектами, плюс пятая – последовательность действий продолжительностью около 90 секунд. Мы решили использовать только последнюю сцену, которая включает полет на реактивном самолете, затем поездку на автомобиле через город через несколько перекрестков, и в конце — столкновение с бензовозом, который взрывается, как и автомобили вокруг него. Это отличное сочетание рендеринга дальних дистанций, за которым следуют действия с рендерингом на ближней дистанции. И к счастью, игра выдаёт все необходимые результаты тестов.

В GTA нет графических предустановок, зато пользователь может вручную настраивать параметры, такие как плотность населения и дальность прорисовки с помощью слайдеров. Некоторые параметры, такие как текстура / тень / шейдеры / качество воды переключаются от низкого качества до очень высокого. Другие варианты настроек включают MSAA, мягкие тени, пост-эффекты, разрешение теней и расширенные настройки дистанционного рендеринга. В верхней части экрана есть удобная опция, который показывает, сколько видеопамяти будет потреблять игра при этих параметрах, с очевидными последствиями, если пользователь запрашивает больше видеопамяти, чем имеет на карте (хотя нет очевидной подсказки, если у вас слабая GPU с большим количеством видеопамяти, например, R7 240 4 ГБ).

В итоге, мы запускаем тесты в разрешении 1920x1080, используя значения Very High в настройках, а также на 4K с использованием значения High в большинстве из них. Результатом будут средние значения по четырем прогонам, средний показатель частоты кадров, 99-м процентиль и time-under анализ.

MSI GTX 1080 Gaming 8G Performance

1080p

4К

Выводы: бремя конкуренции

На протяжении всех приключений AMD и Zen погоня за высокопроизводительными вычислениями x86 имеет две цели: быть конкурентоспособными, и быть лучшими. Несомненно, первое поколение Ryzen преуспело в том, чтобы быть конкурентоспособным, а аналитики и торговые точки демонстрируют процессоры Ryzen в топ-списках продаж, и предоставляют аналитические тесты, где лучшие чипы AMD конкурируют с высокопроизводительными десктоп компонентами Intel. Цель на следующие нескольких лет состоит в том, чтобы захватить эти легкодоступные преимущества микроархитектурны, а позднее получить и использовать преимущества нового техпроцесса. Первый этап — второе поколение Ryzen, известное как серия Ryzen-2000.

В этом обзоре мы показали, что AMD выполнила свою задачу по дополнительному увеличению чистой производительности на 3%, при этом наши показатели показывают + 3,1%. Объединив это с увеличением частоты, полученным от производственного процесса GlobalFoundries 12nm, и турбо-функциями, как Precision Turbo Boost, которые делают интуитивно понятным большинство температурных ограничений, AMD в целом достигла 10-процентного прироста производительности между поколениями. Это звучит не так уж и честно, так как на первый взгляд это всего лишь небольшие улучшения процесса производства, а также некоторое разумное сокращение латентности кэша. Если бы это была Intel, мы бы кричали о большом и резком прорыве, но AMD все сидит на Zen дизайне, и основное внимание уделяется следующему полному микроархитектурному обновлению в Zen 2. Поэтому большинство пользователей и журналистов поднимают большие пальцы вверх в знак доверия к AMD сейчас, надеясь увидеть больший скачок в следующий раз.

4K гейминг анализ

Тем не менее, все хотят знать о результатах тестов серии Ryzen 2000. Мы начинаем с игр, и в первую очередь с наших графиков производительности/цены по итогам хай-энд 4K гейминга. Наши результаты берут R7 1800X в качестве базовых «100%», и мы показываем среднее геометрическое по всем нашим игровым тестам на 4K.

Как видно из результатов, новые процессоры серии Ryzen 2000 улучшили показатели по сравнению с Ryzen 7 1800X, и даже с Ryzen 5 2600, на 1-3%. Процессоры Intel были на 0-4% выше 1800X, причем оба процессора Coffee Lake находились на этой вершине в +4%. В тестах, ограниченных графическим процессором, есть определенная польза от одноядерной производительности, но все современные процессоры на разумной частоте справляются вполне успешно.

Для 99-х процентильных графиков новые процессоры AMD либо набирают уровень, либо уже превзошли Ryzen 1000-series. Для наших тестов Intel, 6700K / 7700K предыдущих поколений отстают на 3% по сравнению с 1800X, а остальные на 4% превышают 1800X. Фаворит Intel — Coffee Lake — получает первое место, но все процессоры (за исключением Bristol Ridge, A12-9800) повысили свои результаты.

Гейминг анализ 1080p

Ключевым аспектом для многих пользователей является игра с более низким разрешением: 1920x1080 по-прежнему доминирует в игровых настройках, независимо от того, насколько мы, энтузиасты, хотим видеть большее количество пикселей. Некоторые читатели обратились к нам с заявлением, что они по-прежнему покупают лучшую возможную графическую карту, но работают с частотой 200+ FPS при низких разрешениях, просто для оперативности. Тесты с низким разрешением — плохое представление о будущей производительности процессора, но нам важно то, что мы видим сегодня.

В этом разрешении Ryzen 7 2700X поднимается примерно на +7% по сравнению с предыдущим поколением 1800X, а новые 65W-компоненты легко соответствуют 1800X. Пользователи, которые смотрят на бюджетный Ryzen 5 1600, бестселлер AMD в прошлом году, теперь могут обратить внимание на 2600 (+7%) или 2600X за (+10% в сравнении с 1600)

И всё же Intel выигрывает и здесь. Благодаря более высокой скорости IPC и тактовой частоте процессоры Coffee Lake на 8-10% выше по сравнению с Ryzen 7 2700X, и находятся в диапазоне от +3% до +25% в зависимости от модели. При этом наши результаты показывают, что Ryzen 7 2700X поднялся выше процессоров прошлого поколения Intel, позволяя 2700X победить с небольшим отрывом от Kaby Lake и 5% + отрывом от Skylake.

График 99-го процентиля на 1080p выглядит как растянутая версия графика средней частоты кадров, и это в целом это так: процессоры, лучшие на 1080p, работают еще лучше на процентили. Из всех показателей, где AMD должна быть конкурентоспособной, это тот, где новое повышение производительности работает лучше всего, но похоже, есть над чем потрудиться. Честно говоря, результаты будут выглядеть лучше, если и когда AMD сможет соответствовать Intel по частоте. AMD также имеет дефицит скорости отклика DRAM в основной памяти, который мы назвали фактором в предыдущем тестировании на 99-процентную частоту кадров. Будет интересно, если AMD сможет обеспечить более высокую поддерживаемую частоту памяти быстрее, чем Intel, потому что это действительно важно здесь.

Анализ рабочей станции

В соревновании основных процессорных серий, с Ryzen-1000 AMD поставила восемь ядер и шестнадцать потоков против Intel Kaby Lake с четырьмя ядрами и восемью потоками. На этот раз Intel предлагает шесть ядер в Coffee Lake, и теперь 12 потоков Intel противостоят 16-ти на AMD. AMD так же подняло планку частоты турбо режима, но Intel выводит бюджет мощности далеко за пределы, указанные для процессора. Итак, в среднем диапазоне, где было четыре потока против двенадцати, теперь шесть против двенадцати, однако Intel снова выдает более высокие частоты.

В наших однопоточных тестах новые серии Ryzen-2000 теперь соответствуют производительности процессоров Intel Skylake. В прошлом раунде сравнений Intel по-прежнему имела некоторое преимущество, но теперь они равны. К огорчению AMD, Intel всё ещё на два поколения впереди, благодаря Kaby Lake и Coffee Lake, которые показывают прекрасные одноядерные характеристики за счет дополнительной частоты. Это означает, что Core i5-8400 действительно превосходит лучшие AMD при однопоточности, а Core i7-8770K – просто царь горы.

В многопоточных рабочих нагрузках вступает в игру ряд дополнительных переменных. Это характер потока в каждом ядре, какие части ядра являются динамическими или статически разделенными, управление памятью и кэшем. Здесь AMD была агрессивна в отношении латентности и размера кэша низкого уровня, однако неинклюзивный кэш AMD L3 соревнуется здесь с write-back кэшем L3 от Intel, который является более полезным, а также с основной памятью, имеющей более низкую задержку.

То, что наблюдаем здесь касательно AMD — только Ryzen 7 2700X затмевает старый Ryzen 7 1800X, а 2700 — отстает. В этом ценовом диапазоне, большее количество потоков чипа AMD дает ему здоровое преимущество над Coffee Lake i7-8700K, а также он затмевает восьмиъядерный Skylake-X Core i7-7820X в большинстве тестов. Важно заметить, что предыдущие поколения процессоров Intel i7-6700K и i7-7700K очень сильно отстают от конкурентов, и даже от самого последнего процессора AMD Ryzen второго поколения — Ryzen 5 2600.

Если бы кто-то сказал несколько лет назад, что AMD разработает процессор Ryzen второго поколения в 2018 году, который затмит процессоры Intel Skylake и Kaby Lake, я бы рассмеялся. Но вот мы и говорим об успехе AMD. Если пользователь хочет получить чип для многопоточной рабочей нагрузки, $ 199 Ryzen 5 2600 — лучший бюджетный процессор на рынке сегодня.
В этом средне-уровневом ценовом соревновании Ryzen 5 2600 также легко обходит Core i5-8400. Это не сражение, а избиение.

Общие мысли

Производитель где-то теряет, где-то выигрывает, но клиенты выигрывают всегда

Когда существует конкуренция, каждый продукт должен сделать свою лучший рывок вперед. Нести эту ношу непросто, с существующими взаимоотношениями и высокими бюджетами. Но каждый прорыв заставляет конкурента реагировать, и это победа для клиентов. В последние годы Intel в основном критикуют за застой — незначительные обновления текущего процесса в ожидании появления нового; с такой продолжительной стагнацией всё, что конкурентоспособно, будет выглядеть привлекательно на рынке. Те, кто находится внутри индустрии, могут сказать, что, хотя Intel выпускает итерации по аналогичному 14-нм дизайну каждый год, ожидая выхода 10 нм, AMD сделала свой лучший шаг вперед с Zen и Ryzen на 14 нм, теперь следующий с Ryzen 2 на GF 12 нм.

На этот раз сведение итогов до простых рекомендаций на самом деле будет очень простым.

Любые пользователи, которым нужна высокая однопоточная производительность или высокопроизводительные игры 1080p с использованием графического процессора среднего класса, могут выбрать Core i5-8400 от Intel как отличное решение.

Для хардкорных энтузиастов, работающих на high-end графике на 4K или, как и в их общих вычислениях, серия Ryzen 2000 выглядит наилучшим выбором. В каждой ценовой позиции AMD может соответствовать потребностям игрока в 4K, и выигрывает в чистой пропускной способности.
AMD также поставляет с каждым процессором вполне достойный кулер, чем Intel в последние годы пренебрегает, что делает продукт еще более привлекательным.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Tags:

Hubs: