fortyseven Jul 23 2014 at 12:24

Выделенные серверы на базе процессоров Intel Avoton

5 min

18K

Selectel corporate blog

+35

Comments 25

DancingOnWater Jul 23 2014 at 13:25

А теперь вопрос. Исходя из вашего поста HyperThreading мешала увеличению числа ядер.Почему?

fortyseven Jul 23 2014 at 14:48

Предполагаю, что потребовались бы дополнительные блоки (и следовательно транзисторы) в диспетчере инструкций (dispatcher), а транзисторный бюджет этого процессора и так очень мал из-за минимального энергопотребления.

DancingOnWater Jul 23 2014 at 16:20

Входит несколько в противоречие с

>Одной из отличительных черт архитектуры Silvermont является отказ от технологии HyperThreading. Повышение производительности много поточных приложений достигается за счет увеличения числа физических ядер.

Просто из этого следует, что убили HT, но добавили ядра. Посчитали, что коэффициент производительность/ВТ у ядра выше?

fortyseven Jul 23 2014 at 17:56

Вам лучше спросить это у представителей Интел =)

SamOwaR Jul 24 2014 at 00:49

Просто из этого следует, что убили HT, но добавили ядра. Посчитали, что коэффициент производительность/ВТ у ядра выше?

Дело скорее всего в том, что в старых Atom-ах HT был чрезвычайно эффективен из-за общей тормознутости ядра — in-order архитектура и крайне медленная память приводили к тому, что ядро очень часто просто ждало данных, простаивало, вот в эти моменты и задействовался HT. В новых же Atom-ах память на порядок быстрее: 25.6GB/s против 6.4GB/s, два канала против одного, максимальный объём 64GB против 4-х, частота 1600 против 1066. К тому же новая архитектура с внеочередным исполнение команд. Таким образом, в новом ядре будет меньше простоев, которыми потенциально мог бы воспользоваться второй «виртуальный» процессор HT.

DancingOnWater Jul 24 2014 at 10:18

Вот за такие комментарии я и люблю Хабр.

datacompboy Jul 23 2014 at 15:07

реальная польза HT значительно ниже, чем рекламируется.
«2 ядра» в форме HT в реале максимум 1.2 ядра, и то не на всех задачах.

как по мне, так технология бесполезная en-masse; хотя и полезна в некоторых конкретных задачах.

DancingOnWater Jul 23 2014 at 16:15

Ну, помнится я получал ускорение в 1.7

datacompboy Jul 23 2014 at 16:17

в какой задаче? я на вычислительных задачах получал 0.8.
которые удалось переделать в 1.1 путем ручного распределения потоков по ядрам.

DancingOnWater Jul 24 2014 at 10:12

Обработка изображений. А если быть точнее обработка кадров с телескопа.

ElleSolomina Jul 23 2014 at 20:25

Всё относительно :) AMD вон вообще 4х ядерные процессоры с чем то похожим на HT называет 8ми ядерными, у них правда разделённые блоки только для векторных инструкций (SSE и т. п.) а не для большей части конвеера.

Формально HT это действительно 1.2 — 1.25 процессора, но для приложений с инструкциями только «легаси x86» это всё таки почти 2 ядра, да и количество инструкций на цикл повышается. Конечно в случае HT предсказатель переходов и многие другие блоки ядра содержаться в единичном экземпляре, но повышение эффективности утилизации конвеера процессора имеет место быть, в следствии этого увеличивается и энергоэффективность.

Да и достаточно вспомнить какой эффект давало включение и выключение HT в одноядерных P4, правда там и конвеер был «чертовски длинный»… Хотя и сейчас этот эксперимент можно провести, правда не в каждом биос возможно оставить включённым только одно ядро, да и управлять HT не везде позволяют :)

В общем даже без учёта производительности HT давал больший «юзер экспириенс» из-за сокращения подлагиваний в системе поскольку появилась какая никакая а многопоточность.

aik Jul 23 2014 at 13:31

конфигурация (Intel Atom C2758 2.4ГГц, 8ГБ DDR3, 2×1ТБ SATA) хорошо подойдет для решения таких задач, как обслуживание статических веб-страниц

Мда… 21 век наступил, чтобы статичные странички показывать уже 8 гигов оперативки надо… :)

+11

porzione Jul 23 2014 at 17:36

Ну вдруг там 2ТБ статики и все в кэше )

zapimir Jul 23 2014 at 20:20

Ну так кэширование в памяти никто не отменял же?

ElleSolomina Jul 23 2014 at 20:39

Да я тоже обратил на это внимание и вспомнил как доводилось однажды писать веб морду к девайсу с контроллером и 2 кБ ОЗУ на все задачи, там правда TCP/IP стек в микрухе рядом аппартный был и ОС как таковой не было, но вот статические ресурсы (картинки, css и каркасы страниц) из флеша контроллера грузились «методом лома и какой то матери» т.е. через самописный printf, который не копируя ничего в ОЗУ контроллера сразу складывал форматированные данные в буфер эзернет микрухи.

Но всё относится скорее к хабу ненормальное программирование :) Всё думаю написать статью по этому поводу, но заглядывая в тот код понимаю, что для меня сегодняшнего это сильно похоже на плохой код, а рефакторить проект и приводить его к приличному виду только ради статьи просто лень.

Samuel_Leonardo Jul 23 2014 at 13:31

с2758 все же Rangeley, а не Avoton
ark.intel.com

fortyseven Jul 23 2014 at 14:50

Да, все верно. С тех пор как мы начали работу с Интелом по данным процессорам, они успели переименовать их раза два, а в наших роадмапах так и осталось старое название. То есть так исторически сложилось =)

tractus_lepus Jul 23 2014 at 13:51

А какова плотность размещения данных серверов? Т.е. сколько их можно разместить в расчете на 1U?

fortyseven Jul 23 2014 at 18:21

Зависит от того какое шасси будете использовать, можно и до 20 серверов в 3 юнита. Но мы старались минимизировать стоимость, поэтому используем стандартные одноюнитовые корпусы Supermicro.

tractus_lepus Jul 23 2014 at 23:59

А можно ссылку на такое шасси? Сразу прошу прощения у всех за оффтоп.

fortyseven Jul 24 2014 at 19:52

Например у HP шасси и модули

tractus_lepus Jul 24 2014 at 20:07

О, спасибо.

begemot_nn Jul 23 2014 at 14:49

Если вас не затруднит, конфиг sysbench, с которым получены эти результаты, покажите?

fortyseven Jul 23 2014 at 14:52

sysbench --version
sysbench 0.4.12

sysbench --num-threads=32 --test=cpu --cpu-max-prime=200000 run
sysbench --num-threads=64 --test=threads --thread-yields=10000 --thread-locks=8 run
sysbench --num-threads=128 --test=mutex run
sysbench --num-threads=128 --test=memory run

SamOwaR Jul 24 2014 at 00:31

Поддерживается и технология Turbo Boost, с помощью которой производительность автоматически увеличивается при пиковых нагрузках. Так, тактовая частота 2,4 ГГц при применении Turbo Boost может быть увеличена до 2,7 ГГц.

Процессор, который вы предлагаете, относится к семейству Rangeley (8-ка в конце номера модели) и Turbo-Boost не поддерживает, зато в нём есть мощный криптографический акселератор и компрессор (технология Intel QuickAssist), которого нет в Avaton-ах.

В общем случае семейство Avoton позиционируется как универсальная числодробилка, а Rangeley как сетевой процессор.