Pull to refresh

Comments 25

А теперь вопрос. Исходя из вашего поста HyperThreading мешала увеличению числа ядер.Почему?
Предполагаю, что потребовались бы дополнительные блоки (и следовательно транзисторы) в диспетчере инструкций (dispatcher), а транзисторный бюджет этого процессора и так очень мал из-за минимального энергопотребления.
Входит несколько в противоречие с

>Одной из отличительных черт архитектуры Silvermont является отказ от технологии HyperThreading. Повышение производительности много поточных приложений достигается за счет увеличения числа физических ядер.

Просто из этого следует, что убили HT, но добавили ядра. Посчитали, что коэффициент производительность/ВТ у ядра выше?
Вам лучше спросить это у представителей Интел =)
Просто из этого следует, что убили HT, но добавили ядра. Посчитали, что коэффициент производительность/ВТ у ядра выше?
Дело скорее всего в том, что в старых Atom-ах HT был чрезвычайно эффективен из-за общей тормознутости ядра — in-order архитектура и крайне медленная память приводили к тому, что ядро очень часто просто ждало данных, простаивало, вот в эти моменты и задействовался HT. В новых же Atom-ах память на порядок быстрее: 25.6GB/s против 6.4GB/s, два канала против одного, максимальный объём 64GB против 4-х, частота 1600 против 1066. К тому же новая архитектура с внеочередным исполнение команд. Таким образом, в новом ядре будет меньше простоев, которыми потенциально мог бы воспользоваться второй «виртуальный» процессор HT.
Вот за такие комментарии я и люблю Хабр.
реальная польза HT значительно ниже, чем рекламируется.
«2 ядра» в форме HT в реале максимум 1.2 ядра, и то не на всех задачах.

как по мне, так технология бесполезная en-masse; хотя и полезна в некоторых конкретных задачах.
в какой задаче? я на вычислительных задачах получал 0.8.
которые удалось переделать в 1.1 путем ручного распределения потоков по ядрам.
Обработка изображений. А если быть точнее обработка кадров с телескопа.
Всё относительно :) AMD вон вообще 4х ядерные процессоры с чем то похожим на HT называет 8ми ядерными, у них правда разделённые блоки только для векторных инструкций (SSE и т. п.) а не для большей части конвеера.

Формально HT это действительно 1.2 — 1.25 процессора, но для приложений с инструкциями только «легаси x86» это всё таки почти 2 ядра, да и количество инструкций на цикл повышается. Конечно в случае HT предсказатель переходов и многие другие блоки ядра содержаться в единичном экземпляре, но повышение эффективности утилизации конвеера процессора имеет место быть, в следствии этого увеличивается и энергоэффективность.

Да и достаточно вспомнить какой эффект давало включение и выключение HT в одноядерных P4, правда там и конвеер был «чертовски длинный»… Хотя и сейчас этот эксперимент можно провести, правда не в каждом биос возможно оставить включённым только одно ядро, да и управлять HT не везде позволяют :)

В общем даже без учёта производительности HT давал больший «юзер экспириенс» из-за сокращения подлагиваний в системе поскольку появилась какая никакая а многопоточность.
конфигурация (Intel Atom C2758 2.4ГГц, 8ГБ DDR3, 2×1ТБ SATA) хорошо подойдет для решения таких задач, как обслуживание статических веб-страниц


Мда… 21 век наступил, чтобы статичные странички показывать уже 8 гигов оперативки надо… :)
Ну вдруг там 2ТБ статики и все в кэше )
Ну так кэширование в памяти никто не отменял же?
Да я тоже обратил на это внимание и вспомнил как доводилось однажды писать веб морду к девайсу с контроллером и 2 кБ ОЗУ на все задачи, там правда TCP/IP стек в микрухе рядом аппартный был и ОС как таковой не было, но вот статические ресурсы (картинки, css и каркасы страниц) из флеша контроллера грузились «методом лома и какой то матери» т.е. через самописный printf, который не копируя ничего в ОЗУ контроллера сразу складывал форматированные данные в буфер эзернет микрухи.

Но всё относится скорее к хабу ненормальное программирование :) Всё думаю написать статью по этому поводу, но заглядывая в тот код понимаю, что для меня сегодняшнего это сильно похоже на плохой код, а рефакторить проект и приводить его к приличному виду только ради статьи просто лень.
Да, все верно. С тех пор как мы начали работу с Интелом по данным процессорам, они успели переименовать их раза два, а в наших роадмапах так и осталось старое название. То есть так исторически сложилось =)
А какова плотность размещения данных серверов? Т.е. сколько их можно разместить в расчете на 1U?
Зависит от того какое шасси будете использовать, можно и до 20 серверов в 3 юнита. Но мы старались минимизировать стоимость, поэтому используем стандартные одноюнитовые корпусы Supermicro.
А можно ссылку на такое шасси? Сразу прошу прощения у всех за оффтоп.
Если вас не затруднит, конфиг sysbench, с которым получены эти результаты, покажите?
sysbench --version
sysbench 0.4.12

sysbench --num-threads=32 --test=cpu --cpu-max-prime=200000 run
sysbench --num-threads=64 --test=threads --thread-yields=10000 --thread-locks=8 run
sysbench --num-threads=128 --test=mutex run
sysbench --num-threads=128 --test=memory run
Поддерживается и технология Turbo Boost, с помощью которой производительность автоматически увеличивается при пиковых нагрузках. Так, тактовая частота 2,4 ГГц при применении Turbo Boost может быть увеличена до 2,7 ГГц.
Процессор, который вы предлагаете, относится к семейству Rangeley (8-ка в конце номера модели) и Turbo-Boost не поддерживает, зато в нём есть мощный криптографический акселератор и компрессор (технология Intel QuickAssist), которого нет в Avaton-ах.

В общем случае семейство Avoton позиционируется как универсальная числодробилка, а Rangeley как сетевой процессор.
Sign up to leave a comment.