tyomitch 14 янв 2011 в 17:39

Экспериментальное определение характеристик кэш-памяти: практикум

9 мин

5.8K

Компьютерное железо

+21

Комментарии 21

Yekver 14 янв 2011 в 17:56

Отличная статья получилась!

-1

b00taNik 14 янв 2011 в 18:06

Бинарничек выложите плз, протестирую на Athlon II X3

-1

Yekver 14 янв 2011 в 18:20

Забирайте: www.mediafire.com/?o9hnntyosbznw9o

-1

somniator 15 янв 2011 в 09:42

А можно и MSVCR100.dll приложить?

f0b0s 15 янв 2011 в 09:48

вообще это нарушает лицензию
гуглите visual studio redistributable 2010 — только его можно передавать

somniator 15 янв 2011 в 09:49

Спасибо, всё заработало.

f0b0s 15 янв 2011 в 11:15

по горькому опыту знаю что одной этой dll бы не обошлось, а скопировав все не обязательно бы заработало (там какие-то проблемы со встроенным манифестов) — качать редистрибьютабл само простое и подразумевающееся майкрософтом.

PavelSandovin 15 янв 2011 в 11:17

Спасибо за обе статьи, добавляю в избранное.

> Если вы будете запускать её самостоятельно, имейте в виду: она довольно чувствительна к помехам, вносимым в графики фоновой нагрузкой. Чтобы получить более достоверные результаты, закройте все остальные программы на время замера.

Кроме прикладных программ, в системе осанутся фоновые службы, работа которых также вероятно исказит статистику. Вы не оценивали степень данных искажений, можно ли их считать существенными?

tyomitch 15 янв 2011 в 14:19

Для маленьких массивов, помещающихся в L2, работа фоновых служб практически не искажает график, поскольку нагрузка бенчмарка приходится на сам процессор и на системную шину, а службы их нагружают мало.

Для массивов в несколько мегабайт становится существенно, чьи данные будут загружены в физическую память — бенчмарка или фоновых служб. Современные версии Windows, по слухам, «подыгрывают» системным службам, и дают им приоритет при выделении физической памяти. Получается, даже редкие обращения к памяти со стороны служб будут выгружать из физической памяти данные бенчмарка, и вносить в график помехи, связанные с повторной загрузкой данных из свопа.
Из-за этого правая часть графика во всех случаях испещрена скачками, затрудняющими точное определение характеристик L2 и TLB.

PavelSandovin 15 янв 2011 в 15:48

Интересно, что график в первой статье, где речь шла о линуксе, таких скачков не содержал.

tyomitch 15 янв 2011 в 16:04

Да, я тоже обратил на это внимание.

Предположительно, политика выделения физической памяти в Linux (использовалась серверная версия) ориентирована на повышение производительности системы, тогда как в десктопной версии Windows — на повышение отзывчивости; поэтому Windows отбирает физическую память у неинтерактивной программы в пользу интерактивных.

При случае протестирую свою программу на Windows Server.

Rayslava 15 янв 2011 в 12:15

Интересная программа. Буду брать с собой в магазин при выборе ноутбука :)
А при сборке из исходников не надо никаких дополнительных параметров, там ничего лишнего не соптимизируется?

-1

tyomitch 15 янв 2011 в 14:09

Никаких дополнительных параметров; разве что, нужно обязательно собирать как Release, а не Debug — иначе внутри основного цикла будут лишние инструкции, кроме самого обращения к памяти.

-1

StirolXXX 15 янв 2011 в 12:23

Откуда у процессора core 2 duo t7200 взялся L3-кеш?

tyomitch 15 янв 2011 в 12:33

Его нет.
Ниже графика же пояснено, что L3 «примерещился» программе из-за того, что время доступа к TLB одного порядка с погрешностью измерения.

-1

DmitryBabokin 15 янв 2011 в 13:44

Если кто-то хочет глубже разобраться в особенностях работы кешей и подсистемы памяти вцелом, есть отличная остатья «What every programmer should know about memory». В каком-то смысле она уже стала классической.

www.unilim.fr/sci/wiki/_media/cali/cpumemory.pdf

tyomitch 15 янв 2011 в 14:07

114 страниц? Прямо не статья, а монография…

DmitryBabokin 15 янв 2011 в 18:14

Зато обстоятельно и подробно :)

PavelSandovin 15 янв 2011 в 15:10

Пролистал… — жаль, что у нас тут нет оценки «бриллиантовая ссылка». Спасибо!

kutanov 15 янв 2011 в 19:21

Если еще не читали, очень советую теорию почитать, начиная прям с классической работы portal.acm.org/citation.cfm?doid=363095.363141. Это если вы наукой действительно будете заниматься или занимаетесь. Ежели уже читали, вобще отлично, пишите — могу накидать интересных ссылок и сами документы на значимые работы по изучению кэш-памяти и локальности обращений. Если у вас есть такие — кидайте тоже :-)

TeAnton 15 янв 2011 в 19:30

Я предлагаю замерять минимальное значение времени, а не среднее, т.к. все внешние помехи время только увеличивают, реальное же значение должно быть очень близко к минимальному.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Экспериментальное определение характеристик кэш-памяти: практикум

Комментарии 21

Публикации

Истории