Pull to refresh

Comments 31

Вопрос к знающим людям:

Поправьте меня, но есть ли смысл в этом Мемтесте86+, если там нельзя отключить использование кэша ЦПУ? Ведь при работающем кэше, будет тестироваться не память, а только ЦПУ и его кэш.

Если тестировать объём значительно превышающий кэш, то она роли играть не будет.

Воу, похоже стоит попробовать новый мемтест, и забыть 4/5 версию как страшных сон.

Оно писало блоками вроде где-то по гигабайту, так что кэш особо не влиял на это.

Но именно в те времена было самым лучшим вариантом тестировать память, это тестировать её через архиваторы, иначе мемтест просто не ловил плавающий дефект.

Правда как сейчас не знаю, да и у меня в последние года не было проблемных планок для теста.

Где то в 2005 помог выявить проблемы с памятью ещё на третьем пне. Хотя показать он их не смог, но стабильно уводил систему в ребут на одном из тестов(виновата оказалась не память а её питание).
Ну у меня стабильно отлавливал дефекты где то в 2010 году. Правда только на втором круге но стабильно в одном месте. На работе это не сказывалось никак, но в Mass Effect 2 очень часто висла загрузка уровня на Тучанке.
В 2015 отловил дефект в свежекупленной планке правда тоже только на втором проходе. Но когда отвез в сервис модуль для замены, там они даже стартануть систему с ним не смогли. Это личные случаи.
Не знаю про какие "те времена" речь, но выручала эта утилита не однократно.

Утилит для тестирования памяти было множество, в том числе под винду или DOS.
Ну и качеством тестирования они отличались весьма сильно.

Сейчас с современными модулями вообще странные вещи случаются, вплоть до того что приходится выставлять частоту ниже заявленной производителем, чтобы она не глючила.

Мне в таком случае помог тест Goldmemory. Долго сканирует. Но выловил дефектную планку.

А почему DDR5-7200 по скорости 21.8Gb/s это соответствует DDR5-3600 и то для неё должно быть порядка 26Gb/s. Очередные маркетинговые изменения в маркировке или проц не вывозит?

Наверное потому, что DDR5 — двухканальная память, её можно представить как два модуля DDR4-3600, сидящие на одном интерфейсе через контроллер. В однопоточном режиме задействуется только один канал, поэтому и имеем половинную скорость. Ну и 7200 — это просто пропускная способность интерфейса (7.2 млрд передач в секунду) без накладных расходов.

Значит маркетинг. Два канала но по 16бит.

UFO just landed and posted this here

Даже зашел перечитал оригинал, похоже сделанная поддержка антикварных чипсетов это не ошибка...

кто нибудь замечал что последующий прогон в тесте занимает больше времени? например первый прогон заканчивается за 10 минут, второй может уже занять 12-15 минут. следующий еще дольше.

Насколько я помню, первый прогон делается в упрощённом виде, чтобы быстро оценить работоспособность в целом. Второй и далее — гоняют всё по максимуму.

Несколько месяцев назад на одном из рабочих серваков попалась битая планка памяти. При работе иногда сыпало ошибками ядро и в логах BMC были аналогичные ошибки. Пробовал тестировать несколькими разными мемтестами - три дня гонял память, ошибка не возникла. Запустил встроенный в прошивку биоса тест - буквально через минут 40 получил сообщение об ошибке. Правда, последующие проходы уже ничего не находили, видимо, где-то помечалось, что память в таком-то месте битая. После перезагрузки ситуация полностью повторялась - первый проход с ошибкой, дальше всё чисто.

После этого я как-то разочаровался в мемтесте.

Так это нормальная работа ECC, разве нет?

Что именно "нормальная работа ECC"? То, что ошибка возникает только один раз после перезагрузки или то, что Мемтест не способен спровоцировать её возникновение?

Выключение сбойной ячейки из рабочего пространтсва.
Ну, как уже написал ниже, надо смотреть в конкретную реализацию.

то, что Мемтест не способен спровоцировать её возникновение?

а точно не способен? ЕМНИП старые версии не умели ECC (update: поддержку eccc в memtest86+ всё ещё не завезли), то есть ошибки надо было смотреть в логах BMC.
это никак не делает тест памяти бесполезным, только немного менее удобным.


P.S. ну а случаи, когда, например, memtest проходит, а prime95 вылетает, или наоборот, случаются.
увы, написать один тест, который будет находить все возможные ошибки памяти, сложно.

Ошибка вообще не возникала. Её не было ни в мемтесте, ни в логах BMC.

А старые версии вообще практически сразу виснут.

Так вроде бы при возникновении ошибки ECC должно прийти прерывание. Вот как линукс на это реагирует:

[ 5015.808246] mce: [Hardware Error]: Machine check events logged
[ 5015.808250] [Hardware Error]: Corrected error, no action required.
[ 5015.808254] [Hardware Error]: CPU:2 (17:31:0) MC18_STATUS[-|CE|MiscV|AddrV|-|-|SyndV|CECC|-|-|Scrub]: 0x9c2041000000011b
[ 5015.808260] [Hardware Error]: Error Addr: 0x000000074f879740
[ 5015.808261] [Hardware Error]: IPID: 0x0000009600550f00, Syndrome: 0xe4da80000a800603
[ 5015.808263] [Hardware Error]: Unified Memory Controller Ext. Error Code: 0, DRAM ECC error.
[ 5015.808279] EDAC MC0: 1 CE on mc#0csrow#3channel#5 (csrow:3 channel:5 page:0x1d7e1e5 offset:0xd40 grain:64 syndrome:0x8000)
[ 5015.808280] [Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: RD

Если memtest это прерывание не обрабатывает то толку от него на ECC памяти вообще никакой.

Вот тут надо смотреть в конкретную реализацию. В начале нулевых встречалось множество экзотических вариантов обработки ошибок памяти, в том числе и своебразный raid-1, полностью обрабатываемых firmware. А сейчас возможностей стало гораздо гораздее для обработки по умолчанию.

Memtest не панацея. Однажды тестировал память. Оказалась битая. Купил другую. Но проблема оказалась в контроллере памяти материнки, а ошибки памяти были некритичны. Пришлось заменить.

и в чём тут виноват memtest?

Вы читайте внимательнее. Я нигде не писал что memtest в чем то виноват. Просто не панацея.

В вашем случае memtest отработал полностью корректно.
Это программа.
Программы исполняются на процессоре.
Программы используют данные из оперативной памяти.
Memtest тут выделяется только тем, что его алгоритмы работы с данными настроены на выявление отличий между данными, положенными в памяти, и данными, прочитанными из памяти.
Между процессором и оперативной памятью — целый густонаселенный тракт из кешей, шин, контроллеров, пайки, разъемных соединений, переходных отверстий, пассивных и активных согласователей и даже помех.
По которому данные путешествуют в обязательном порядке — миновать его невозможно
Значит, любой тест памяти всегда тестирует весь этот тракт


А ваше утверждение основано на предположении о магическом попадании данных из памяти в ИУ процессора, минуя, как минимум, КП.

Sign up to leave a comment.

Other news