Как стать автором
Обновить

Комментарии 7

Под ceph, тоже хорошо fio гонять
Так было обнаружено, что блоки записи в WAL очень плотно сгруппированы, размер большинства лежал в диапазоне 2200-2400 байт

Не означает ли это повышенный износ SSD (aka wear leveling), где размер блока, который может быть атомарно записан (aka erase block size), обычно находится в диапазоне от 512КБ до нескольких МБ? Т.е. на каждую 2КБ запись SSD приходится перезаписывать 512КБ данных?

Означает.
Вообще не понимаю, почему во всех ССД штатно не идёт конденсатор для гарантированной записи кэша при отвале питания. Там ведь реально доли секунды нужны.

В дорогих идёт.

Не совсем. Стирается действительно 512КБ. Но пишется потом блоками по 4-8-16КБ в зависимости от модели.
И все равно 2КБ — это очень мало: даже если блок записи 4КБ, блок будет записан дважды, заняв 8КБ предварительно очищенного места.
Если же блок записи 16КБ все становится гораздо хуже: блок будет писаться 8 раз и потребует 128КБ чистого места. Причем минимум 6 раз блок придётся предварительно прочитать.


Впрочем, с встооенным RAM кэшем и конденцатором (в дорогих моделях) все может оказаться не так печально.

Спасибо: действительно не увидели :(


P.S. Уже год назад просил администрацию хабра сделать проверку URLа оригинала на уникальность — это ведь такая простая фича, которая спасла бы от повторяющейся (наблюдаю ее далеко не в первый раз) проблемы...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий