Комментарии / Профиль alexey

Алексей Захаров @alexey_zz

Инженер

Профиль Публикации 6Комментарии 11Закладки 54

[Личный опыт] Лондон: не всегда мечта для программиста. Как живется в столице Британии во время коронавируса

alexey_zz 17 сен 2021 в 12:58

Присоединяюсь к вопросу. В Европе везде, где я был, чай был отвратительный липтон в пакетиках, если не идти в специальную "чайную".

-1

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 7 июн 2021 в 15:10

Про рандомную запись и тормоза — скорее всего это был известный и очень забавный баг. Проблема была в том, что bcache по-разному считал «грязные» блоки при работе GC и при механизме жесткого врайтбека (защита от переполнения кеша грязными блоками).
Сейчас его уже починили. Вернее как починили: при n-ном количестве бакетов с грязными блоками теперь увеличивается скорость врайтбэка.

Посмотреть

Производительность распределенного хранилища: препродакшн тесты

alexey_zz 18 мар 2021 в 12:27

FioSynth — это уже запускалка готовых тестов. Просто там уже есть паттерны, которые Facebook сделали на основе снятых с прода профилей нагрузки. В Linux для снятия трейсов есть blktrace, например. А вот на винде не подскажу, надо искать какой-то аналог blktrace.

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 5 июл 2019 в 12:32

Да, всё так, спасибо, что заметили!

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 5 июл 2019 в 12:13

Да, постоянную нагрузку я привел для примера:)

при росте нагрузки начинает сильнее нагружать диск, при падении — снижает темп записи.

Ну он это делает не сразу и достаточно плавно. В каком-то из более-менее свежих ядер алгоритм, кстати, изменили и он стал менее агрессивным.

Мне кажется, что зачастую более логичным целевым параметром был бы не количество грязных данных в кэше, а задержка ввода/вывода на hdd.

Смотреть на латенси кешируемого девайса было бы интересно, да, но наверное сильно бы усложнило логику. Отталкиваются от объема кэша, потому что если он переполнится грязными блоками — всё очень резко станет плохо.
А какое решение вы рассматриваете как более приемлемое?

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 5 июл 2019 в 12:07

Интересный, кстати, вопрос. Пошел смотреть исходники bpf_ktime_get_ns(), но сходу не нашел условия, при котором она может возвращать 0. Не могу вспомнить, почему я добавил сюда эту проверку:) возможно, просто перестраховался.

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 4 июл 2019 в 21:20

На самом деле, смотря для чего использовать. Понятно, что чем шире масштаб и выше требования к кластерам, тем больше нюансов, как и везде.

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 4 июл 2019 в 21:15

Раньше везде ставили flashcache, но он, во-первых, уже не поддерживается нормально, во-вторых, хотелось кешировать запись, в том числе и последовательную. Мне у bcache очень нравится алгоритм сброса грязных блоков. Если дать постоянную нагрузку на запись, график утилизации/iops кешируемого диска выглядит как график затухающих колебаний и в итоге спрямляется. Ещё нет такой проблемы, как вытесняющий промах за счёт того как он хранит данные в кеше. Вообще удается все данные сначала залить в кеш, при этом сзади у него здоровенный hdd. На критичные баги не напарывались, в рассылках видел жуткие истории про потерю данных на последней Федоре, с ядром собранном на какой-то конкретной версии gcc.

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 4 июл 2019 в 19:45

Да, используем.

Посмотреть

От High Ceph Latency к Kernel Patch с помощью eBPF/BCC

alexey_zz 4 июл 2019 в 19:45

Спасибо!

Посмотреть

Perf и flamegraphs

alexey_zz 5 фев 2019 в 00:14

Спасибо, поправил.

Посмотреть