Добрый день, @zaleslaw Мощности моего кластера из домашних компов оказалось недостаточно, поэтому я по знакомству получил доступ к промышленным машинам - одна клиентская нода и четыре расчётные, на каждой 512 Гб оперативной памяти и DataRegionConfiguration.maxSize = 140G. Провёл четыре теста, начал с одной клиентской и одной расчётной ноды. После взял две ноды, затем три, затем четыре. Тестировал я работу получившихся кластеров на полном датасете mnist_train.csv (60 тысяч рисунков). Кластер запускал заново перед каждым расчетом. Время загрузки данных не измерял, время исполнения процесса mdl trainer.fit такое: Одна серверная нода: 11.396 секунд Две серверные ноды: 9,959 секунд Три серверных ноды: 9,794 секунды Четыре серверные ноды: 10.185 секунд Опять странный результат. Посмотрел в Ignite Visor, тогда в кластере было четыре ноды Два узла не содержат данных совсем, непонятно почему.
Добрый день, @zaleslaw
Мощности моего кластера из домашних компов оказалось недостаточно, поэтому я по знакомству получил доступ к промышленным машинам - одна клиентская нода и четыре расчётные, на каждой 512 Гб оперативной памяти и DataRegionConfiguration.maxSize = 140G.
Провёл четыре теста, начал с одной клиентской и одной расчётной ноды. После взял две ноды, затем три, затем четыре. Тестировал я работу получившихся кластеров на полном датасете mnist_train.csv (60 тысяч рисунков). Кластер запускал заново перед каждым расчетом.
Время загрузки данных не измерял, время исполнения процесса mdl trainer.fit такое:
Одна серверная нода: 11.396 секунд
Две серверные ноды: 9,959 секунд
Три серверных ноды: 9,794 секунды
Четыре серверные ноды: 10.185 секунд
Опять странный результат. Посмотрел в Ignite Visor, тогда в кластере было четыре ноды
Два узла не содержат данных совсем, непонятно почему.
Ignite Visor говорит мне о том, что данные именно партиционируются по нодам. Странная вещь, тем не менее