alexeyk500 28 мая 2020 в 23:04

Быстрая загрузка большого количества данных в Google Colab

3 мин

29K

Python*Машинное обучение*Google Cloud Platform*

Из песочницы

+10

Комментарии 4

Moruk 5 июн 2020 в 13:26

А что делать, если данных много, например 400 Гб? Получаеться надо как то тренировать пачками, прошел все файлы, удаляй и загружай новые? В принципе если разделить все данные на равные части и после каждой эпохи менять/загружать новую часть, то почти ничего не измениться, разве то что например 10 эпох — это будет по сути одна эпоха. Может еще будет хуже сходимость, поскольку данные не перемешиваються между частями. Ну и код будет тяжелее писать, хотя не всегда.