Pull to refresh

Comments 2

Это самый трудоёмкий и длительный этап работ, но благодаря тому что файлы были уже сгруппированы он длился меньше часа.
За это же время можно было глазами найти недостающую карточку, разве нет?
За это же время можно было глазами найти недостающую карточку, разве нет?

Попробую посчитать. Допустим, я взял новую колоду из 55 карточек и последовательно сравниваю каждую карточку из нее с каждой карточкой из старой колоды (54 карточки). Если они одинаковые — откладываю обе в сторону и перехожу к следующей карточке из новой колоды.
Очевидно, при полном проходе было бы те же 1485 сравнений. В среднем совпадение будет находиться в середине второй колоды — делим на 2, 742 сравнения. Допустим, в середине первой колоды нашлась карточка, у которой нет пары — я её нашёл! Делим ещё на 2, 371 сравнение. За час это 9,7 секунды на проверку каждой пары карточек. Да, думаю глазами бы нашёл, но это утомительная однообразная работа.
С другой стороны, за тот же час я разметил датасет и вручную переименовал папки с файлами. Это позволило мне проверить идею с обучением нейросети на малом числе параметров, из имеющихся материалов можно сделать игру (начал, но пока не доделал). Может, мой опыт ещё кому-то пригодится.
Да, по горячим следам возникла идея — неплохо было бы нарезку файлов совместить с сортировкой не по одному, а по всем четырём имеющимся параметрам — можно сделать полноценную кластеризацию, только пока не разобрался как.
В общем, думаю, что я не зря потратил время.
Sign up to leave a comment.

Articles