Comments 2
Это самый трудоёмкий и длительный этап работ, но благодаря тому что файлы были уже сгруппированы он длился меньше часа.За это же время можно было глазами найти недостающую карточку, разве нет?
0
За это же время можно было глазами найти недостающую карточку, разве нет?
Попробую посчитать. Допустим, я взял новую колоду из 55 карточек и последовательно сравниваю каждую карточку из нее с каждой карточкой из старой колоды (54 карточки). Если они одинаковые — откладываю обе в сторону и перехожу к следующей карточке из новой колоды.
Очевидно, при полном проходе было бы те же 1485 сравнений. В среднем совпадение будет находиться в середине второй колоды — делим на 2, 742 сравнения. Допустим, в середине первой колоды нашлась карточка, у которой нет пары — я её нашёл! Делим ещё на 2, 371 сравнение. За час это 9,7 секунды на проверку каждой пары карточек. Да, думаю глазами бы нашёл, но это утомительная однообразная работа.
С другой стороны, за тот же час я разметил датасет и вручную переименовал папки с файлами. Это позволило мне проверить идею с обучением нейросети на малом числе параметров, из имеющихся материалов можно сделать игру (начал, но пока не доделал). Может, мой опыт ещё кому-то пригодится.
Да, по горячим следам возникла идея — неплохо было бы нарезку файлов совместить с сортировкой не по одному, а по всем четырём имеющимся параметрам — можно сделать полноценную кластеризацию, только пока не разобрался как.
В общем, думаю, что я не зря потратил время.
0
Sign up to leave a comment.
Доббль: практичный подход с OpenCV и NumPy