Открыть список
Как стать автором
Обновить

Комментарии 7

В статье рассматривается ситуация, когда объекты выборки описаны некими числовыми параметрами.

А на примере случае приведенной «тестовой» задачи всплывает основная проблема для машин — «оцифровка», перевод изображения в набор признаков. Как оцифровать, например, видимый признак «есть крылья»?

Таки образом, получилась подмена проблематики.

Кстати, на уже цифровых данных у человека преимущество теряется, особенно когда группировка нечеткая — классическая проблема «куча — это начиная со скольки?».
улитки не насекомые, но не будем придираться

Пауки тоже не насекомые.
Но их с осами можно объединить хотя бы в «членистоногие».
Как и с бабочками.
Но их с осами можно объединить хотя бы в «членистоногие».

Кстати вот тут возникает вариация при разделении на группы.
Можно просто отделить моллюсков от членистоногих и на этом успокоиться, не переходя на классификационные уровни ниже. Собственно, и после отделения насекомых от паукообразных надо еще насекомых делить на перепончатокрылых и чешуекрылых.

Но это всё при знании классификации. Задача-то стоит выделить похожие группы, даже ничего не зная «кто есть кто» на картинке. И на вид вообще осы от бабочек отличаются сильнее, чем от пауков.
интересно, а размерность Хаусдорфа используют для анализа данных?
Спасибо за статью, в рамках университетского тервера на первом курсе чего-то такого не хватало.
Можете подсказать, как объединять различные варианты кластеризации по разным признакам? Такая задача появляется часто при обработке мультиспектральных изображений при спутниковой съёмке или при иной объединении данных, полученных разными методами. Получается не шибко хорошо, я пытаюсь понять: это я не понимаю чего-то важного, или просто стоит выбор «не качественно или о-очень долго».
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.