Invision 29 сен 2010 в 20:20

Классификация данных методом опорных векторов

4 мин

147K

Data Mining*

Из песочницы

+74

Комментарии 27

sgzmd 29 сен 2010 в 22:08

Хороший, годный пост на хорошую, правильную тему.

Invision 29 сен 2010 в 23:48

Спасибо!

НЛО прилетело и опубликовало эту надпись здесь

dufft 29 сен 2010 в 23:26

«Задача классификации (или, как ее иногда называют, задача кластеризации)»

Есть разница. При классификации набор классов задан с самого начала, по-моему.

Invision 29 сен 2010 в 23:47

Вы правы, при классификации классы почти всегда известны изначально. Однако же, не всегда.

НЛО прилетело и опубликовало эту надпись здесь

Invision 30 сен 2010 в 00:24

Поправил, спасибо за уточнение.

chupvl 16 янв 2011 в 03:47

В Desicion trees совсем другой алгоритм и совсем другие задачи, поэтому нельзя утверждать что они используются только для классификации, так же как и SVM может использоваться для многих задач: классификации, кластеризации, предсказания свойства

albedo 29 сен 2010 в 23:29

Вот тут www.csie.ntu.edu.tw/~cjlin/libsvm/ есть практический пример и демо

Invision 30 сен 2010 в 00:44

Вроде бы у них на сайте были еще разные интересные data sets для тестирования классификатора.

НЛО прилетело и опубликовало эту надпись здесь

Invision 30 сен 2010 в 00:42

Я еще планирую про классификатор RVM (Relevance Vector Machine) написать. А после этого можно и обзорно-сравнивающую статью сделать.

Indalo 30 сен 2010 в 07:03

Про RVM было бы интересно. В целом +1.

multik 30 сен 2010 в 11:15

А где видео?

Invision 30 сен 2010 в 11:20

Наверное, браузер по каким-то причинам не отображает. Оригинальная ссылка вот.

multik 30 сен 2010 в 11:29

Спасибо. Теперь кстати и браузер отображает.

lightcaster 30 сен 2010 в 12:11

Автору плюс. Скажите, а есть ли какие-нибудь критерии выбора ядра. Я имею ввиду какие-либо аналитические методы. Или только на-глаз?

lightcaster 30 сен 2010 в 13:11

Кстати, на твиттере промелькнуло: 25 типов kernel-функций.

Invision 30 сен 2010 в 13:21

Интересно, надо сохранить на будущее :)
Я не встречал нормальных работающих методов для выбора ядра. Видел лишь пару статей на тему «имеется конкретное ядро с какими-то параметрами. Как выбрать эти параметры наилучшим способом для уменьшения ошибки классификации.»

xsway 3 окт 2010 в 00:16

Если бы еще и kernel можно было всегда выбрать просто все бы задачи по классификации были бы уже решены) Не бывает универсального классификатора к сожалению. Так что kernel функцию придется всегда выбирать в зависимости от задачи. В целом если feature space уже изначально досточно большой обычно используется линейный kernel (что логично).

Когда изучала данную тему мне очень помогли слайды from Andrew Moore www.autonlab.org/tutorials/
(может не самые стильные зато доступные — вообще рекомендую)

Invision 3 окт 2010 в 12:09

Ага, no free lunch theorem :)
Посмотрел слайды, неплохо написано. И многие интересные темы освещены.

rotor 30 сен 2010 в 15:48

Насколько мне известно, некоторые дополнительные материалы по теме можно найти, например, в книге Фукунга К. «Введение в статистическую теорию распознавания образов».
Статья хорошая. Статистические методы распознавания сейчас нередко игнорируются в пользу нейронных сетей, а это не всегда правильно.