Invision Sep 29 2010 at 20:20

Классификация данных методом опорных векторов

4 min

147K

Data Mining*

From sandbox

+74

Comments 27

sgzmd Sep 29 2010 at 22:08

Хороший, годный пост на хорошую, правильную тему.

Invision Sep 29 2010 at 23:48

Спасибо!

UFO just landed and posted this here

dufft Sep 29 2010 at 23:26

«Задача классификации (или, как ее иногда называют, задача кластеризации)»

Есть разница. При классификации набор классов задан с самого начала, по-моему.

Invision Sep 29 2010 at 23:47

Вы правы, при классификации классы почти всегда известны изначально. Однако же, не всегда.

UFO just landed and posted this here

Invision Sep 30 2010 at 00:24

Поправил, спасибо за уточнение.

chupvl Jan 16 2011 at 03:47

В Desicion trees совсем другой алгоритм и совсем другие задачи, поэтому нельзя утверждать что они используются только для классификации, так же как и SVM может использоваться для многих задач: классификации, кластеризации, предсказания свойства

albedo Sep 29 2010 at 23:29

Вот тут www.csie.ntu.edu.tw/~cjlin/libsvm/ есть практический пример и демо

Invision Sep 30 2010 at 00:44

Вроде бы у них на сайте были еще разные интересные data sets для тестирования классификатора.

UFO just landed and posted this here

Invision Sep 30 2010 at 00:42

Я еще планирую про классификатор RVM (Relevance Vector Machine) написать. А после этого можно и обзорно-сравнивающую статью сделать.

Indalo Sep 30 2010 at 07:03

Про RVM было бы интересно. В целом +1.

multik Sep 30 2010 at 11:15

А где видео?

Invision Sep 30 2010 at 11:20

Наверное, браузер по каким-то причинам не отображает. Оригинальная ссылка вот.

multik Sep 30 2010 at 11:29

Спасибо. Теперь кстати и браузер отображает.

lightcaster Sep 30 2010 at 12:11

Автору плюс. Скажите, а есть ли какие-нибудь критерии выбора ядра. Я имею ввиду какие-либо аналитические методы. Или только на-глаз?

lightcaster Sep 30 2010 at 13:11

Кстати, на твиттере промелькнуло: 25 типов kernel-функций.

Invision Sep 30 2010 at 13:21

Интересно, надо сохранить на будущее :)
Я не встречал нормальных работающих методов для выбора ядра. Видел лишь пару статей на тему «имеется конкретное ядро с какими-то параметрами. Как выбрать эти параметры наилучшим способом для уменьшения ошибки классификации.»

xsway Oct 3 2010 at 00:16

Если бы еще и kernel можно было всегда выбрать просто все бы задачи по классификации были бы уже решены) Не бывает универсального классификатора к сожалению. Так что kernel функцию придется всегда выбирать в зависимости от задачи. В целом если feature space уже изначально досточно большой обычно используется линейный kernel (что логично).

Когда изучала данную тему мне очень помогли слайды from Andrew Moore www.autonlab.org/tutorials/
(может не самые стильные зато доступные — вообще рекомендую)

Invision Oct 3 2010 at 12:09

Ага, no free lunch theorem :)
Посмотрел слайды, неплохо написано. И многие интересные темы освещены.

rotor Sep 30 2010 at 15:48

Насколько мне известно, некоторые дополнительные материалы по теме можно найти, например, в книге Фукунга К. «Введение в статистическую теорию распознавания образов».
Статья хорошая. Статистические методы распознавания сейчас нередко игнорируются в пользу нейронных сетей, а это не всегда правильно.