Indalo 6 сен 2009 в 16:27

Распознавание изображений. Алгоритм Eigenface

6 мин

66K

Искусственный интеллект

+122

Комментарии 48

НЛО прилетело и опубликовало эту надпись здесь

Gnomische 6 сен 2009 в 17:09

Интересный пост, спасибо

-2

НЛО прилетело и опубликовало эту надпись здесь

Indalo 6 сен 2009 в 17:16

В алгоритме JPEG используются подобные преобразования.

Что касается распознавания, то данные алгоритм имеет какую-то аналогию с разложением сигнала в тригонометрический ряд. Сигнал представляется как сумма тригонометрических членов, а в нашем случае изображение как сумма базисных элементов.

SkywalkerY 6 сен 2009 в 17:37

спасибо, наконец-то встретил понятную статью, а то недавно писали про AdaBoost, сама идея там конечно ясна, но вот как сделать реализацию я так и не понял. а тут и реализация понятная и алгоритм.

Indalo 6 сен 2009 в 17:43

Темой статьи был не AdaBoost, поэтому не стал подробно останавливаться. Там есть ссылки на литературу, я сам по ним разбирался.

nix 6 сен 2009 в 18:00

Плюс за непонятность

Indalo 6 сен 2009 в 18:06

Что именно непонятно? Я постараюсь объяснить.

НЛО прилетело и опубликовало эту надпись здесь

Indalo 6 сен 2009 в 20:05

В статье об этом написано: вместо классического евклидова расстояния в задачах распознавания образов лучше применять другую метрику: расстояние Махалонобиса

Indalo 6 сен 2009 в 20:18

Да, эта формула.

Indalo 6 сен 2009 в 20:11

> Вычисление вектора «средних» — непонятно, что делают 1 и 3 строчки.

1 транспонирует матрицу. В 3ей строке берётся каждый столбец матрицы и вычисляется его среднее. Средние по столбцам и составляют вектор средних (усреднённое изображение).

> Далее, в 3 пункте, непонятен механизм вычисления ковариационной матрицы

Вобще ковариационная матрица должна вычисляться так:
C < — AT * A
Где AT — это транспонированная матрица А.
Но в этом случае получается матрица размером 10304х10304. Неподъёмный размер. Поэтому мы вычисляет только часть ковариционной матрицы (где количество строк и столбцов равно количеству примеров в обучающей выборке) по немного изменённой формуле:
C < — A * AT
Этот момент более подробно изложен в любом описании мат. аппарата алгоритма. На русском можно прочесть здесь: library.mephi.ru/data/scientific-sessions/2003/Neuro_2/115.pdf

Indalo 6 сен 2009 в 20:20

Извиняюсь, формулы для вычисления ков. матрицы перепутал, там наоборот. :) Пишу в дороге с наладонника, неудобно.

НЛО прилетело и опубликовало эту надпись здесь

Odes 6 сен 2009 в 18:58

Матан =)

НЛО прилетело и опубликовало эту надпись здесь

chetzof 6 сен 2009 в 19:08

блин надо было учить математику усерднее

david2tm 6 сен 2009 в 19:20

Применим ли данный алгоритм для распознавание обьектов, например дигитальных фотоаппаратов? Допустим задача: Есть база с ~300 изображениями (в хорошом качестве / размере) разных д. ф/а. Поступает изображение ф/а который может находиться в базе, а может и нет. Изображение не всегда под тем же углом что и изображение в базе. Стоит отметить, что часто разные ф/а одного производителя похожи друг на друга.

Есть ли алгоритмы кототрые более подходят для такой задачи?

genk 18 сен 2009 в 18:48

Если человек глядя на эти фотографии не может отличить какие-нибудь два фотоаппарата, то компьютер точно не сможет.
Если только не написать алгоритм классификации фотоаппаратов :)

Siddthartha 6 сен 2009 в 20:01

приятно таким заниматься в студенческие годы или в аспирантуре… я бы хотел чтобы мне платили за работу над такими вещами, тогда я вспомнил бы математику и перечитал бы кнута…

DarkPhoenix 6 сен 2009 в 20:27

Хабр тот.

+14

Jenyay 6 сен 2009 в 21:09

После формулы

думал, что дальше пойдут нейронные сети. Рад, что ошибся. Понравилась идея с вычитанием среднего.

Indalo 7 сен 2009 в 05:29

Я взялся писать эти статьи как раз для того, чтобы показать людям, что в распознавание образов это не только нейросети. :)

ksn 7 сен 2009 в 09:29

А вообще, как по-вашему, что какое средство эффективнее в распознавании образов: нейросети или какие-то другие алгоритмы?

Indalo 7 сен 2009 в 14:16

Не знаю, я не эксперт в этой области. Единственное, что мне понятно — это то, что эффективнная система для распознавания это комплекс различных алгоритмов. Искусственная нейросеть это далеко не человеческий мозг, поэтому далеко не панацея и чудес не делает.

FCron 6 сен 2009 в 21:13

Действительно очень сильная статья, читал 2 раза вспоминая, что учил на вышке. Вспоминается сложно, но вспоминается, хочется еще подобных статей и побольше, заставляет напрягаться мой мосг :)

Wott 6 сен 2009 в 21:57

Хм, я бы попробовал получить веса для обучающей выборки, а потом усреднять.

И почему только 4 веса? Имхо надо обрезать по дисперсии.

Я и провильно понимаю что собственные значения нормализовывались только по 4-м значениям? Тогда проценты — всего лишь от вклада этих 4-х. Для оценки эффективности имеет смысл нормализовать по всем исходным размерностям.

Indalo 7 сен 2009 в 05:17

Если не усредняя применять PCA, то области данных изображений в многомерном пространстве будут иметь большую плотность и, возможно, перекрываться.

Максимальное количество весов не превышает размер ков. матрицы по одному из измерений. Т.е. равно объёму выборки.

Это не имеет смысла т.к. все остальные размерности вырождены.

Ferroman 6 сен 2009 в 22:32

А хабр-то, ещё торт!

AndreevRu 6 сен 2009 в 23:10

А есть реализация на .NET?

-3

YasonBy 6 сен 2009 в 23:30

Поправьте, пожалуйста, если я что-то упустил: алгоритм Eigenface сводится к
1) уменьшению размерности выборки посредством метода главных компонент (PCA)
2) классификации полученных данных методом ближайшего соседа (Nearest Neighbour).
Так?

Inco 7 сен 2009 в 00:17

на сколько я понял, как раз да

highw 7 сен 2009 в 00:38

нет не так…

сначало агоритм сводиться к PCA,
а дальше его задача найти пространство проекции так, чтобы внутреклассовая дисперсия была минимальная, а межклассовая максимальная

иными словами аглоритм фишера (или собс. лиц) это на шаг глубже чем РСА

highw 7 сен 2009 в 00:42

после нахождения этого пространства — проектируется в него(!)

YasonBy 7 сен 2009 в 01:39

Безусловно, метод Фишера, или линейный дискриминантный анализ (LDA), отличается от PCA (хотя у них и много общего).
Однако сдаётся мне, Вы говорите о некоей вариации оригинального алгоритма, потому что в нём LDA не использовался, т.е. все лица обучающей выборки обрабатывались без учёта других классов (как и в данном топике).

Indalo 7 сен 2009 в 05:32

Ну если рассуждать тезисно, то можно и так сказать.

G3N1USS 7 сен 2009 в 00:18

Всё понято, только этот ужасный маткад портит всю статью, юзай мэпл или матлаб в крайнем случае. Повторяю, маткад — ужасен. А статья интересная, даже очень.

-3

Inco 7 сен 2009 в 00:21

Да вы просто не поняли прелестей маткада! =)
Математические формулы «придуманы» как раз чтобы однозначно лаконично сформулировать то, что порой в пару абзацев =)))

bagyr 7 сен 2009 в 08:53

Для этого есть Mathematica. А MathCAD все равно ужасен.

-2

highw 7 сен 2009 в 00:35

УРА! ) в этом году сдавал диплом по этой теме)) налюбился достаточно… но распознает

в частности интересно что будет если скрестить алгоритм Фишера + нейронные сети

Indalo 7 сен 2009 в 05:38

P.N. Belhumeur, J.P. Hespanha, D.J. Kriegman, Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection

Calvrack 7 сен 2009 в 00:48

Приличная статья по CV на наших Хабрах после продолжительного уныния? Есть путь!

Horus20 7 сен 2009 в 06:04

Indalo спасибо за отличную статью…

Mystex 7 сен 2009 в 18:05

А я думал матан хорош только в использовании как карательная мера.

Regfor 9 сен 2009 в 11:44

Отличная статья, не часто встретишь хорошую статью на русском по CV

novomir 8 окт 2009 в 08:54

В плане развития мат.аппарата у нас специальность близка к «Прикладной математике», так что все такое знакомое:) Плюс не так давно писал простую программу распознавания символов.
Кстати, статья получилась наглядная и интересная, спасибо.

Заинтересовал момент с вычислением главных компонент, удобно.

intelligenceAgent 9 ноя 2009 в 16:57

Хорошая статья, спасибо. От себя добавлю ссылку на статью Юрия Чеснокова (eng) с реализацией аналогичного алгоритма на С++

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Распознавание изображений. Алгоритм Eigenface

Комментарии 48

Публикации

Истории