Ky7m 8 мая 2011 в 21:14

Нейронные сети и распознавание символов

7 мин

125K

Искусственный интеллект

+58

Комментарии 57

mxc 8 мая 2011 в 21:42

Только из-за такого материала еще не самоликвидировался отсюда.

-13

bondbig 8 мая 2011 в 22:47

Это материал обычной лабораторки второго курса университета.

+29

Pastafarianist 8 мая 2011 в 23:37

Неужели большинство людей становятся способны осознать это только ко второму курсу? o_0

-9

НЛО прилетело и опубликовало эту надпись здесь

Mystex 9 мая 2011 в 22:57

Да, помню фигачил в матлабе такие штуки. Клёвые времена!

BarsMonster 8 мая 2011 в 21:52

Мне всегда казалось, что нейронные сети для распознавания — тупиковая ветвь.

Т.е. поначалу прогресс хороший, но наступает момент — и сколько не бейся — результат лучше не станет, оставаясь хуже классических систем. Потому реквестирую сравнение качества распознавания с боевыми алгоритмами )

Ky7m 8 мая 2011 в 22:01

Какие, например, боевые алгоритмы? НС — вообще попытка копировать модель мозга человека, просто может она еще не так точно аппроксимирует наш потенциал и возможность на своем этапе развития.

yuk 8 мая 2011 в 22:57

Сейчас более модно использовать Condition Random Field их преимущество перед нейронными сетями в том что они сходятся к глобальному минимуму, и так же могу обучатся для предсказания любой структуры. НС редко успешно применяется на практике.

Pastafarianist 8 мая 2011 в 23:35

~~Реквестирую~~ Прошу статью!

НЛО прилетело и опубликовало эту надпись здесь

HomoLuden 9 мая 2011 в 20:03

Существуют эвристические методы обучения сети (ГА, имитация отжига, напр.), которые также при правильной настройке дают схождение к глобальному экстремуму.

yuk 10 мая 2011 в 13:11

ГА — вообще ничего не гарантирует. имитация отжига — это метод, который в некоторых случаях избегает лок. минимумов, но тоже ничего не гарантирует.

HomoLuden 10 мая 2011 в 15:21

Почему же не гарантирует? Если, к примеру, имеется 10 генов с 4-мя (опять же к примеру) возможными значениями, то можно с уверенностью сказать, что генотип в популяции из 10^4 (т.е. 10000) особей в любом случае будет содержать «правильные» значения всех генов, но разбросанные по разным особям.
Написал на вскидку — где-то на Хабре было четкое с точки зрения комбинаторики обоснование. Суть в том, что зная количество значений каждого гена всегда можно всегда определить величину популяции, при которой мы обязательно попадем именно в глобальный экстремум (если он один; если не один, то ситуация еще проще).
Другое дело, что с практической точки зрения получаемый таким образом размер популяции может быть неприемлем. В ту же степь и случай кодирования генной информации «флотАми». Там либо спускаемся до разрядности представления дробного числа, либо условимся о точности (о квантовании по уровню). Но суть остается та же.

«Отжиг», думаю, тоже у каждого свой. Кто-то настраивается на «шоб работало», а кто-то хочет гарантии.

XenJ 9 мая 2011 в 20:05

Согласен, попытки избежать локальных минимумов — это то еще удовольствие. У нас на мехмате к НС относились как к лженауке. Недавно в Науке 2.0 было обсуждение кризиса в разработке искуственного интелекта. Так что лучше заниматься какими-то более реальными вещами.

HomoLuden 9 мая 2011 в 20:37

Я лично не считаю ИНС «не реальным» инструментом. Например, систему диффернциальных уравнений в Форме Коши (мат. модель динамической системы) можно представить в виде однослойной рекуррентной сети.

XenJ 9 мая 2011 в 21:02

ок, почему не нравятся, старые добрые численные методы?

XenJ 9 мая 2011 в 21:08

дабы прояснить мою точку зрения: я не против НС, и я абсолютно согласен, что с их помощью можно решать огромный класс прикладных задач. Вопрос в том, можно ли решать с их помощью задачи, для которых не разработаны классические алгоритмы решения?

HomoLuden 9 мая 2011 в 21:30

В качестве плюсов использования ИНС могу указать следующие:
1) унифицированный подход к решению широкого класса задач;
2) возможность построения системы управления со свойствами робастности (устойчивость к возмущениям) и избыточностью (информационной и функциональной).
3) из п. 1 и 2 получаем возможность унифицированным образом строить системы управления сложными объектами, устойчивую к возможным возмущениям (измерительному шуму), отказам и обладающую универсальными аппроксимирующими свойствами.

Там, где не нужно точное аналитическое решение (или его не существует вовсе), ИНС позволяют с заданными точностными характеристиками (достаточными) найти решение, пригодное для практического использования.

fralik 8 мая 2011 в 23:07

Например, Support Vector Machines, AdaBoost?!

Error_403_Forbidden 9 мая 2011 в 00:14

Нейронные сети были разработаны 50 лет назад, из них всё выжали в то же время. И с тех пор не придумали ничего нового.
Нейронные сети — это прошлый век, у них нет будущего.

halyavin 9 мая 2011 в 00:27

У сетей 50 летней давности — очень может быть.

Но есть массы модификаций. Например, люди пытаются сделать нижние слои фиксированными, имитируя в них операции реально происходящие в зрительных нейронах. Или строят сети, которые выдают характеристики более-менее инвариантные относительно разных аффинных преобразований. Полученные сети вполне конкурируют с наилучшими алгоритмами.

iambot 9 мая 2011 в 12:38

Это простите почему у них нет будущего?

VolCh 8 мая 2011 в 23:24

Не говорите, иногда для распознавания капчи нейронная сеть в моей голове пасует. Наверное, нейронов мало :)

+15

НЛО прилетело и опубликовало эту надпись здесь

bryndin 9 мая 2011 в 05:20

да ладно, а как насчет лучшего результата на тестах MNIST у 6-слойной сети?
yann.lecun.com/exdb/mnist/

theRavel 8 мая 2011 в 21:53

Было бы интересно почитать не про использование готовых шаблонов матлаба, а про создание нейронной сети. Но автору все равно спасибо, что затронули тему

Ky7m 8 мая 2011 в 21:58

Давно еще делал НС на С#. До конца не довел из-за нехватки времени. Постараюсь сдуть пыль со своего проекта и осветить, что сейчас уже проделано в мире.

digreen 8 мая 2011 в 22:59

Вам 22 года, какой, нафиг, «давно», и какая, к черту, «пыль»?! -)

+17

Ky7m 9 мая 2011 в 00:26

Ну я относительно своих 22 лет и оперирую временными понятиями.

vit1251 9 мая 2011 в 02:52

Скорость оседания пыли возрастает по мере увеличения диаметра пылинок. Время оседания пылинки диаметром 0,05 с высоты 1 м, равняется 320 часам, а пылинка размером 1 u этот же путь проходит за 3 часа, а частички диаметром 100 u оседают в течение 3 секунд. Поэтому в воздухе, попадающим в дыхательные пути находится относительно мало частичек диаметром больше 10 u.

НЛО прилетело и опубликовало эту надпись здесь

ramshteks 8 мая 2011 в 22:58

я бы сказал, что было бы интересно почитать, про методы оптимизации структуры самой нейронной сети. Потому что сейчас это просто тыкание пальцем в него.

HomoLuden 9 мая 2011 в 20:08

На Хабре уже была статья про эволюционные метода настройки весов НС. Я сам этой идеей заразился (применительно к задачи решения переопределенных СЛАУ). Результаты уже есть — так что ГА + ИНС это работающая связка.

НЛО прилетело и опубликовало эту надпись здесь

Ky7m 9 мая 2011 в 02:00

Интересно!

A0n3 9 мая 2011 в 19:21

Очень, а то буквы уже достали )

ramshteks 8 мая 2011 в 22:55

Я сейчас для диплома написал на C# движок для нейронок и для генетических алгоритмов(для обучения). Как будет время после сдачи диплома, обязательно попробую эту задачу. Выложу свои результаты и наверное сам пакет с движком. Вообще результаты показывает неплохие, но у меня кол-ко входов гораздо меньше.

akhmelev 8 мая 2011 в 23:16

Кое-что об ошибках. При обучении обычно полезно контролировать две ошибки
1) ошибка обучения (это ошибка при распознавании образов из обучающей выборки)
2) ошибка обобщения (это ошибка на незнакомых данных, т.н. тестовая выборка) — гораздо более важный параметр, который показывает чему же в конце концов мы научили сеть.

Почти всегда рост числа нейронов снижает ошибку обучения, вплоть до переобучения (паралича сети), но одновременно с её снижением в определенный момент начинает расти ошибка обобщения — это и есть оптимальный размер сети. В вашем случае растет именно ошибка обучения, что противоречит теории — видимо дело в матлабе, неверном типе данных, или еще в чем то, сложно сказать, но это — аномалия техногенного характера. Точно.

Далее, шум — это общеизвестный способ немного улучшить обобщающую способность сети, но в то же время шум делает невозможным снижать ошибку обобщения до сколь угодно малой. Выходов из дилемы три:

1) Экстенсивный, вместо одной сети использовать их комитет — чем он больше тем ниже будут обе ошибки.
2) Интенсивный — использовать другую топологию, например сверточные нейросети.
3) Если свойства объекта могут быть проанализированы аналитически использовать не нейросети, а подходящий под задачу более адекватный алгоритм: дерево решений, сингулярный анализ (или метод главных компонент), преобразование фурье (спектр) и т.д.

fralik 8 мая 2011 в 23:27

Глянул файл characters.mat. А почему размерность алфавита 48 на x? Судя по статье должно быть 35 на x.

Ky7m 8 мая 2011 в 23:38

Это файл сохранен с MATLAB 7.5, я в программе учитываю это.
Например, в 2011 Matlab (7.12): ALPHABET — 35x26 matrix of 5x7 bit maps for each letter. TARGETS — 26x26 target vectors.

yanchick 9 мая 2011 в 06:44

Поскольку занимаюсь с нейронными сетями обнаружил небольшую закономерность: в качестве примера их использования в подавляющем большинстве случаев(>97%) используют задачи распознавания и предсказания, которые имхо несколько оторваны от практики. Не кого не критикую, просто небольшое наблюдение.

dmitriko 9 мая 2011 в 10:26

а какие методы использования НС более практичны?

yanchick 9 мая 2011 в 12:04

Хороший вопрос, на который, я думаю, ни у кого нет ответа. Лично пытаюсь их применить к задаче управления динамическими объектами.

iambot 9 мая 2011 в 12:42

Странно спрашивать об универсальном методе где он более практичен?
Везде, но в разной конфигурации.

HoochieMen 10 мая 2011 в 09:35

я бы предположил что управление действиями npc-персонажей в играх.

ankh1989 9 мая 2011 в 10:27

Прочитал краткую теорию нейросетей по ссылке в конце статьи. Если я правильно понял, то суть этих нейросетей в том, что у нас есть много однотипных устройств (нейронов) с простой логикой работы и вместо того, чтобы соединять эти устройства следуя логике (как это делают при обычном программировании), мы берём входные данные, требуемые выходные данные и настраиваем сеть так, чтобы на входных данных получалось что то похожее на нужные выходные данные. Здесь главное, чтобы этими нейронами можно было, в принципе, реализовать любую функцию.

Почему бы не заменить нейрон устройством «nand-gate», известным в программировании FPGA (nand это булева функция: nand(a, b) = not(and(a, b)))? Сеть из nand-ов может реализовать любую функцию, потому что из композиций nand можно построить любую функцию. В этом случае получится FPGA (или ПЛИС, по нашему) — схема которую можно перепрограммировать самому. Почему тогда для программирования FPGA не используют подход нейросетей, а программируют как обычно? Наверно потому что подбирать параметры соединений FPGA слишком долго. Вот поэтому мне кажется, что решить какую либо задачу проще обычной программой, а не нейросетью.

iambot 9 мая 2011 в 12:43

При чем здесь вообще булевы функции? Конкретно нейронные сети могут применяться не только на задачах классификации, но и на численных задачах.

halyavin 9 мая 2011 в 15:34

1. nand — не дифференцируемая функция.
2. Практические булевы функции слишком сложны для нейронной сети. Изменяете один бит на входе — и на выходе совсем другое.

HomoLuden 9 мая 2011 в 20:32

При желании функцию активации нейронов можно задать и такой, но результат скорее всего разочарует по указанным выше причинам.

ZOXEXIVO 7 ноя 2012 в 17:53

Их суть в том, что у тебя есть уравнение со многими неизвестными и ты эти самые неизвестные изменяешь (определенным алгоритмом) до тех пор пока уравнение не станет равенством (громко сказано) хотя бы приблизительно.
Дальше, работа нейронной сети — это просто аппроксимация данных этим самым уравнением.

Petrify 10 мая 2011 в 08:38

Мое мнение, что приведенное применение нейросети — не самый показательный пример работы. Все же сложно не согласится с тем, что большинство задач нейросеть решает хуже(по-крайней мере по точности), чем классические алгоритмы. Одно из наиболее полезных свойство НС — возможность обучения в процессе эксплуатации. Например, на автомобилях с АКПП используют нейросети для адаптации параметров коробки к амортизации.
Так же для конкретной задачи в статье мало затронута основная проблема работы с НС — приведение входов к инвариантности относительно шумовых типов(не значений). Например, попробуйте сделать то же самое для разных шрифтов — у вас ничего не выйдет, пока вы не приведете набор значений пикселей к типовому для буквы значению, независимо от шрифта. В данном случае можно было бы рассмотреть не тупо значения пикселей, а, например, центр масс буквы, кол-во отверстий в ней и т.д. — на что хватит фантазии.

По поводу построения сети:
Функция активации — вообще тема для отдельной статьи, но, хотя бы, привести несколько других можно было бы.
Кол-во скрытых слоев — «возьмем один», а почему 1?
Кол-во нейронов подберем в ручную…
Я конечно дико извиняюсь, но я на вступительной работе в бауманку делал распознавание рукописного ввода с автоматическим определением параметров нейросети с самостоятельным написанием всего и вся на дельфи.
А тут — человек просто нашел в матлабе модуль для работы с нейросетями, толком не разобрался с самими НС и сделал «проект» за 10 минут и решил это запостить.
Либо рассказывайте почему вы делаете так, а не иначе(сравнительный обзор, например), либо приведите интересную реализацию. Распознавание печатного текста уже было неоднократно.

HomoLuden 10 мая 2011 в 09:51

Присоединяюсь…

Нейронные сети были разработаны 50 лет назад, из них всё выжали в то же время. И с тех пор не придумали ничего нового.

50 лет на мой взгляд нормальный срок (это еще не давно). В науке все небыстро. А вот про «выжали» не согласен. Как раз нет твердой методологии по проектированию структуры сети. И здесь, на Хабре, требовать сухого теоретического обоснования не нужно. Но хоть какое-то обоснование хотелось бы увидеть.
И ГА и ИНС еще недостаточно обоснованы с теоретической точки зрения, но они работают. А чего больше надо «практику»?

HomoLuden 10 мая 2011 в 09:57

Забыл про «приведение входов». Да это очень важная тема. В цифровой обработке сигналов в этом плане легче — всегда есть максимум и минимум на выходе датчика. Нужно лишь поточнее их определить или взять с запасом. А вот в распознавании все посложнее. Если автор напишет свои соображения по этому поводу, будет хорошо.

Про функцию активации — пробовал обучать ИНС с сигмоидом во входном слое (сетка для решения СЛАУ) и ничего толком не вышло. Заменил все на чисто линейную функцию и замечательно обучается, но ведь это уже не интересно. Что за сеть без нелинейных функций активации? Если по этой теме кто-то отпишется, тоже буду очень благодарен.

Ky7m 10 мая 2011 в 21:56

1) Почему один скрытый слой?
Ну, начнем сначала, почему он вообще там есть. Из теории известно, что нейронная сеть, которая состоит всего из входного и выходного слоев без скрытых слоев, представляет собой линейный персептрон. Из названия уже понятно, что такие персептроны способны моделировать только линейные функции, поэтому используются очень редко. Хотя они обеспечивают универсальную линейную аппроксимацию, что часто и требуется для конкретной задачи, но явно не нашей. Но если проблема значительно нелинейная, имеет смысл попытаться решить ее с помощью линейного персептрона.
Математики долго бьются над вопросом, сколько оптимально скрытых слоев должно быть, но в реальной сети использование большего количества слоев приводит к уменьшению суммарного количества элементов в скрытых слоях. Но анализ людей, работающей в этой области науки, считает, что для решения большинства практических задач достаточно одного, иногда двух скрытых слоев. Причина такого несоответствия теории и практики лежит, по-видимому, в том, что сложность реальных проблем намного меньше, чем это теоретически возможно. Поэтому решение задачи удобно начинать с такого рассуждения, да и в MATLAB удобно показывать на примере, рассматриваемом в статье.
2) Количество нейронов в скрытом слое я потом изменял и проиллюстрировал результаты, в комментарии дали хороший развернутый ответ на полученную зависимость качества НС от количества нейронов в скрытом слое.
3) Тут человек нашел в MATLAB модуль, не нашел такой статьи на Хабре, нашел желание и показал на примере практическое применение.
4) К сожалению, потратил не 10 минут, а наверно 10 часов на всё.
Спасибо за Ваш комментарий.

Disasm 13 мая 2011 в 09:41

Из теории известно, что нейронная сеть, которая состоит всего из входного и выходного слоев без скрытых слоев, представляет собой линейный персептрон.

Это если функция активации тоже линейная, так?

Ky7m 13 мая 2011 в 10:00

Да, можно это понимать как линейный классификатор (делим на два множества с помощью бесконечной линии)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Нейронные сети и распознавание символов

Комментарии 57

Публикации

Истории