sshmakov 7 окт 2017 в 17:06

Как отличать птиц от цветов. Или цветы от птиц

12 мин

13K

Python*Qt*Машинное обучение*

Комментарии 15

capjdcoder 7 окт 2017 в 21:08

Я буду с нетерпением ждать следующих выходных :)

QtRoS 8 окт 2017 в 00:38

А что-нибудь коробочное принципиально не использовали? Написать CNN на том же TensorFlow тоже довольно интересно, полная гибкость и контроль, Python дает полный доступ к возможностям библиотеки — сказка!

sshmakov 8 окт 2017 в 10:27

Отчасти принципиально не использовал. С коробочными решениями есть одна проблема — прежде чем их использовать, мне нужно сначала понимать, что я хочу с ними сделать. Не являясь ни специалистом в машинном обучении, ни математиком, давно хотелось взять что-то совсем элементарное и покрутить в руках, что выявить все недостатки моего наивного подхода. А тут как раз наткнулся на хабре на перевод SLY_G.

Если бы машинное обучение было бы моей работой, то я бы так не делал. Наверное.

Кстати, здесь есть хорошая статья по TensorFlow, оставлю ссылку здесь.
Еще PyTorch.
Да что там, можно ничего другого не подключать, даже в OpenCV есть реализация нейронных сетей и глубокого обучения.

Sly_tom_cat 8 окт 2017 в 15:01

Дополнительные слои редко дают выигрыш. Каждый лишний слой это лишняя стадия в распространении ошибки при обратном проходе(back propagation).
Гораздо лучших результатов можно добиться нормализацией входных значений. Но тут нужно постараться не потерять важное при нормализации.

Но изображения лучше всего обрабатывать сверточными сетями с предварительной тренировкой (энкодер) входных слоёв.

Dark_Daiver 8 окт 2017 в 20:29

>Дополнительные слои редко дают выигрыш.
Ну если не ошибаюсь, то больше слоев — больше «выразительность» сети, т.е. больше возможностей уменьшить ошибку на train set. Так что дают, но этим выигрышем надо еще воспользоваться.
> с предварительной тренировкой (энкодер) входных слоёв.
Вроде как совсем необязательно. А вот предобученную на ImageNet сеть и правда есть смысл использовать.

skiedr 8 окт 2017 в 22:07

Более того, году так в 85-90 была доказана теорема что для любой многослойной сети существует функционально аналогичная сеть с одним внутренним слоем.

sshmakov 8 окт 2017 в 23:57

Эта теорема Хехт-Нильсена? По моему, она работает только для полносвязных сетей, где каждый нейрон скрытого слоя связан с каждым нейроном входного слоя, и также каждый с каждым между скрытым и выходным слоями. В рассматриваемой в статье сети это не так, потому что она использует матричное умножение, а в нем нейрон скрытого слоя связан лишь с одной строкой входной матрицы.

Схема умножения матриц

Sly_tom_cat 8 окт 2017 в 15:15

И да, размерность выхода вашей сети должна быт 1. Порог ,5 (но можно с ним поиграться). Оценка точности предсказания — просто по максимальным значениям. Ваш вариант с размерностью 4 просто размазывает результат на 4 значения, оценивать которые гораздо сложнее.

sshmakov 8 окт 2017 в 17:54

Спасибо.
Размерность 1 я пробовал в одном из вариантов, но понял, что я не понимаю, что происходит — учится она или нет, поэтому для наглядности сделал 4.

Насчет доп.слоев и нормализации я подумаю. Вообще используя цветовую составляющую уже происходит нормализация по яркости и насыщенности.

romy4 8 окт 2017 в 18:54

А если основное различие происходит на границах нарезанных кусочков матрицы, то получим неправильный результат?

sshmakov 8 окт 2017 в 19:40

В общем случае необязательно, поскольку суммирующая сеть может быть готова к такой ситуации. Но конечно, разбивка на кусочки — это осознанное загрубление результата и риск потери деталей.

НЛО прилетело и опубликовало эту надпись здесь

sshmakov 9 окт 2017 в 10:08

Я понимаю — включаешь так фильм по ТВ, смотришь, думаешь боевик, а нет, опять сериал.
А вам было не интересно?

mouze1976 10 окт 2017 в 23:30

Спасибо за статью. Подскажите как исправить ошибку

ModuleNotFoundError: No module named 'meshandler'

sshmakov 10 окт 2017 в 23:39

meshandler — это модуль для вывода отладочных сообщений Qt. Его можно скачать, например, отсюда github.com/sshmakov/conopy/blob/master/conopy/meshandler.py

Или можно убрать строчку

import meshandler

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время