3 July 2019

Инженер Amazon создал систему машинного зрения, которая не дает коту проносить в дом трупы животных

Machine learningArtificial Intelligence


На конференции Ignite Seattle Бен Хэмм из компании Amazon развлек и впечатлил аудиторию своим рассказом о самодельном технологическом решении для бытовой проблемы. Спикеру сильно досаждала привычка его кота Метрика приносить с ночных прогулок тушки убитых грызунов и птиц и раскладывать их на видных местах. Чтобы положить этому конец, он усовершенствовал дверцу, через которую Метрик попадает в дом, при помощи замка, камеры и трех моделей искусственного интеллекта, которые определяют, давать ли ему проход.

Автор разработки пояснил, что пришел к этой идее за неимением других вариантов — кот отказывается носить ошейники, а прогулки ему необходимы. Единственным выходом было автоматизировать процесс досмотра, чтобы ситуация оставалась под контролем, даже когда хозяин спит. Для этого требовалось, во-первых, сделать дверь автоматически закрывающейся, во-вторых, создать умную систему наблюдения, которая могла бы анализировать обстановку.

Первое, по словам спикера, не составило большого труда: он использовал плату Arduino и простой замок. Второе обернулось продолжительной работой по сбору данных и обучению алгоритмов машинного зрения. Хэмм установил над кошачьей дверцей камеру AWS DeepLens и за пару месяцев составил коллекцию из около 23 000 фотографий, фиксирующих разные состояния окружающей обстановки. Также, наблюдая за питомцем, он определил, что проход через дверцу занимает около двух секунд — соответственно, система должна была проводить анализ и при необходимости запускать механизм, закрывающий замок, где-то за секунду.

Хэмм разбил процесс анализа на три части; за каждую из них отвечала отдельная модель и для каждой была подобрана соответствующая выборка изображений. Первая модель определяет, есть ли вообще кот на кадрах, которые она получает с камеры в режиме реального времени. Если ответ утвердительный, вторая модель анализирует, в каком направлении он движется — выходит из дома или возвращается внутрь. Наконец, если кот идет по направлении к дверце, подключается третья модель, обученная распознавать, несет ли он добычу в зубах.



Если установлено, что кот пытается пробраться в дом с тушкой, система запирает дверцу и снова открывает проход только через пятнадцать минут — практика показала, что этого времени достаточно, чтобы Метрик пришел к нужным выводам. Одновременно хозяину отсыпается смс-сообщение с кадрами, на которых запечатлены доказательства. Вдобавок Хэмм запрограммировал систему так, что за каждую жертву с его карты переводится небольшая сумма в фонд Национального Одюбоновского общества, которое занимается защитой природой, в том числе и тех птиц, на которых часто охотятся домашние хищники.

На момент выступления система работала уже около пяти недель и проконтролировала более сотни прогулок. В общей сложности она допустила две ошибки: один раз не распознала проноса контрабанды и один раз, напротив, не пропустила Метрика внутрь без оснований. Автор отмечает, что, хотя разработка приспособлена строго для его дома и его ситуации, подготовленная выборка, возможно, в будущем пригодится и другим людям.

Обсуждая историю на интернет-площадках, многие припомнили, что с такой же проблемой двадцать лет назад боролся и другой программист. Спасаясь от щедрости своей кошки Фло, он оснастил ее кошачью дверцу сложным сооружением из прожектора и камеры. Принцип работы системы был очень похож на то, что придумал Хэмм. Благодаря установленному особым образом прожектору, на стену отбрасывалась четкая тень головы кошки в профиль: камера записывала это изображение, а компьютерная программа — сверяла с образцом. Таким образом, хотя развитие искусственного интеллекта делает решения более лаконичными, преемственность между поколениями котовладельцев с технологическим уклоном несомненна.
Tags:компьютерное зрениемашинное зрениераспознавание изображений
Hubs: Machine learning Artificial Intelligence
+10
3.5k 2
Comments 1
Popular right now
Специалист по машинному обучению (Machine Learning)
from 20,000 to 60,000 ₽БастионМоскваRemote job
Senior ML Engineer
from 4,000 to 5,500 $HyprrRemote job
C/C++ Developer, Digital image processing
from 2,000 to 2,500 $Almalence, Inc.Новосибирск
Middle/Senior Software Engineer
from 100,000 ₽dicehub GmbH - GermanyRemote job