28 April 2009

Мысли вслух или «что останавливает прогресс ?»

Lumber room
Я не особо умный человек. У меня нет достижений ни в сфере веб-дизайна, ни в сфере маркетинга. Даже работа моя не особо оригинальная. Я уверен что большинство из вас – талантливые люди, которые достигли в жизни намного большего, чем ваш покорный слуга. Но почему-то даже я, простой житель этой планеты, иногда вижу вещи такими, какими они могли бы быть.
— Почему они еще этого не сделали? — спрашиваю я себя. У меня ответа нет…

Я не льщу себе, думаю многие из вас уже думали, или подумывали о том, что я сейчас озвучу: идеи просты. Но почему никто это еще не реализовал — непонятно.

Например, я думаю, многие из вас видели ролик, в категории «Будущее здесь», в котором актер наводит многофункциональный кпк на здание и получает информацию по этому зданию, 3d модель и прочее. Я тогда подумал: эти ребята умеют искать идеи. Ведь действительно, мало кто мог придумать подобный сервис. При чем он действительно станет очень удобным и популярным. Я намеренно употребляю слово «станет», а не «может стать». Это очевидно.



Но этот сервис еще не реализован, хотя реализация не так уж и сложна, как кажется на первый взгляд.
Давайте рассмотрим, что нам надо для того, что бы воплотить подобное в реальность.
Во-первых: нам нужна возможность распознать здание на телефоне. Этот этап кажется самым сложным, но учитывая современное развитие технологий и здравый смысл мы опровергнем данное утверждение. Главное не бояться и мыслить поэтапно.
Попробуем представить структуру того, что мы видели так, как если бы оно работало:

1) Считывание данных (фотография, потоковое видео).
2) Отправка данных на сервер для обработки.
3) Собственно обработка.
4) Получение данных с сервера.

Мы с вами знаем, что в нынешний век маркетинговых уловок, почти в каждом фотоаппарате есть мобильный телефон с возможностью доступа в Интернет мобильном телефоне есть фотоаппарат, так же доступ к сети Интернет. Многие города покрыты 3g, или даже WiMAX. Почти везде есть доступ к интернету по GPRS или EDGE. Сведя эти две прямые мы можем сделать вывод, что отправить не “тяжелую» фотографию на сервер получится почти везде. А при определенных условиях – можно отправлять и потоковое видео. Или вместо потокового видео – цикл изображений.

Допустим первый и второй пункты нашего очень простого плана – исполнены: мы можем передавать информацию на сервер. Но зачем серверу фотографии? Думаю самые догадливые поняли это с самого начала и я их отвлекаю своей трепотней, но потерпите немного.

Все из вас знают такого гиганта IT индустрии, как Google. Многие из вас выбирают его поисковик, как основной. Всех вас привлекает богатый функционал и удобный поиск. А так же постоянное развитие проекта. Добавлений новых функций и возможностей. И это классно.
Так вот. У гугла есть один замечательный сервис Similar Images . Думаю, многим из вас он знаком, и вы даже неоднократно им пользовались. Для остальных поясню: этот сервис ищет похожие изображения. Вы можете перейти по ссылке и более подробно посмотреть информацию по данному сервису. Ну а я пока вернусь к нашим баранам.

Перейдем к пункту три. Допустим, отправим мы фотографии, а что дальше? Мы можем сфотографировать здание с различных позиций и передать фотографии на сервер, где каждой фотографии присвоить метку, ну например «Пизанская Башня». Достаточно просто. К каждому зданию – отдельная метка. Вы спросите: «Какой в этом прок? Ведь сфотографировать с всех ракурсов невозможно». И вы будете правы. Действительно невозможно сфотографировать с всех сторон. Но мы ведь уже знаем, что есть различные механизмы распознавания изображений. Имея в наличии движок распознавания, и большого количества фотографий мы можем любую фотографию здания, сделанную любым устройством распознать, как фотографию этого здания. Остался вопрос наполнения.

Сам по себе вопрос наполнения базы зданий ( пусть это будут только здания, для начала ) кажется очень масштабным и сложным. Ведь надо нанять громадное количество операторов и наполнителей базы данных, где будет храниться информация по объектам.
Действительно, очень сложно. И затратно. Особенно если забыть про то, что на нашей планете живет достаточно большое количество людей, которые готовы совершенно бесплатно помогать в данном проекте, если увидят его перспективы.
Вот скажите честно, вы бы сфотографировали памятник в своем городе, а свой дом? Ведь это совершенно не сложно и не затратно — сделать две-три фотографии и отправить их на сервер с минимальными комментариями. И если каждый десятый из миллиардов пользователей интернета сделает две-три фотографии какого-либо памятника архитектуры, или просто дома — у нас будет в наличии достаточно большая коллекция изображений с метками. Вроде неплохо.

Естественно, на первых порах организатору надо будет самому заполнить множество особо крупных и популярных зданий, для того, что бы добавить энтузиазма обычным пользователям, но ведь дальше то в дело вступят обычные люди!..

Итоговая схема будет выглядеть так: человек направляет камеру на здание и делает фотографию ( или цикл фотографий ), программа отправляет их на сервер для сравнения, получает результат, сортирует по ревалентности похожие снимки и выбирает наиболее похожие. Далее идет считывание метки с фотографии и поиск информации в базе, после чего — отправка данных на обратно клиенту. Всё очень просто. И очень юзабельно.

Конечно же, это всё затраты. Это и необходимое программное обеспечение для мобильных телефонов, при помощи которого можно вызвать функцию камеры, получить снимок, отправить снимок на сервер и получить ответ. Это и первоначальные затраты. Это и мощность серверов для обработки информации. Но ведь какая перспектива! Это ведь настоящая, полезная функция, а не высасывание из пальца последних соков маркетологами.

Перспектив множество. К примеру, продвижение мобильной ОС, в которой удобно реализована данная функция.

Но вот очень сложно понять, почему это еще не реализовано. Ведь идея не сложна. Реализация – для какого то крупного игрока вроде гугла – тоже. Может кто то намеренно притормаживает, что бы выдать это, когда закончатся остальные уловки маркетологов? Но ведь если стоять в стороне – кто то может реализовать и раньше? Вот как вы считаете?

P.S. Я не редактор и не корректор. Я даже не журналист. Так что если вы нашли какие-то грамматические или стилистические ошибки в моем тексте – обязательно оповестите меня через ПМ. Заранее спасибо =)
Tags:мысли вслухgoogleбудущее здесь
Hubs: Lumber room
+2
207 1
Comments 46
Popular right now
Machine Learning. Professional
November 26, 202048,000 ₽OTUS
Тренажер product-менеджера
November 26, 202028,900 ₽SkillFactory
SMM-менеджер
November 27, 202069,900 ₽Нетология