Как стать автором
Обновить

Комментарии 52

Вы надеюсь перешли на официальное twitter API, или все еще колхозите?

Там, кстати, можно больше условий на хеш-таги накладывать.

А для избежания ложных срабатываний не пробовали сделать простой пороговый фильтр?
А что подразумевается в данном случае под пороговым фильтром? Подсчет «ключевых» слов?
Вообще можно много чего предложить для улучшения детектирования и отсеивания ложных тревог.

Самое простейшее — не реагировать на первое сообщение, а накапливать сообщения в течение некоторого окна времени. как только сообщений в окне становится достаточно много, генерируется событие.

Следующее улучшение — определять для каждого сообщения некоторую степень достоверности, и учитывать ее при подсчете очков.

Решением таких задач занимаются CEP в широком смысле
Прежде чем обрабатывать поломку, накапливаем некоторое количество сообщений.

На данный момент было интересно запустить проект как можно быстрее, не заморачиваясь с чем-то сложным. Интересно нужно ли это народу и в зависимости от этого будет ясно куда дальше двигаться.
Код мало читаем.
Для обработки текста лучше подходит awk, а не grep.
Ну, так это же регулярки, они всегда нечитаемы) Тем более, это только часть кода.
Даже используя регулярные выражения, переносы строк, табуляции и символ "\" сделают код более читабельным.
Вы же не собрались экономить пару байт кода скрипта в ущерб читабельности и дальнейшего рефакторинга?
Или знаешь регулярные выражения или не понимаешь
Флейм
xxx> Я умею читать чужие мысли!
yyy> А я умею читать чужие регулярные выражения
xxx> Ок, ты победил
Цитата #431836 — Цитатник Рунета
И какая взаимосвязь?
Я вот знаю regexp и все равно, вынужден буду форматировать код для лучшей читабельности.
На мой взгляд, вполне всё читаемо, может быть, за исключением куска с точками с запятой. Более того, просмотр кода сделал излишним чтение пару абзацев последующего текста )
grep полезен если нужно быстро и просто найти строки, по заданному шаблону. Еще он может возвращать некоторую иную информацию, такую как списки имен файлов, выводить n-совпадений и много чего еще интересного и нужного.
А awk это С-подобный язык, им удобно будет читать, к примеру CSV файлы. Но он не такой простой, чтобы использовать для простых задач. Он умеет всё, что и grep, но это не всегда надо.
grep полезен если нужно быстро и просто найти строки

При больших текстах и файлах это не очень быстро.

Еще он может возвращать некоторую иную информацию

Вы и так результат присваиваете переменной и дальше обрабатываете.

… к примеру CSV файлы. Но он не такой простой

Вы парсите сложный html текст, форматированный CSV текст значительно проще.
Где вы увидели тут большие тексты? html-страничка весит ну максимум 20кб
html-страничка весит ну максимум 20кб

Вы хотели сказать 20KB? :)

Плотно размещенный печатный текст формата А4 занимает примерно 2KB в электронном виде.
Я раз за прогресс в росте производительности микропроцессоров, не не привык зря расходовать процессорные такты.
Здорово!
А как смски отправляете?
Спасибо :)
Отправляем через websms.ru. Просто потому что это первое (или одно из первых) что нашлось в гугле. У них есть разнообразное api для отправки, в том числе и простыми get-запросами.
Думаем о том, чтобы приспособить старенькую нокию для отправки смс (взяв какой-нибудь жирный SMS-пакет) — это должно быть дешевле
Можно 3g модемом это еще делать. Вполне удобно.
А если прикрутить какой-нить smsd с плагином mysql, то для отправки будет достаточно вставить запись в БД.
Есть ведь сервисы, которые позволяют отправлять самому себе различные уведомления совершенно бесплатно. Насколько я помню, sms.ru имеет такую возможность. В случае подписки пользователей на уведомления предлагаем им регнуться на сайте и сообщить свой api-key. В случае малонагруженного сервиса вполне себе рабочее бесплатное решение.
Слишком сложная рега получается
При желании можно упростить: предупреждаем пользователя что его данные передаются третьей стороне и выводим ему капчу с сайта, остальные поля при регистрации в том сервисе заполняем самостоятельно. Чтобы быть честными с пользователем, сообщаем ему реквизиты от сайта, где его зарегистрировали, а себе в базу записываем его api-key. Это конечно уже не однострочник получится, зато бесплатно.
Пока что прикрутили nokia по uart смски слать о поломках. 1 телефона мало конечно, вскоре еще добавим
ИМХО как-то слабовато. Вы читаете твиттер, выгрепываете нужное и рассылаете смс через сторонний сервис — кажется, что в такой формулировке задачу способен решить простенький скрипт, написанный первокурсником в качестве лабораторной работы. И ссылки на какой-нибудь гитхаб не хватает.
И кстати, как вы монетизируетесь?
Хорошее и полезное приложение не обязано быть люто сложным внутри. Да и то, что идея и реализация простые не означает, что в решении не будет мелких, но важных нюансов…

А вот к вопросу о планах монетизации я присоединюсь, СМС-ки то не бесплатные. Посмотрел тарифы, я так понимаю на 500+ людей разослать СМС будет стоить в районе 200 рублей, и чем больше — тем дороже. Можно кстати отказаться от СМС (или сделать его запасным вариантом) и зафигачить собственное мобильное приложение, которое будет принимать push-уведомления :-)
pushbullet API было бы очень круто
Очень элегантное решение получилось.
А есть/будет возможность подписаться на определенные ветки метро?
Мы как-то обсуждали такую возможность и не посчитали её нужной. Допустим работа/учеба — дом одни и те же ветки, но периодически человек может ездить по всем остальным веткам — дела, культурные мероприятия, etc
Как опционально можно и сделать
Не планируете аналогичную штуку для трамваев и троллейбусов? Они встают намного чаще, чем метро :)
Если люди об этом пишут, то конечно добавим.
В дополнение было бы классно указывать, по каким дням можно слать смс(в выходные, например, меня нет в Москве — значит мне не интересно получать смс)
Добавили личный кабинет, в котором можно выбрать ветки и время оповещения.
Если добавим, то как отдельную рассылку. Спасибо за идею )
Молодцы, клево. А сделайте еще rss? Я вот, скажем, далеко не каждый день пользуюсь метро, и смски — это излишне; а вот проверить фид было бы самое то.

В идеале, конечно, вот так — www.tfl.gov.uk/tube-dlr-overground/status
Сделаем ))
+ к RSS или возможности каким-нибуть GET получить ткущую ситуацию. Зашел в метро — стоит толпа и поезд не идет — и думай, это временная бага на 5 минут или там на рельсы Михалков упал и праздник, метро ходить не будет еще час, иди на автобус. А так ткнул кнопочку, получил инфу и решил.
Очень хорошая идея!
Присоединяюсь к просьбе о RSS.
Еще можно канал на pushbullet создать, вместо смсок(или в дополнение к ним)
Надеюсь, не сочтёте за откровенную рекламу.
Я совсем недавно тоже сделал сервис с СМС оповещениями, только по раскрытию информации публичных компаний.
Скажем, Газпром публикует квартальный отчёт, так вот его подписчикам в течение минуты придёт эта новость вместе с ссылкой на сообщение компании. Рассчитано на весьма узкую в России аудитории участников торгов на фондовой бирже.
Публикуют руками, далеко не сразу и далеко не обо всем и твиттер аккаунт не у всех есть
Отличная вещь! Я Москвич, но, уверен, жителям, как минимум, Питера, такой сервис был бы тоже полезен. А ещё наверное и Минска, и Киева.
В пору прикручивать к Яндекс.Метро =)
Пока что в ленту идут все события на дорогах + метро. Возможно потом мы разделим ленты.
Если сообщений много, то есть смысл разделить ленты.
Пока что мы не знаем сколько сообщений, всё же только вчера подключили. Дорожные ситуации с dtmos.ru и они пишут не только об пробках, но и о наземном общественном транспорте. Тут надо понаблюдать на сообщениями и за предложениями пользователей.
Я это и имел ввиду. Понимаю, что сначала нужно накопить статистику.
Если будут предложения-идеи по разделениям лент обязательно напишите
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации