Как стать автором
Обновить

Юмор в стиле Open Source

Время на прочтение3 мин
Количество просмотров3.9K
Несмотря на устоявшиеся представления о том, что приверженцы Open Source — унылые красноглазики, в лишний раз убедился в адекватности и позитивности настроя лидеров этого движения. Краткая предыстория такова:
  • у нас есть маленькая Open Source-компания, генеральный директор сейчас занят разработкой весьма нетривиального робота для скачивания и обработки интернет-сайтов на C++;
  • в связи с этим мы над ним давно шутим в стиле «хватит уже изобретать свой велосипед, когда для этого есть wget»;
  • несколько дней назад в сети появилось объявление нынешнего разработчика Wget о том, что он собирается прекратить разработку и ищет себе преемника;
  • на днях у нашего директора случился день рождения;
  • мы решили подшутить над ним, попросив автора Wget написать ему письмо с предложением стать мэйнтейнером Wget вместо того, чтобы продолжать писать своего робота.


Результат не заставил себя ждать:

Читать дальше →
Всего голосов 210: ↑185 и ↓25+160
Комментарии78

Продолжаем парсить RSS теперь уже kinozal'a используя grep, wget/curl

Время на прочтение3 мин
Количество просмотров12K
RSS
В моем предыдущем посте про автоматизацию загрузок новых эпизодов с RSS ленты LostFilm'а хабраюзер AmoN поднял правильный вопрос о невозможности описанным мною способом загрузки раздач, прямых ссылок на torrent файл которых в RSS ленте не содержится. В качестве примера был приведен трекер кинозал.тв. Именно решению этого вопроса посвящен сей пост ;)
Читать дальше →
Всего голосов 37: ↑31 и ↓6+25
Комментарии24

Парсим RSS LostFilm'a с помощью grep и передаем на закачку через wget

Время на прочтение4 мин
Количество просмотров21K
RSS
Однажды мне надоело вручную просматривать LostFilm на наличие новых вышедших серий и я решил автоматизировать этот процесс. Дело в том, что многие BitTorrent клиенты имеют в своих настройках так называемые папки слежения (wach directory). Как только в этой папке появляется новый torrent файл BitTorrent клиент сразу же начинает его загрузку. Обычной практикой, к примеру, является создание такой папки и открытие к ней доступа на запись по FTP. Теперь, все что нам требуется, это автоматизировать скачивание torrent файла по выходу нового эпизода в указанную папку для их дальнейшей автоматической загрузки. Как сделать именно это я сейчас и покажу.
Читать дальше →
Всего голосов 61: ↑53 и ↓8+45
Комментарии75

Парсер RSS на bash для Лостфильма: щадящий режим для RSS сервера, проверка скачанного

Время на прочтение3 мин
Количество просмотров5.9K
Доброго времени суток!
Когда-то, благодаря этому топику, был написан неплохой парсер для Лостфильма. Сейчас я хотел бы поделиться собственной доработкой скрипта, связанной с изменением формата ссылок на Лостфильме, добавлением проверки на обновление ленты и проверки скачанного.

Прежде всего, что-бы снизить нагрузку на RSS сервер, при запросе ленты с помощью wget нужно использовать «If-Modified-Since:». Тогда, при отсутствии обновлений, мы не будем качать и обрабатывать всю ленту. Такой подход снизит нагрузку на сервер (и немного на наш компьютер).
Используем следующий вариант команды:

# Подготовка заголовка If-Modified-Since
lastmod="$( grep -m 1 Last-Modified response.out )"

header="If-Modified-Since:"${lastmod#*:}

Читать дальше →
Всего голосов 32: ↑28 и ↓4+24
Комментарии48

Проценты готовности в заголовке окна

Время на прочтение1 мин
Количество просмотров989
Утилита wget (по крайней мере, Windows-версия) отображает процент готовности закачки в заголовке окна, и это одно из её полезных качеств.

А вот 7-Zip стабильной версии 9.20 (точнее, консольная утилита 7za.exe) не делает ничего подобного — хотя, очевидно, знает процент готовности архива и даже отображает его в последней из тех строк, которые выводит в консоли. Стало быть, за темпом хода работы не уследишь, если эта часть окна не видима, закрыта другими окнами.

Но по мере устаревания Windows XP эта разница исчезает из сознания потребителей: люди привыкают вообще не видеть заголовок окна программы на её кнопке на панели задач, а видеть значок только.

И это, пожалуй, печально — но многие ли всерьёз опечалены этим?…

Я вот, скорее, досадую.
Всего голосов 69: ↑16 и ↓53-37
Комментарии12

Голосовая почта и качественный скачок услуги благодаря Google (FreeSWITCH edition)

Время на прочтение4 мин
Количество просмотров11K
При использовании современных телефонных платформ услуга голосовой почты стала настолько привычной и востребованной, что разработчики «софтовых» АТС создают модули голосовой почты, производители «железных» АТС создают целые платы голосовой почты, а операторы связи предлагают ее как услугу. Все, как говорится, просто и понятно. Не дозвонился до абонента, система тебя переадресует на голосовую почту и предлагает оставить сообщение. Далее есть несколько вариантов — абоненту высылается оповещение (чаще это письмо) о том что оставлено голосовое сообщение, мол — зайди в систему и послушай. В более продвинутом варианте на почту сразу приходит файл с записью, что позволяет не теряя времени на посещение интерфейса системы — сразу из письма прослушать файл. Но можно сделать услугу еще удобнее и качественнее.

FreeSWITH+Google=Voicemail 2.0

Читать дальше →
Всего голосов 37: ↑33 и ↓4+29
Комментарии17

Как я всех посмотрел…

Время на прочтение3 мин
Количество просмотров5.4K
… а потом ещё и лайков понаставил.

Всё началось с того, что на одном сайте знакомств я обнаружил, что фотографии там хранятся без обработки.
Читать дальше →
Всего голосов 37: ↑16 и ↓21-5
Комментарии6

Архивирование веб-сайтов

Время на прочтение7 мин
Количество просмотров18K
Недавно я глубоко погрузился в тему архивирования веб-сайтов. Меня попросили друзья, которые боялись потерять контроль над своими работами в интернете из-за плохого системного администрирования или враждебного удаления. Такие угрозы делают архивирование веб-сайтов важным инструментом любого сисадмина. Как оказалось, некоторые сайты гораздо сложнее архивировать, чем другие. Эта статья демонстрирует процесс архивирования традиционных веб-сайтов и показывает, как он не срабатывает на модных одностраничных приложениях, которые раздувают современный веб.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+12
Комментарии11

Мой первый прототип поискового движка

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров7.1K

Я реализовал первый прототип собственного механизма поиска, который сокращённо назвал PSE (Personal Search Engine). Создал я его с помощью трёх скриптов Bash, возложив всю основную работу на sqlite3, wget и PageFind.

Браузер Firefox вместе с Newsboat сохраняют полезную информацию в базах данных SQLite. В moz_places.sqlite содержатся все посещённые URL-адреса и адреса закладок (то есть moz_bookmarks.sqlite базы данных SQLite). У меня получилось около 2000 закладок. Это меньше, чем я предполагал, так как многие оказались нерабочими из-за битых ссылок.

Нерабочие URL-адреса страниц сильно замедляют процесс сбора, так как wget приходится ожидать истечения различных таймаутов (например, DNS, ответа сервера, время скачивания). URL-адреса из «истории» составили бы интересную коллекцию для сбора, но тут не обойтись без списка исключений (например, нет смысла сохранять запросы к поисковым системам, веб-почте, онлайн-магазинам). Изучение этого вопроса я отложу до следующего прототипа.
Читать дальше →
Всего голосов 57: ↑55 и ↓2+53
Комментарии26
2