Как стать автором
Обновить
197
0

Big Data Solutions

Отправить сообщение

Загружаем и храним в Google Drive файлы любого размера бесплатно. Баг или Фича?

Время на прочтение3 мин
Количество просмотров100K
Недавно я нашел странную особенность в Google Drive. Определенная последовательность действий в Google Drive веб интерфейсе приводит к тому, что каждый может загрузить файлы любого объема в свою учетную запись и при этом не потратить ни одного байта на их хранение.

Конечно, я сразу решил сообщить об этом в Google через программу BugHunter. Но, к моему сожалению, потратив неделю на общение со специалистами Google мне так и не удалось убедить их, что это баг. Сотрудник не смог воспроизвести этот баг и я получил ответ, что «это не баг, а фича» и меня отправили в RTFM. В конце концов Google просто закрыл тикет и перестал отвечать на мои письма.

Так как переписка с Google зашла в тупик, я решил публично рассказать о этой «фиче» и, возможно, наконец привлечь внимание сотрудников Google к этой проблеме или хотя-бы понять, что я делаю не так. Ниже под катом история переписки с Google и proof of concept.
Читать дальше →
Всего голосов 142: ↑142 и ↓0+142
Комментарии125

Лучшие практики Netflix при переходе с Oracle DB на Amazon SimpleDB

Время на прочтение5 мин
Количество просмотров3.9K
Это частичный перевод статьи Netflix, касается только проблемных мест перехода c Oracle DB на Amazon SimpleDB и способов их решения компанией.

Где-то в конце 2008 года, у Netflix был всего один датацентр. И этот ДЦ поставил перед нами несколько вопросов. Как единственная точка отказа, к примеру, из-за проблем с электричеством, он мог привести к недовольству наших пользователей сервисом. К тому же, с одновременным ростом трафика потокового вещания и подписок на услуги, Netflix скоро бы переросла этот дата центр — мы видели неизбежную потребность в электроэнергии, лучшем охлаждении, нам требовалось больше места и больше оборудования.

Как вариант, можно было построить новые дата центры. Однако, кроме высоких затрат, это усилие привело бы к тому, что наши технические кадры не смогли бы заниматься новыми продуктами, так были бы заняты расширением ДЦ. К тому же, мы понимали, что управление несколькими дата центрами сложная задача. Строительство и поддержка нескольких дата центров казались нам опасным отвлечением от нашего основного бизнеса.

Вместо того, чтобы встать на этот путь, мы выбрали более радикальный. Мы перешли на решение IAAS (инфраструктура как сервис), предлагаемое в то время веб-сервисом Amazon. Со множеством уже работающих центров обработки данных, многократным уровнем избыточности различных сервисов (таких как, S3 и SimpleDB), AWS обещал лучшую доступность и маштабируемость за относительно короткое время.

Отдавая различные сетевые и фоновые задачи в аутсорсинг, Netflix сосредоточилась на своем основном бизнесе, поставке фильмов и сериалов.

В процессе перехода на инфраструктуру AWS мы сформулировали набор лучших практик, необходимых для работы с AP системами, такими как SimpleDB.
Читать дальше →
Всего голосов 8: ↑6 и ↓2+4
Комментарии4

Система хранения файлов с дедупликацией между пользователями

Время на прочтение3 мин
Количество просмотров6.5K
Начало этому проекту положила очень простая идея, о которой, я год назад писал на страницах хабрахабра. Именно тогда, я задумался, почему все сервисы хранения файлов такие жадные? Почему они зарабатывают на том, что несколько различных пользователей, хранят один и тот же файл? Почему мы должны платить дважды, трижды, а иногда и в сотни раз больше, чем реально это стоит? По-моему это несправедливо.

Вторая проблема всех платных сервисов хранения файлов – абонентская плата. Нас заставляют постоянно платить за хранение наших файлов. Если не заплатить, файлы удалят. Больше похоже на вымогательство, чем на удобный сервис, особенно в свете вот этого исследования на тему стоимости хранения данных. Поэтому я решил, что настала пора создать проект, который лишен этих недостатков.

Так появилась идея, а что из этого получилось можно прочитать под хабракатом.
Читать дальше →
Всего голосов 25: ↑21 и ↓4+17
Комментарии111

Разбираем HTTP Range по стандарту

Время на прочтение3 мин
Количество просмотров32K
В одном из проектов мне понадобилось разобрать HTTP Range запрос, чтобы добавить поддержку загрузки файлов по частям. В сети полно различных примеров, но я так и не нашел ни одной полной реализации RFC 2616. Один код не учитывал, что диапазонов может быть несколько, другой, что стандарт допускает запросы больше размера документа, третий не различает синтаксически правильный и недостижимый запрос, как рекомендует стандарт. Поэтому я решил написать свою реализацию и поделиться со всеми. Подробности и пример реализации на PHP под катом.
Читать дальше →
Всего голосов 30: ↑26 и ↓4+22
Комментарии9

Считаем хэши файлов любого размера прямо в браузере

Время на прочтение1 мин
Количество просмотров5.9K
В сети очень много сайтов для подсчета хэшей (MD5, SHA1, SHA2) файлов, однако, все сервисы, что я смог найти, имеют один и тот же недостаток: размер файла ограничен. Также необходимо сначала загрузить файл на сервер, чтобы получить результат вычислений. Это очень неудобно.

Поэтому я решил создать небольшой сервис MD5 File, расчет в котором будет происходить непосредственно в браузере пользователя. Нет необходимости загружать файлы на сервер (экономим трафик и время) и появляется возможность работать с файлами любого размера.

Картинка и немного информации под катом
Читать дальше →
Всего голосов 51: ↑48 и ↓3+45
Комментарии30

Что не скрывает LastPass?

Время на прочтение4 мин
Количество просмотров34K
Думаю, все знают, что такое Lastpass. Многие доверили ему хранение всех своих логинов и паролей. И как не доверить, ведь, разработчики декларируют, что вся информация защищена и шифруется на стороне клиентов. Помятуя о недавней истории я решил разобрать плагин LastPass на кусочки и понять, что действительно защищено, а что нет и продолжить свой цикл статей про маленькие проблемы в крупных проектах.
Читать дальше →
Всего голосов 102: ↑99 и ↓3+96
Комментарии82

Уязвимость в reCaptcha позволяет активировать до 30 действий по одному и тому же токену

Время на прочтение2 мин
Количество просмотров7.5K
Долго думал, стоит ли рассказывать, но вчера вечером у меня появилось немного свободного времени, и я все-таки решил продолжить свой цикл статей о маленьких проблемах в крупных проектах. Да и, возможно, об этом уже и так все знают, а я зря волнуюсь.

Все мы знаем сервис reCaptcha, который пару лет назад приобрела компания Google. Мы видим его во многих крупных проектах, например, при регистрации в LiveJournal. Надо сказать, что я люблю качать файлы списком прямо со своего сервера, и когда на одном из сайтов, с которого я периодически что-нибудь выкачиваю, появилась такая штука, меня стало это немного раздражать. Когда мне что-то не нравится, я не опускаю руки, а стараюсь придумать способ как этого избежать.

Так я решил побороть reCaptcha и думаю, что у меня это получилось…
Читать дальше →
Всего голосов 230: ↑218 и ↓12+206
Комментарии35

Защищаем DropBox (и другие сетевые папки) от посторонних глаз

Время на прочтение2 мин
Количество просмотров2.2K
В последнее время появляется много статей на тему того, что кто-то может смотреть данные пользователей на сетевых дисках. TrueCrypt хорошое решение этой проблемы в Windows, но он, к сожалению, хранит все файлы в контейнере, а это означает, что невозможно скачать только один файл через веб-интерфейс DropBox.

Мне это не очень нравится, и поэтому я решил сделать программу, которая следит за изменениями локальных файлов в папке (также как DropBox), но вдобавок умеет сжимать файлы в архивы автоматически. Таким образом, мы убиваем сразу трех зайцев: уменьшаем размеры файлов на сетевом диске, шифруем их паролем и получаем возможность безопасно скачивать в веб-интерфейсе по одному в виде шифрованного архива. Подробнее о программе под катом (+1 картинка 28KiB).
Читать дальше →
Всего голосов 10: ↑8 и ↓2+6
Комментарии4

Виртуальный диск Google Picasa

Время на прочтение3 мин
Количество просмотров1.4K
Проект виртуального диска продолжает развиваться. Как я и обещал, по результатам опроса, появилась возможность подключать виртуальный диск альбомов Google Picasa (Flickr запланирован на более поздний срок). Кроме того, теперь вы можете подключить диск к своим закрытым альбомам сервиса Яндекс.Фотки. Описание новых возможностей и изменений в проекте под катом.
Читать дальше →
Всего голосов 59: ↑57 и ↓2+55
Комментарии82

Виртуальный диск Яндекс.Фотки

Время на прочтение2 мин
Количество просмотров1.9K
Иногда бывает нужно быстро скопировать несколько фотографий из своего альбома на сервисе Яндекс.Фоток, конечно, есть специальная программа, но на чужом компьютере ее не всегда возможно установить. Я разработал небольшой сервис, который может значительно упростить этот процесс. Набрав в windows команду net use y: http://<адрес>/<логин>/, где <адрес> равен «wd.sharecoder.com/yf/», а <логин> — ваш логин на яндекс.фотках (пароль не нужен), вы подключите сетевой диск, папки на котором — альбомы (только те, что доступны для всех), а файлы — фотографии на сервисе Яндекс.Фотки. Теперь вы сможете скопировать их, как обычные файлы вашим любимым файловым менеджером. Подробности (и картинки) под катом.
Читать дальше →
Всего голосов 112: ↑109 и ↓3+106
Комментарии87

Интегрируем GnuCash с интернет банками с помощью эмулятора OFX

Время на прочтение2 мин
Количество просмотров2.2K
Я люблю GnuCash, это единственная бесплатная программа финансового учета, которая подошла мне на все 100%. GnuCash может интегрироваться со множеством банковских приложений посредством нескольких интерфейсов. Однако, к сожалению, наши банки похоже не собираются реализовывать хотя-бы один из них.

Мой проект предназначен для тех, кому надоело каждый раз лазить в ИБ, чтобы проверить баланс и согласовать транзакции GnuCash. Представляю вашему вниманию первую версию бесплатного эмулятора протокола Open Financial Exchange.

Внимание, внутри статьи много изображений.
Читать дальше →
Всего голосов 8: ↑7 и ↓1+6
Комментарии10

Расшифровываем Javascript на примере файлового хостинга mediafire.com

Время на прочтение8 мин
Количество просмотров5.6K
В настоящее время набирает популярность способ шифрования javascript на сайтах с помощью вложенных команд eval. Недавно я столкнулся с таким шифрованием на файловом хостинге mediafire.com. Шифрование было необычное, меня это заинтересовало и я решил понять, насколько хорошо данный метод работает.

Сайт mediafire.com позволяет скачивать файлы без каптчи и при этом, с недавнего времени, стал достаточно успешно защищаться от всевозможных автоматических роботов. Делает он это с помощью встроенного генератора кода javascript. Причем, код каждый раз создается новый, что затрудняет его эмуляцию автоматическими средствами.

В этой статье я расскажу о том, как можно очень легко обойти такую защиту без глубокого анализа шифрованного кода и создать автоматический скрипт загрузки файлов с mediafire.com.
Читать дальше →
Всего голосов 39: ↑35 и ↓4+31
Комментарии18

Автоматизируем работу с сайтом за 5 минут на примере Yandex.Почты с помощью NetExport

Время на прочтение7 мин
Количество просмотров9.8K
Иногда, бывает нужно автоматизировать некоторые процессы на чужом сайте. Залогиниться на сайт, скачать какой нибудь файл, открыть страничку. Часто приходится разбираться в коде сайта, чтобы найти, как правильно написать запрос curl.

Предлагаю Вашему вниманию способ, которым я сам пользуюсь, чтобы значительно облегчить себе жизнь и автоматизировать все и вся, от проверки почты, до загрузки данных в телебанке. Я постараюсь, на примере Yandex.почты показать, как можно очень быстро и почти без программирования сгенерить curl php скрипт для захода на любой сайт и загрузки контента в автоматическом режиме.
Читать дальше →
Всего голосов 42: ↑40 и ↓2+38
Комментарии21

Получаем информацию по продуктам от Амазона через API

Время на прочтение2 мин
Количество просмотров14K
Amazon.com это не только огромный магазин, но еще и бесплатный легальный доступ к огромному количеству информации по продуктам. Некотрое время назад, Амазон перестал принимать запросы без подписи, скрипт, который я написал, подписывает запрос в соответствии с текущими требованиями API. В качестве примера, я хочу показать, как получать информацию по книгам через API Амазона зная только ISBN номер.
Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Комментарии9

Как сделать из Яндекс.Диск'а безлимитную систему хранения файлов

Время на прочтение4 мин
Количество просмотров11K
Эта статья является заключительной в серии моих постов про Яндекс.Диск и загрузку файлов: обход каптчи, даунлоад части файла с RANGE запросом из удаленного источника и автоматический аплоад на Яндекс.Диск. Все эти посты объединяет одно желание, разобраться, как именно работает система защиты Яндекс.Диск'а и какие у нее недостатки. Я ни в коем случае не хочу сказать, что в Яндексе работают непрофессионалы, наоборот, изучая код, я пришел к обратному выводу. Единственная цель этой статьи, на примере Яндекс.Диск'a показать, как можно из бесплатного файлового хостинга сделать бесплатное хранилище под Ваш проект, просто идея. Ну и конечно, дать некоторую пищу для размышления разработчикам подобных сервисов.

Итак, представляю вашему вниманию пример использования файлового хостинга Яндекс.Диск несовсем по назначению.
Читать дальше →
Всего голосов 27: ↑20 и ↓7+13
Комментарии19

Автоматическая загрузка файлов на Яндекс.Диск

Время на прочтение4 мин
Количество просмотров25K
Предлагаю вашему вниманию PHP скрипт автоматической загрузки файлов на сервис Яндекс.Диск. Скрипт прост до безобразия, достаточно передать ему в качестве параметров логин, пароль и путь к файлу и в результате он загрузит ваш файл на сервис и выдаст вам ссылку на него. Не знаю, сколько еще меня вместе с моими постами будет терпеть Яндекс, но все-таки приведу исходный код скрипта :)
Читать дальше →
Всего голосов 100: ↑94 и ↓6+88
Комментарии125

Множественная загрузка файлов из архива с поддержкой RANGE запросов

Время на прочтение2 мин
Количество просмотров1.7K
Иногда бывает полезным не сохранять кучу файлов на каком-либо хостинге, а использовать только один архивный файл. Но возникает проблема доступа к конкретному файлу в архиве. Предлагаю вашему вниманию PHP скрипт, который позволяет загружать часть архивного файла как целый файл. Поддерживается дозагрузка через запросы RANGE. Архив, в данном случае, просто склейка из множества файлов. В настоящий момент скрипт протестирован с менеджером загрузок Flashget.
Читать дальше →
Всего голосов 6: ↑4 и ↓2+2
Комментарии4

Распределенная сеть файлового хранилища на Gmail.com

Время на прочтение4 мин
Количество просмотров742
Все давно уже знают о великолепной почте gmail.com и возможности хранить там более 7 гигабайт почты. Думаю, что также все знают о таких плагинах, как GMail Drive, который позволяет хранить в своем аккаунте файлы. Но, сейчас разговор не об этом, я хочу рассказать Вам о реально работающей системе, которая позволяет хранить неограниченное количество файлов на Gmail.com распределенно и с резервированием. Итак, задача, которую мне необходимо было решить еще три года назад, где хранить все увеличивающийся архив файлов, многие из которых я не буду использовать еще долгое время, так как к платным сервисам я отношусь скептически, то решено было сделать бесплатный. Выбор пал на gmail.com, который уже тогда предоставлял достаточно места для хранения почты.

Но, предстояло решить следующие задачи
  1. размер письма gmail.com три года назад составлял 10 мегабайт
  2. если загрузить на почту более 600 мегабайт за короткий период, почта блокируется
  3. если выгрузить из почты более 600 мегабайт за короткий период, почта тоже блокируется
Читать дальше →
Всего голосов 42: ↑36 и ↓6+30
Комментарии52

Как обойти каптчу в Яндекс.Диск

Время на прочтение2 мин
Количество просмотров2.4K
Итак, все мы знаем, что на яндексе можно хранить файлы до 5 гигабайт, но при загрузке он требует ввести каптчу или установить Яндекс.Бар. Так как Яндекс.Бар я не использую, то решил проверить, а собственно каким таким гениальным способом проверяет Яндекс этот самый пресловутый плагин?

Для этого эксперимента все-таки пришлось его установить на Firefox и используя плагин FireBug начать тестирование…
Читать дальше →
Всего голосов 48: ↑34 и ↓14+20
Комментарии23

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность