Pull to refresh

Бизнес-модель распределенных вычислений и p2p

Reading time 4 min
Views 1.1K
Некоторое время назад перечитывая вики-страницу об LHC я радостно обнаружил, что CERN открыл свой проект распределенных вычислений. Радостно — потому что работа коллайдера меня с давних пор очень воодушевляет, а возможность хоть как-то им помочь наполнила меня суровым оптимизмом. Не знаю почему, но в какой-то степени я наивно надеюсь, что результат работы проекта сделает нашу жизнь значительно лучше.

Когда-то мой бывший коллега рассказал мне о проекте SETI@home — и поэтому с общим механизмом процесса распределенных вычислений в целом я был знаком. В будущее проекта SETI мне как-то не особо верилось, поэтому подключаться к процессу я не стал. С LHC все, конечно, вышло иначе: BOINC мгновенно очутился на компьютере и аки пионерка смиренно приготовился принимать участие в разгадке строения вселенной. Но, к моему глубокому разочарованию, заданий на расчет не было и не предвиделось.

Чтобы энтузиазм не иссякал, я добавил пару проектов по борьбе с разными болезнями, свернул менеджер и стал читать всевозможные статьи про распределенные вычисления. Одновременно, в голове мелькала мысль о том, насколько же это похоже на p2p. И вот тут у меня появилась идея, которой я и хотел бы поделиться, вернее, узнать ваше профессиональное мнение о возможности/невозможности ее появления в жизни, а возможно, и о существовании реализаций и их успехах/провалах.

Заключается эта идея в следующей бизнес-модели: есть а) заказчик, которому нужно либо некое хранилище файлов с широким каналом раздачи, либо некие вычислительные мощности, либо и то и другое в совокупности б) толпа клиентов с их простаивающими домашними/рабочими/мобильными компьютерами, на которых установлен тихо работающий фоновый клиент в строго заданных рамках отнимаемых ресурсов в) посредник, который организует работу первого со вторыми. Заказчик платит некую денежку за услуги: 100% за некий объем услуг (хранения или расчетов), посредник берет из них 5% на еду, хлеб и организацию процесса, а остальные 95% раздает тем клиентам, которые непосредственно выполняют задачу: раздачу файлов и/или расчет.

Тут важно заметить, что хранилище файлов не подразумевает, скажем, хранение файла базы данных. Конечно, скорость реакции такой базы будет неприемлемой. Речь идет, скажем, о хранении легального софта онлайн-магазином (Steam, AppStore, OviStore). Или хранение бэкапов крупных сервисов. Или видео-хостинг. Т.е. в файло-хранилище важна высокая скорость раздачи (плюс надежность хранения), а не ping возврата данных.

Расчеты же могут пригодиться в самых разных областях (правда тут есть проблема конвертации данных в подходящий формат, но мне кажется в целом она решаема). Например, фильм Аватар рендерился на кластере, а вполне мог бы обработаться такой сетью и возможно это вышло бы значительно быстрее и дешевле.

Довольны, по идее, будут все: заказчик от цены вопроса, а посредник и клиенты от некого заработка. Плюс это огромный толчок для рынка, у которого появятся возможности использовать относительно недорогие, но крайне мощные ресурсы для вычислений и скоростные хранилища. Возможно завертится все не сразу, но потенциально — может вырасти в масштабную сеть: любой файл из интернета будет качаться очень быстро, но за свою копеечку от других пользователей, а такая система, теоретически, может себя уравновесить — сколько скачиваю, столько и раздаю, с какой скоростью скачиваю, с такой и раздаю, в противном случае либо зарабатываю, либо трачу.

Понимаю, что вопросов возникает море. Например, вопрос легальности хранимых файлов — но здесь можно применять те же схемы, что и при хранении на файловых хранилищах. Главное, важно сделать так, чтобы данные шифровались и нельзя было а) украсть чужие данные (использовать разбиение, сертификаты, ключи) б) заказчик или посредник всегда могли удалить или заблокировать файлы (скажем, через некие файлы ревизий, распространяемые вместе с кусками файлов).

Вопрос больших мощностей в плохих руках может компенсироваться степенью проверки в зависимости от требуемого. Если кто-то требует мощности, достаточные для рефакторинга ключей — он должен каким-то образом обосновать свой расчет (хотя бы идентифицироваться как компания с некими минимальными требованиями). В любом случае, в мире уже миллионы зомби-компьютеров, которые в руках хакеров наверняка уже выполняют подобные задачи и если б существовала подобная глобальная опасность — она бы уже «взорвалась». С распределенной сетью можно было бы обеспечить схожую мощность, но для полезных бизнес-задач.

Так же возникает вопрос: а стоит ли оно того — не проще ли построить дополнительный мощный дата-центр? Но он будет требовать: стоимость носителей, стоимость аренды, оплату труда сотрудников, стоимость электричества, стоимость канала. Плюс амортизация: физическое оборудование нужно периодически обновлять, пользователи же обновляют свои компьютеры сами и за это не нужно платить. Плюс надежность: дата-центр может сгореть, а распределенная сеть выживет. Масштабируемость: сегодня нужно 50% мощности дата-центра, завтра 100%, послезавтра 150%, а после-после завтра — снова 50%. Аренда, оплата труда и т.п. — все это статичные суммы, которые легко могут превратиться в убытки. Сеть из пользователей будет гораздо гибче реагировать на рынок по классической схеме спроса и предложения (мне мало заработка в 50р. в месяц — не буду участвовать и уйду, оставшиеся начнут получать 51р. в месяц, и наоборот).

Будет ли клиентам такое участие экономически интересно? Можно попробовать прикинуть: мой домашний компьютер может без проблем не мешая моей работе отдавать 10гб в день, значит это примерно 300гб в месяц. Одновременно, чтобы шустро скачать нужный мне файл размеров в 10гб я, в принципе, готов заплатить 50р. и, мне кажется, я не один такой (иначе не было бы «vip» доступов на файлообменниках). Т.е. в случае полной загруженности это около 1500р. (минус 5% посреднику) в месяц — за полгода-год окупится и канал, и новый винт. В случае, если сети не нужно будет 300гб в месяц — я отдам лишь, скажем, 10гб и заработаю 50р. — даже такая мизерная сумма будет приятно за, по большому счету, минимальные расходы канала и электричества, в то время как мой компьютер все равно включен и работает.

В то же время, что-то мне говорит, что если бы подобная бизнес-модель имела право на существование — она бы уже существовала. Что же мешает ей родиться?
Tags:
Hubs:
+7
Comments 12
Comments Comments 12

Articles