Legislation in IT
8 July 2016

Сколько стоит «закон Яровой» на самом деле?

Я очень аккуратно фильтрую новостной шум в fb, но даже там заметна волна темы с законом Яровой. Сам закон оставлю в стороне, политика она и есть политика, там тройное дно, а вот за суммы денег скажу, я ж был как-никак тем самым замдирдепом, которому такую задачу пришлось бы решать своей головой.


Триллион ли стоит хранение данных на самом деле?


Давайте посчитаем.


Расчёт я делал быстренько в одном комментарии на fb пару недель назад, он не учитывает стоимости размещения оборудования в ЦОД, на это и прочие непредвиденности можно накинуть ещё 10-15% сверху, но не больше.


Спойлер:

никаких триллионов на такую задачу не надо, достаточно около 200 млрд рублей


Дано: требуется хранить звонки, смски, чаты и логи интернета и почты. Полгода.


Надо: посчитать, какие железяки нужны для этого и сколько они могут стоить.


Решение:


Определяем удельный объём хранения голоса. Час голоса жмется примерно до 10 Мб; 24 часа = 240; 365 * 0,24 Гб = 87,6 Гб на пользователя. Пусть он говорит 25% в год (это много), тогда 21,9 Гб в год. Хранить полгода, значит 11 Гб на человека.


Экспертно определяем вес текстовых записей. Все логи интернета и смсок/мессенджеров — текст, который весит сотни килобайт и не может производиться мегабайтами в сутки, это нереально набирать физически, если не иметь тысячи обезьян с пишущими машинками.


Для верности добавим полгода почтовой переписки. Конечно, мы на 140 миллионов человек включим дедупликацию (оставим только одно вложение, а его копии в других ящиках удалим и подменим ссылкой на оригинал). И тут (по опыту) добавится — ну ещё 100 Мбайт контента в год, реально будет 10-20. Ну не пишут люди много в почте, это всё обычно длиннющий чат в виде бороды RE:RE:RE:RE...


Ок, 20 Мб на почту, ещё 20 Мб на чатики и логи браузеров. Итого 40 Мб.


Вместе с голосом — те же 11 Гб (10240 Мб, там +40 Мб месенджеров незаметны).


Далее, инфраструктура. Условно, полгода хранения всей информации по одному гражданину для местного Palantir обойдётся в (барабанная дробь) $3, в т.ч.:


  • $0,9 / Гб — стоимость хранения данных на дисках;
  • $2 — инфраструктура (железо, софт, внедрение) и поддержка.
  • эти $2 рассчитаны как "внедрили и пять лет амортизируем"

Сколько там активная база у ОПСоСов? 120 млн? Живых, наверное, половина.
Ну пусть даже пользователей интернет реально больше, ок.
90 млн.человек. 990 000 000 Гбайт хранения по $3.


ИТОГО:
В $2970 млн. или 185 млрд. рублей обойдётся создание инфраструктуры. Эти расходы надо поделить на всех операторов связи для записи деятельности жителей всей страны.


А она, эта инфраструктура, плюс-минус, на 70% построена уже сейчас — у всех операторов телекома есть ЦОДы, мега-ЦОДы, резервные ЦОДы. Они их даже в аренду сдают, т.к. те недозагружены голосовым трафиком и логами.


Так что врут они про триллионы.


Не верьте.


-44
13.2k 6
Comments 247