Я очень аккуратно фильтрую новостной шум в fb, но даже там заметна волна темы с законом Яровой. Сам закон оставлю в стороне, политика она и есть политика, там тройное дно, а вот за суммы денег скажу, я ж был как-никак тем самым замдирдепом, которому такую задачу пришлось бы решать своей головой.
Триллион ли стоит хранение данных на самом деле?
Давайте посчитаем.
Расчёт я делал быстренько в одном комментарии на fb пару недель назад, он не учитывает стоимости размещения оборудования в ЦОД, на это и прочие непредвиденности можно накинуть ещё 10-15% сверху, но не больше.
Спойлер:
никаких триллионов на такую задачу не надо, достаточно около 200 млрд рублей
Дано: требуется хранить звонки, смски, чаты и логи интернета и почты. Полгода.
Надо: посчитать, какие железяки нужны для этого и сколько они могут стоить.
Решение:
Определяем удельный объём хранения голоса. Час голоса жмется примерно до 10 Мб; 24 часа = 240; 365 * 0,24 Гб = 87,6 Гб на пользователя. Пусть он говорит 25% в год (это много), тогда 21,9 Гб в год. Хранить полгода, значит 11 Гб на человека.
Экспертно определяем вес текстовых записей. Все логи интернета и смсок/мессенджеров — текст, который весит сотни килобайт и не может производиться мегабайтами в сутки, это нереально набирать физически, если не иметь тысячи обезьян с пишущими машинками.
Для верности добавим полгода почтовой переписки. Конечно, мы на 140 миллионов человек включим дедупликацию (оставим только одно вложение, а его копии в других ящиках удалим и подменим ссылкой на оригинал). И тут (по опыту) добавится — ну ещё 100 Мбайт контента в год, реально будет 10-20. Ну не пишут люди много в почте, это всё обычно длиннющий чат в виде бороды RE:RE:RE:RE...
Ок, 20 Мб на почту, ещё 20 Мб на чатики и логи браузеров. Итого 40 Мб.
Вместе с голосом — те же 11 Гб (10240 Мб, там +40 Мб месенджеров незаметны).
Далее, инфраструктура. Условно, полгода хранения всей информации по одному гражданину для местного Palantir обойдётся в (барабанная дробь) $3, в т.ч.:
- $0,9 / Гб — стоимость хранения данных на дисках;
- $2 — инфраструктура (железо, софт, внедрение) и поддержка.
- эти $2 рассчитаны как "внедрили и пять лет амортизируем"
Сколько там активная база у ОПСоСов? 120 млн? Живых, наверное, половина.
Ну пусть даже пользователей интернет реально больше, ок.
90 млн.человек. 990 000 000 Гбайт хранения по $3.
ИТОГО:
В $2970 млн. или 185 млрд. рублей обойдётся создание инфраструктуры. Эти расходы надо поделить на всех операторов связи для записи деятельности жителей всей страны.
А она, эта инфраструктура, плюс-минус, на 70% построена уже сейчас — у всех операторов телекома есть ЦОДы, мега-ЦОДы, резервные ЦОДы. Они их даже в аренду сдают, т.к. те недозагружены голосовым трафиком и логами.
Так что врут они про триллионы.
Не верьте.