RapidwebMe 23 авг 2020 в 21:17

Почему CDN не нужны: развенчиваем старый миф

3 мин

13K

Высокая производительность*Веб-разработка*IT-инфраструктура*Сетевые технологии*Браузеры

Из песочницы

-10

Комментарии 55

kahi4 23 авг 2020 в 21:31

Во-первых, выбирая CDN, вы получаете дополнительную точку задержки, ведь теперь система усложняется за счет подключения еще одного узла, а это влечет новые траты ресурсов и задержки.

Во-первых, браузер к одному домену может делать только примерно 8 параллельных запросов, остальные будут в очереди. Если у вас много мелких картинок, которые не склеены в одну большую по той или иной причине, они могут забить канал (например, много превьюшек продуктов), то CDN может помочь освободить канал для загрузки других данных .

Ну и ещё многие CDN оптимизируют изображения на лету, в том числе могут автоматом генерировать превьюшки. Да, это делается простыми плагинами для nginx, но опять же, это отъедает ресурсы, которые можно потратить с большей пользой.

Ну и для международных компаний может быть польза в том, что контент физически хранится ближе к пользователю, от чего меньшие задержки.

Но риски и точки отказа CDN добавляет, этого не отнять. Как и необходимость его хоть минимальной настройки

P.s. о каком именно старом мифе идёт речь в заголовке?

+14

justmara 23 авг 2020 в 21:52

P.s. о каком именно старом мифе идёт речь в заголовке?

о том, что без кликбейта жизнь не мила

+31

pda0 23 авг 2020 в 22:07

Во-первых, браузер к одному домену может делать только примерно 8 параллельных запросов, остальные будут в очереди.

Это справедливо только для http/1.1. В http/2, которые уже ну практически везде, соединение ровно одно и запросы различных ресурсов сайта не требуют создания отдельных соединений.

tuxi 23 авг 2020 в 22:23

То есть если мы будем использовать хттп/2 и будем отдавать страницу с основного сервера, а 100500 мелких картинок к ней, с другого, скорость будет все равно такой же, как если бы мы отдавали и страницу и эти 100500 картинок с основного сервера? Какие-либо тесты этой версии проводились?

pda0 23 авг 2020 в 22:51

Да. Почему бы вам самому не посмотреть? По ссылке загружается одна и та же картинка, как мозаика составленная из кучи мелких блоков. В одном случае загрузка идёт через http/2, в другом через http/1.1. При обновлениях страницы начинает работать кэш браузера, но при первой загрузке разница очень заметна.
imagekit.io/demo/http2-vs-http1

tuxi 23 авг 2020 в 23:46

Стоп, я спрашивал про кейс "один сервер с хттп/2 vs два сервера с хттп/2"

pda0 24 авг 2020 в 13:53

В таком виде вопрос слегка бессмысленный, т.к. на результат повлияет находятся ли серверы в одной подсети, т.е. делят общий канал, или они географически разнесены и имеют разную скорость доступа, или дисковая подсистема станет узким местом.
Так что не понятно что именно вы хотите мерять. В http/1.1 бутылочное горлышко на стороне клиента. http/2 его устраняет. Может ли http/2 сервер в одиночку раздать статику и динамику как два отдельных сервера на статики и динамику? Дам, может*|**.
* Если узким местом не станет канал от сервера до клиента.
** Если узким местом не станет дисковая подсистема.

Существование балансировки нагрузки намекает, что при достаточно большой нагрузке любой сервер перестанет вытягивать.
Уж извините, что как кэп отвечаю, но какой вопрос, такой ответ.

tuxi 24 авг 2020 в 15:00

Я намекал на то, что запросы к 2 доменам ускорят загрузку/парсинг и отображение. На хттп1.1 обычно будет существенный выигрыш, на хттп/2 менее существенный, но он все равно должен быть. Для проверки, можно взять сервер в датацентре с хорошим каналом, и попробовать оба варианта (1 домен / 2 домена).
Вариант сервер/канал перегружен запросами/трафиком нет смысла рассматривать, мы же другую метрику измеряем.

pda0 24 авг 2020 в 17:12

Сомнительно, хотя для двух соединений разница может оказаться в пределах погрешности измерений. Для http соединения нужно установить tcp соединение, в современных условиях выполнить хэндшейк tls. После чего данные будут передаваться так же, как передавались бы в рамках одного соединения. В условиях достаточной ширины канала разницы быть не должно.
Я не мерял, но косвенно это подтверждается многочисленными профилями загрузки ресурсов через http/2, которые находятся в интернете, где видно, что начало загрузки статики для браузера выглядит одновременным.
Т.е. для одного соединения:
1. Скачиваем html.
2. Парсим.
3. Запрашиваем статику.
4. Качаем всю одновременно.

Для двух:
1. Скачиваем html.
2. Парсим.
3. Запрашиваем статику.
4. dns-запрос на ip второго сервера.
5. Установилось tcp со вторым сервером.
6. tls.
7. Качаем всю одновременно.

Теоретически на одном соединению вы можете даже попробовать обогнать два соединения. Пока браузер клиента парсит html и вычленяет оттуда url ресурсов, вы можете запушить часть из них по инициативе сервера.

VolCh 24 авг 2020 в 14:12

Если эти два сервера физически один (виртуальные хосты, ВМ, контейнеры и т. п.), то особой разницы не заметите, один быстрее, но на уровне погрешности — сутками не гонял

Alexufo 23 авг 2020 в 22:37

Если у вас много мелких картинок, которые не склеены в одну большую по той или иной причине, они могут забить канал (например, много превьюшек продуктов), то CDN может помочь освободить канал для загрузки других данных

http2? нативный @lazyloading? не решают эту проблему?

Ну и для международных компаний может быть польза в том, что контент физически хранится ближе к пользователю, от чего меньшие задерж

Единственный плюс, пинги из США от 300мс и выше на каждый ресурс.

nick_volynkin 24 авг 2020 в 06:10

А как HTTP2 помогает с картинками? Честно, не знаю, но очень интересно. Вот только на прошлой неделе занимался производительностью страниц и в том числе картинками.

VolCh 24 авг 2020 в 13:04

По памяти:
1) один хендшейк
2) мультиплексирование соединения, асинхронность ответов
3) сжатие заголовков

Alexufo 24 авг 2020 в 13:36

imagekit.io/demo/http2-vs-http1
blog.cloudflare.com/parallel-streaming-of-progressive-images
tobias.is/blogging/even-faster-images-using-http2-and-progressive-jpegs

faiwer 24 авг 2020 в 22:23

Извините, что вторгаюсь в вашу дискуссию. Но есть вопрос (праздное любопытство) — а кто-нибудь сравнивал HTTPS 2+ с HTTP 1+? Да, я имею ввиду https:// 2-й версии vs http:// 1-й. Т.е. для 1-й версии без TLS. Старый протокол не пожимает заголовки, сложности с количеством одновременных запросов… Это понятно. Но у TLS версии есть накладные расходы на шифрование. Что в итоге превалирует? Разница только в скорости "старта", а затем HTTPS 2 уже не проигрывает ни в чём?

P.S. я понимаю, что сравниваю "мягкое" и "тёплое"
P.S.S. я тоже за HTTPS everywhere, просто интересно

Alexufo 24 авг 2020 в 23:02

Конечно на http меньше расходов. Не нужно делать handshake. Шифрование вобще не нужно, от него лишние проблемы, но без него никак. Если бы люди не могли нарушать приватность как законы физики то без него было бы легче. Оно не воспринимается как варивант, это обязательность по умолчанию. Можете нагуглить критику http2, поэтому уже есть http3. На память есть такой параметр как package lost rate. Если у вас не стабильный интернет, то http2 проигрывает, так как вынужден часто перезапрашивать более крупные пакеты данных.

nick_volynkin 25 авг 2020 в 08:03

Кстати, есть плагин для FF под названием HTTPS everywhere, он запрещает загрузку ассетов по HTTP как раз для приватности. Может и для Хрома есть такой же.

nick_volynkin 25 авг 2020 в 08:00

Большое спасибо, пойду читать!

gavk 24 авг 2020 в 00:38

Что мешает сделать несколько поддоменов, чтобы одновременно было примерно 8*количество поддоменов соединений?

Zetway 24 авг 2020 в 10:10

Это уже не так с приходом http 2

AndyPike 24 авг 2020 в 18:59

В компании отказался от CDN, потому что никаких гарантий нет.
Всё перенёс на локальный сервер. Патамучто:

1) Если наш сервер работает, то и статика работает. Отдадут статику.

2) СDN падают постоянно. Было прекручено Sentry, я видел как они падают постоянно.

Вывод для себя сделал — всё хранить на своём сервере.

zinaimaz 26 авг 2020 в 16:07

Во-первых, браузер к одному домену может делать только примерно 8 параллельных запросов, остальные будут в очереди. Если у вас много мелких картинок, которые не склеены в одну большую по той или иной причине, они могут забить канал (например, много превьюшек продуктов), то CDN может помочь освободить канал для загрузки других данных .

Типично CDN — предоставляет конкретному пользователю один свой конкретный сервер, пусть даже в сети CDN серверов тысяча.

Ну будет у вас вместо 8 потоков этих потоков 16. Вы что же скажите, что разработчик криворукий не сможет эти потоки перенагрузить? Смог 8, и сможет 16.

Правильная оптимизация ваших HTML/CSS/JS даст лучший эффект.

Ну и ещё многие CDN оптимизируют изображения на лету, в том числе могут автоматом генерировать превьюшки. Да, это делается простыми плагинами для nginx, но опять же, это отъедает ресурсы, которые можно потратить с большей пользой.

Это вообще для кого? Для совсем неграмотных? Для совсем ленивых?
Сжатие/превьюшки реализуется в современных веб-системах с полпинка.
Где-то нужно всего то галку включить, где то десяток строк кода написать. И — вуаля — после первого получения пользователем картинки она уже сжата и в дальнейшем отдается из подготовленной превьюшки/из предварительно сжатых закэшированных, не отнимая ресурсов.

Причем, что важно, что эти превьюшки и закэшированные сжатые картинки вы контролируйте сами. Обновилась картинка оригинала — и обновление кэша/превьюшки будет мгновенным.

Ну и для международных компаний может быть польза в том, что контент физически хранится ближе к пользователю, от чего меньшие задержки.

А какой смысл быстро отдавать картинки, если сам ваш сайт при этом тормозит у удаленного пользователя.

То о чем вы пишете имеет смысл только для тяжелого контента.
Если вы специализируетесь на видеохостинге — тогда да, безусловно, CDN нужен.

VolCh 26 авг 2020 в 16:47

А какой смысл быстро отдавать картинки, если сам ваш сайт при этом тормозит у удаленного пользователя.

Тормоза складываются, разница между 900 мс (300 мс пинг для html + 300 мс сервер думает для html + 300 мс пинг для статики) и 602 мс (пинга для статики 2мс) заметна пользователю и влияет на конверсию

zinaimaz 26 авг 2020 в 19:17

600 или 900 — одинаково дофига.
Имхо приемлимые пинги должны быть менее 200.

pda0 23 авг 2020 в 22:14

CDN сейчас в основном используют как защиту от DDoS. ip оригинального сервера неизвестен, а положить инфраструктуру того же CloudFlare не так-то просто.

НЛО прилетело и опубликовало эту надпись здесь

artemerschow 24 авг 2020 в 10:57

Вероятно, это проблема моего провайдера или магистрального (было важно быстро решить проблему, а не выяснять кто виноват), но последний месяц у этот самый CloudFlare был недоступен очень часто и очень надолго.

artemerschow 25 авг 2020 в 09:49

Выяснил, блин. IP, который сейчас, например, выдан cdnjs.cloudflare.com тупо находится в реестре РКН. И всё. Снова вот, второй день подряд, из под местного провайдера не работает CloudFlare и ничего ты поделать с этим не можешь (глобально).

Аналогично, forms.gle уже пару месяцев не работает. При этом, хоть из под мобильного мегафона всё работает и выдаётся другой ip, они оба заблокированы по одним и тем же 3 разным решениям 3 разных судов.

Реестр РКН

Суд 1

<///>

Суд 2

Суд 3

<///>

Прошу прощения за оффтоп, просто накипело.

edogs 23 авг 2020 в 22:48

CDN для любого сайта хорош в плане закинуть туда статику, т.к. канал она забивает, ресурсы тоже чутка отнимает. Есть, конечно, альтернативный вариант — выкинуть статику на отдельный сервак, но CDN получается проще, масштабируемее и надежнее, хотя и может оказаться дороже.

Сам сайт можно спрятать за cdn, и ддос не так зацепит и уязвимости сложнее будет эксплуатировать. Надо только не пропалить родной ИП отправляя почту и так далее. А мощный ддос напрямую на сервак размещенный в ДЦ ни одному ДЦ не понравится, или отключат или заставят заплатить или вообще попросят на выход.

С расстояниями интересно. Несмотря на 2020. В каком-нибудь кукуйске до москвы трасса может идти через австралию. Поэтому cdn находящийся в сша может быть быстрее.

Йотуб упоминающийся в статья по большому счету является подвидом cdn. Как и всякие другие сторонние ресурсы для размещения информации.

При грамотной настройке — даже если упадет основной сайт, CDN может помочь сделать это менее заметным. И перекинуть на новую локацию проще (не ждать пока днс обновятся). И закэшированную статику показывать может пока всё не восстановится. Отказоустойчивость в определённом смысле лучше будет.

Поэтому на самом деле на определённом этапе развития сайта cdn фактически обязательный этап. Просто надо понимать, что это тоже инструмент с которым тоже надо работать, а не так что зашел в интерфейс — две кнопки нажал и вуаля.

lubezniy 23 авг 2020 в 23:48

Мне как-то пришлось выносить «статику» (дистрибутивы ПО объёмом в среднем 50-100 метров) аж на два внешних сервака. Просто потому, что показатель кол-ва скачиваний этой статики сильно зависел от сезона, и количество одновременных подключений к сайту могло вырасти в отдельные моменты в два десятка раз по сравнению с обычной нормой, чего не самый слабый сервер сайта вытянуть уже не мог, а поставленный в помощь дополнительный простенький сервер скачивания в датацентре через какое-то время отключили из-за превышения разрешённой полосы пропускания (colocation с shared-каналом). Возможно, здесь CDN был бы полезен, но нам хотелось самим контролировать актуальность версий файлов (программы в сезон могли часто обновляться).

Nashev 24 авг 2020 в 08:17

Версию в имя файла — и даже через CDN весь контроль у вас в руках

lubezniy 24 авг 2020 в 09:13

Возможно. Но тогда у нас этого не было, а сейчас я уже там этим не занимаюсь. :) Вообще же коллеги до того, как к этому пришли, пробовали несколько вариантов файлового хостинга (в т. ч. платных вроде Dropbox, у которого, как я понимаю, есть своя CDN), но результат был не лучшим: или блочили, или резали скорость. Так или иначе, результат у нас получился недорогим, что было главным.

nick_volynkin 25 авг 2020 в 09:17

+1, версию в имя или в параметр после имени вроде https://example.com/css/main.css?asdfasdf. Лучше не версию, а хеш-сумму файла и автоматически. И тогда можно выставлять бесконечный TTL кеширования. Подробности гуглятся по слову "cachebusting"

VolCh 23 авг 2020 в 23:04

CDN как таковой, без допцслуг типа антидос и т. п. может иметь мало смысла только если клиенты рядо, по меркам сети, с сервером. Если узлы CDN ближе чем сервер, то он ускорит загрузку статики для клиентов. В последний, когда оценивал летом, ускорение на порядок было на https 1.1 за счёт пинга 1-2 мс к ноде CDN, на площадке, куда мой провайдер подключён, против 29-31 мс к ДЦ амазона и гугла во Франкфурте. Ну и скорость загрузки в мегабитах повыше — CDN мог упереться в 400 мбит/с вайфая, а Франкфурт нет

keydon2 23 авг 2020 в 23:22

Статья видимо маркетинговая, причем со странным обратном пиаром, потому что вот тут rapidweb.me/ru/services/acceleration компания автора пишет ровно обратное.
В статье путают сетевую связность и географическое расстояние (не мудрено, тк маркетологи CDN часто тоже подменяют эти понятия). Обычное дело когда пинги от пользователя в городе А до сервера в городе А больше чем пинги до сервера в городе Б. Хороший CDN следит за хорошей сетевой связностью своих серверов и взаимодействует с провайдерами (нередко ставит сервера в их инфраструктуре), чтобы исправить проблемы.
Теоритически вы тоже можете с ними договориться, на практике только при очень большом трафике (у CDN он есть, тк клиентов у него много).
Достаточно посмотреть на долю статики в современных сайтах и станет понятно, что CDN нужен для практически любого популярного сайта. Сайту школы с полтора пользователями в день он конечно не нужен.

Практически весь смысл коммерческих CDN исходит из двух пунктов:

Специализация на доставке
Коллективное использование

Вы конечно можете взять вашу географию пользователей, запросить сотни виртуалок в разных ДЦ, промерить метрики до ваших клиентов, выбрать оптимальные (конечно придется посчитать), разместить там оптимальное оборудование с оптимальным софтом, через неделю повторить. В лучшем случае у вас будет несколько отделов которые будут заниматься только тем что вы делаете свой CDN и при этом все равно ваш CDN (при наличии высококлассных специалистов съевших собаку в этом деле) будет менее эффективен, тк ваши расходы делятся только на вас, а не на всех клиентов CDN. И конечно каждое решение вам придется разрабатывать заново (а не получить бесплатно для клиента Б потому что это уже делалось для клиента А).
Вопреки расхожему мнению традиционный CDN от DDoS'а не защищает. Но большинство крупных CDN предоставляют защиту как доп.плюшку.
Выбрать CDN вы можете и сами (без rapidweb.me), большинство предоставляют тестовый период, выберите несколько CDN из вашего региона (часто на сайтах CDN особенно подчеркивается география), соберите метрики, прикиньте кто лучше и насколько оно вам вообще нужно.

Loggus66 23 авг 2020 в 23:48

Ещё один момент, связанный с защитой личных данных от корпораций. Расширения ublock/noscript с настройками по умолчанию допускают загрузку шрифтов с CDN, что означает, что Google получает информацию, что энный IP в такой-то момент времени посетил сайт, содержащийся в атрибуте referer при загрузке шрифта или js-библиотеки.

nick_volynkin 24 авг 2020 в 06:15

А почему именно Google? Что CDN эту информацию получает, это понятно.
Ну и, кстати, эти же блокировщики допускают загрузку с CDN'ов популярных библиотек вроде jQuery.

Loggus66 24 авг 2020 в 11:05

Неточность формулировки, следует читать «владелец CDN», который для шрифтов/css зачастую Google, даже если это не google-домен, например, bootstrapcdn.

nick_volynkin 25 авг 2020 в 08:04

Ага, спасибо, это полезное уточнение. Не задумывался как-то, что bootstrapcdn принадлежит Google.

Loggus66 25 авг 2020 в 10:23

На самом деле, это не 100% точно, но невелика разница: по whois домен зарегистрирован на DNStination Inc, компанию, связанную с MarkMonitor, услугами которой пользуются гиганты вроде Google и Facebook для скрытия владельца домена. Ссылка раз, ссылка два.

Valsha 24 авг 2020 в 00:21

За «старый миф» не в курсе, что за такой.
Но CDN и не помешает. Да, всех проблем не решит, но без него может быть и ещё хуже.
Плюсы CDN наверно все же преобладают перед возможными минусами.

-2

nick_volynkin 24 авг 2020 в 06:18

При всем этом за услуги сети доставки контента нужно платить. А плата чаще всего зависит от объема передаваемого трафика.

За трафик в любом случае придётся платить. А трафик с CDN'а может быть сильно дешевле, чем трафик с обычного хостера, на котором у вас сайт.

OleksiyT 24 авг 2020 в 11:21

Уже лет 10 хостеры не берут денег за трафик.

Вкупе с тем, что автор не был даже в курсе о существовании http/2, то обсуждать его опус даже странно.

edogs 24 авг 2020 в 16:46

Уже лет 10 хостеры не берут денег за трафик.

Если Вы потребляете мало или если купили гарантированную ширину канала или если порт у Вас на серваке небольшой. В противном случае очень даже возьмут.
Что бы в этом убедиться — достаточно сравнить тарифы на «анлим шаред» и на «гарантированную полосу» в одном и том же ДЦ, даже сноски («при превышении оплата блабла») искать не надо.

Nickmob 24 авг 2020 в 08:50

Читаю и не покидает ощущение, что я где-то всё уже видел. И действительно, это грубый рерайт нашей старой статьи про CDN: www.methodlab.ru/articles/cdn_uskorenie_saita#cont.
Некрасиво воровать контент.

nick_volynkin 25 авг 2020 в 08:09

Действительно, очень похоже. Структура повествования та же, совпадают характерные фразы вроде "Географическая распределённость обычно ограничивается одним федеральным округом в России" → "А география передачи данных часто ограничивается одним федеральным округом".

Пойду сохраню полезные ссылки из комментариев, пока статью не удалили за плагиат.

Lenalot 24 авг 2020 в 10:23

Ну, я бы не сказала, что ререрайт. Просто затронута одна и теже проблема/тема поэтому кажутся похожими.

-1

vikarti 24 авг 2020 в 10:37

Миф?
— защита от DDoS (и хабраэффекта) (собственно отличия что во втором случае пользователю надо бы что-то все же показать) который может внезапно случится.
— CDN запросто может быть дешевле на старте и подключить ее — проще (хотя бы потому что не надо вешать на это фронтэнд разработчика, еще и со знанием конкретной CMS на которой сайт). Хотя да — в долгосрочной перспективе — наверно дешевле оптимизировать.

mixsture 24 авг 2020 в 10:41

К минусам CDN стоит отнести еще и то, что это потенциальная точка перехвата данных, т.к. некоторые из них терминируют tls сессию у себя (напр, cloudflare).

mayorovp 24 авг 2020 в 12:59

Не некоторые, а все. Без этого CDN не может выполнять свои задачи.

Murimonai 24 авг 2020 в 10:46

Какие проблемы CDN не решают
<...>
неоптимизированные изображения;
тяжелый и лишний код;
неправильное подключение JS и CSS;
ошибки в настройке базы данных;
недостаточная мощность сервера.

Эм, все кроме БД здесь — и есть прямая задача CDN. Тяжелый код, картинки, скрипты с разметкой — все это кэшируется на любой срок. По сути микросайты-визитки и тому подобные можно почти целиком загрузить на edge сервера, многократно ускоряя загрузку данных и распределяя нагрузку географически. Вплоть до того, что в нагрузку со всякой скрипто-статикой можно целые артефакты на netstorage закидывать и отдавать с них по запросу. Если деньги позволяют, конечно.
Осталось впечатление, что автор так и не понял, о чем писал.