Информация

Дата основания
Местоположение
Россия
Сайт
www.openstat.ru
Численность
11–30 человек
Дата регистрации

Блог на Хабре

Обновить
Комментарии 47
Скажите, а как попасть к вам в рейтинг? Как паттерны своей CMS добавить?
Просто если у вас встречается такое:
JSmart CMS — 10, то очевидно десятки других CMS просто не определено.
Разумеется, еще примерно сто CMS не участвовали. Судя по рейтингу CMSmagazine, они большой роли не играют. Однако чтобы попасть к нам в рейтинг, можно к примеру, прислать сигнатуру на адрес travin@openstat.com
Судя по рейтингу CMSmagazine в вашей статистике есть погрешность. Особенно для SAAS платформ данные некоректны.
В любом случае например «Cabanova» с одной установкой будет играть меньшую роль чем присланная CMS с сотнями установок.
Оценка производительности CMS некорректна, т.к. скорее всего определяется мощностью хостинга, использованием всяческих кэшей и прочим.

Очевидно, что платные CMS будут скорее всего иметь хороший, быстрый хостинг.

Я могу ошибаться (сам не проверял), но много раз слышал про тормознутость Битрикса. Это вполне логично, учитывая сложность самой CMS. DLE, к примеру, намного проще — тем не менее, она выглядит как более медленная, что скорее всего будет ложью при тестах на одинаковом хостинге в одинаковой среде без специфичных для CMS сторонних «ускорителей».

То же самое, хоть и в меньшей степени, относится к «подозрительным сайтам». Дешевые\беплатные CMS для простых сайтов часто устанавливаются на серверы, которые могут быть заражены (даже через другой сайт) и соответственно данные CMS сами оказываются зараженными.
Оценка производительности CMS некорректна

Вообще-то мы работаем с производительностью сайтов, как со следами людей в виртуальном пространстве, проще говоря, с Big Data. Корректность тут заключается в том, что такова жизнь. А не в том, что удалось поставить эксперимент с минимумом возмущений.

т.к. скорее всего определяется мощностью хостинга

По поводу зависимости от хостера у нас есть отдельное исследование: «Сравнительный анализ клиентских баз хостинговых провайдеров» (презентация в формате PPT) или «Неделя производительности в Рунете» (текст с отдельными слайдами и пояснениями в формате HTML).

Я могу ошибаться (сам не проверял), но много раз слышал про тормознутость Битрикса. Это вполне логично, учитывая сложность самой CMS.


Битрикс сравнительно тормознутый, не исключено, что — как раз из-за того, что «пухлый». Однако он же предлагает и наибольшие возможности для того чтобы увеличить производительность отрисовки страниц — сервис ускорения сайта (CDN), а также технологию «Композитный сайт». Такие нюансы нами не отслеживались.
И вообще-то исследование производительности тут появилось на правах бонус-трека. Не хотелось бы особо углубляться.
Нужно просто поменять формулировку «производительность CMS» на «скорость загрузки сайтов» или что-то подобное.
Принимается.

Просто в счетчике Openstat этот отчет называется «Производительность».
По графику производительности. Если не брать в учет SaaS (A5,Setup) по причине изначального размещения на мощных серверах сервисов и CMS, с хранением/редактированием данных на Windows-админке (Melbis,SiteEdit) и редкий RBC, то по вашим данным коробочные «серверные» CMS можно разместить так:

  1. UMI
  2. PHPShop
  3. Shop-Sript
  4. MODx
  5. Drupal

Интересные данные…
Хочу заметить, что UMI скорей всего тоже SaaS.
Надо попросить автора рейтинга проверить «плотность залегания сайтов» на одном IP у UMI. Что попало в рейтинг, высокооборотный сервер или быстрая архитектура. Надо только фактами оперировать. Пока рейтинг молодой и независимый — факты будут на первом месте.
Простите, ничего не понял.
Более детальный анализ разброса IP по UMI, предоставленный автором в персональной переписке (за что ему большое спасибо), показал, что, все-таки, в данном отчете UMI представлена как коробка, а не SaaS. Не мало сайтов расположено на SpaceWeb, где есть специализированный тариф под нее.
Вот как мне видится сегмент Saas'ных CMS

* ucoz
* wix
* setup.ru
* A5
* jimbo
* umi
* nethouse
* fo.ru
* Google Sites
* Web Start Today
* Weebly
* Squarespace
* Plebu
* Cabanova
* Sellfy
* Etsy
* SnapPages
* Webnode

Но вообще их же тьма.
Да, если считать все, то более двухсот найдем там или иначе представленных на рынке рунета

из однозначно заметных в ecommerce пропущены:
tiu.ru(prom.ua)
ecwid
insales.ru

из конструкторов точно зря пропущены
okis.ru
123sait.ru — не берусь сказать про объемы, но маркетингово заметны
webstolica.ru от амиро, хотя бы за то что реально старичек
из западного — weebly.com, у них есть русская локализация, про объемы судить сложнее

еще, мне кажется, пусть и по причине некоторых обязаловок будет реально встречаться edusite.ru в цифрах отличных от нулевых.

и еще скромно напомню что uCoz надо считать как ucoz+narod
Благодарю!

Правда, InSales пропущен в моем комментарии, но мы его учитываем по авторизованной производителем сигнатуре.

Ucoz до начала лета вставлял всем своим клиентам счетчики Openstat, а когда снял, наш охват уменьшился (в сайтах) тыщ на тридцать…

Мне как аналитику можно конструировать алгоритм экспресс-исследования саасных движков:
для начала опросить DNS на предмет соответствия рунетовских доменов IP-адресам соответствующих служб: ucoz, wix и прочих, кого мы знаем/помним/нам напомнили.
Сама по себе саасная модель предоставления таких услуг даст достаточно высокую точность привязки доменов к конкретным веб-службам по их парковочным IP.
Исключение составят домены третьего уровня и глубже, о которых не знаем изначально, и домены, которые лишь указывают на веб-хостинг, но не являются сайтами как таковыми.
И чтобы решить эти исключения ретроспективно можно обратиться к данным по краулингу.

Но я такие письма программистам не пишу, потому что по поводу того же Ucoz они как раз и отвечают, что, дескать, и так нормально определяем его по 366 уникальным IP-адресам.
И по маске некоторых можем ловить…

ну если у одного сервиса стоит счетчик, а у другого нет, то это очень сильно искажает исследования. Так что, то что оказался снят — хорошо. Несколько сравняло ситуацию. Хотя и показало что большой объем теряется. Вероятно, в случае с доменами второго уровня, все то, что что припарковано не на нс-ы юкоза. Коих не так уж мало, с использованием днс серверов регистратора и прочих служб.

По поводу «итак хорошо определяют» я бы предложил проапгрейдить информацию. Те 366 уникальных ип которые были актуальны год назад явно могли смениться\расшириться.
Вот тут коллеги из iTrack похожий рейтинг уже годами публикуют track.ruward.ru/cms (на хабре довольно активно обсуждался — habrahabr.ru/company/ruward/blog/222947/) + сервис определения CMS: itrack.ru/whatcms. А по безопасности еще было такое исследование: www.ruward.ru/sitesecure/.
Насколько я понимаю, ruward начал публиковать исследования itrack под впечатлением моего выступления на IBC Russia 2013. Тогда тусовка, включая младшего Терехова, смогла ознакомиться со всем батальным полотном статистики Рунета. Были там и CMS, несмотря на то, что темой доклада была объявлена как «Рынок инернет-рекламы в Рунете в 2013». Более того там 28-м слайдом там было сравнение с другими исследователями.

Сравнение исследований Openstat и iTrack

В отличие от аналогичных исследований iTrack:
а) подавляющее большинство сигнатур не были получены нами от разработчиков CMS;
б) распространенность счетчика Openstat мы определяем точнее, а те завышают;
в) у нас полнее список сигнатур в любой нише;
г) у нас есть сразу три инструмента: краулер, счетчик и категоризатор тематик, что дает в сумме гораздо более интересный анализ и мета-анализ.
Андрей, привет. Ты не совсем верно понимаешь. Мы с коллегами из iTrack начали производство/проектирование проекта Ruward:Track осенью 2013 — этому есть много подтверждений. А уже потом увидели твой доклад на IBC =) Насчет точности методики и полноты базы сигнатур и «гораздо более интересного анализа» я не очень хочу спорить, пустое это. Вы молодцы, хорошую аналитику делаете.
Буду знать, хотя до Нового года ничего подобного от вас не видел.
Следующим постом (завтра, наверное) хочу дать разбивку лидеров CMS по отраслям.
Хотя возможно это и не потянет на отдельный пост на Хабре.
Ну если ты мне не веришь, вот скриншот слайда моей презентации, с которой я выступал на pre-party премии Рунета в зале РИА 21 ноября =)
image
А по какой методике учитывались блоги на Blogger/Blogspot?
Блоги в доменах третьего уровня в Рунете не подсчитывались. Учитывались лишь сайты в доменах второго уровня, где стоит этот движок, то есть методика для Blogger ничем не отличалась от учета WordPress.
А Вы спрашивали о блогах типа domen.blogspot.ru?
А Вы спрашивали о блогах типа domen.blogspot.ru?

Да, потому что большинство пользователей этого сервиса не подключает собственный домен.
В категории «Другие» (популярные ресурсы, снятые с DPI, куда ходят российские пользователи, и не находящиеся в остальных анализируемых доменах) тоже только домены второго уровня.
Исключение — Украина — потому что у них другая организация.
Интересно, с чем связано проседание в динамике изменения распространенности в ноябре 2013 года?
Кроме того что влез Setup.ru не вижу других причин, но и он не так много откусил.
А что за странное падение кол-ва установок CMS в ноябре 2013 года? Причем у всех? Раза в 2 примерно?
Лого 1С-Битрикс неправильное использовано. Вы взяли лого «западного» Битрикса, нужно отсюда брать — www.1c-bitrix.ru/about/presskit.php#tab-images-link
Может потому что дизайнер сидел в Амстердаме и ему Google подсунул логотип «западного» Битрикса? ;)
Самые популярные оказались самыми тормозными, как ни странно :)

А еще джумла и вордпресс — головная боль хостеров. Ибо создают сайтик, заливают на хостинг, и забывают про него, а эти две CMS, если их не обновлять, становятся мишенью для всевозможных спам-хак-ботов, после обнаружения очередной уязвимости…
Ну это связано.
Чем более популярен движок — тем он быстрее развивается. А поскольку он свободный то архитектура страдает.
Ну и разумеется под более популярные движки есть смысл писать боты.
Общая информация понятна. Но было бы интереснее все же получить отдельно статистику на Saas, Open Source и коммерческие CMS.
Вот так это выглядит для Байнета



Для Рунета можно сделать в следующем выпуске.
А uCoz зачем и в бесплатных и коммерческих одновременно?

А вообще, ключевая история, особенно во фри — игнорирование доменов третьего уровня. И уж кому кому, а опенстату по логике можно было бы исходить не из домена и зоны, а из посещаемости ресурсов. Но это сильно сложнее, конечно

Да, и глядя на приведенный график. DLE, конечно, коммерческая CMS формально, но ее очень любят варезники и это очень часто nulled установка. Подозреваю, по «отпечаткам» это можно попытаться понять.

Еще во всем отчете не хватает цифры на скольких процентах сайтов не удалось обнаружить cms (похоже цифра очень большая. насколько справедливая — вопрос). Ну и на скольких доменах не удалось обнаружить сайтов (паркинг, не делигирован, ошибка)
Позволю себе немного влезть. На последний вопросу в рунете вы можете увидеть ответ здесь track.ruward.ru/health. Вообще, моя практика показывает что CMS можно определить на 22-24% сайтов, а 35-40% сайтов дохлые (причем от сезона это сильно зависит).
ну если верить самой первой табличке, то определена для 28%. Остается вопрос про неживые.

Кстати, думаю, если откинуть домены которым менее года, можно получить иную картину заметно. Причем показательную.
Тут технология такая.

Краулер Openstat сначала обзванивал 6 136 378 доменов:
по российским зонам всегда свежие — по базе, ежемесячно получаемой из Руцентра.
по белорусской зоне — по базе, полученной от Hoster.by еще осенью, но которая по количеству «живых» доменов почти не отличается от версии за март 2014.
какая-то украинская база — тут мы действуем по остаточному признаку.
и наши сайты в других зонах, на которые ходят россияне (данные из провайдерских кругов).

В результате выделено 4,67 млн активных хостов, которые как-то ответили (обычно — ответили 200 Ok).
По ним делается исследование и считаются доли, а также указывается параметр «Не определена».
А почему не взять из «провайдерских кругов» данные по тому куда ходят, но домен не второго уровня? Это объективно дополнит картину.
И можно цифру сколькими за счет данные провайдеров сайтами (доменами) пополнился отчет? Ну или чисто понимать, это удовило число исследуемых сайтов или аля +5% дало.
Опять же, явно интересно наложить домены.ру и то куда в ней ходят. Сайты на которые ходят только их создатели — это как бы отдельный сгемент:)
а вот что куда ближе к отражении картинки — это посещаемые (опять же только провайдерские данные и «тулбарные» исследования могут дать корректные цифры) паблики в социальных сетях. По сути это самостоятельные сайты будут. И многие заубежные исследования их действительно считают за самостоятельные единицы. Как и условный сайт на базе твитера. Но это же честно позволит не игнорировать блог платформы: wordpress.com, blogger, tumble и пр. они реально вполне заметны именно как сайты в рунете в т.ч.
Целый рад компаний, но не только компаний, на сегодня ограничиваются тем что ведут страничку в соц. сети или на блог платформе и именно их указывают у себя на визитках и т.п.

Еще вопрос, региональные домены spb.ru, msk.ru и пр. а так же net.ru, com.ru, pp.ru — проигнорированы?
А почему не взять из «провайдерских кругов» данные по тому куда ходят, но домен не второго уровня?

Это просто проблема мощностей. Openstat всё же — совсем не Яндекс.
Мы индексируем Рунет по доменам второго уровня на глубину главных и вторых страниц. Больший охват пока считаем для себя слишком накладным.
Приведенный мне тут в комментариях itrack индексирует только главные страницы доменов второго уровня. Мы пошли дальше, так как, к примеру, карты на сайте размещаются обычно на втором уровне, а не не на «морде». Но пока только так.

И можно цифру сколькими за счет данные провайдеров сайтами (доменами) пополнился отчет?

Косвенно можно судить об их доле по графе «Другое», это именно тот список доменов, полученный методом DPI.

если откинуть домены которым менее года, можно получить иную картину заметно. Причем показательную.

Данные о возрасте доменов (отвечая на другую реплику) у нас есть, мы ее использовали для исследования счетчиков.
Еще вопрос, региональные домены spb.ru, msk.ru и пр. а так же net.ru, com.ru, pp.ru — проигнорированы?


Да, но не намеренно, сами хотим. Наш продюсер вел недавно переговоры о предоставлении доменной базы spb.ru, msk.ru, но пока они ничем практически не окончились.
[Я и сам живу в зоне msk.ru: мне было лениво фамильный домен второго уровня регистрировать].
С Ucoz, конечно, вышла опечтка.
А вообще продолжающее из год а в год лидерство Bitrix среди платных продуктов для управления сайтом не требовало дополнительных исследований. А вот некоторые другие коммерческие CMS — HostCMS, Netcat, UMI.CMS — оказались равно конкурентны. За исключением UMI.CMS, все перечисленные лидеры присутствуют на рынке не менее десяти лет.
у uCoz для платной нише есть uWeb.ru но дело новое и пока не очень успешное, так что доля будет не сильно заметно. Хотя корректно было бы разделить.
Вообще, платное можно и у вордпресс найти я про wordpress vip, правда, использование в рунете мне не известно, хотя не значит что его нет совсем уж
Интересно с чем связано лидерство uCoz в Украине и аутсайдерство в Белорусии (согласно таблицы распространенности)?
С тем что данные строятся на базе национальных зон.
В случае с Белоруссией .by, по правилам которой, если домен белорусский у компании, то хостинг обязательно так же должен быть в белорусии.
Что в каких зонах в т.ч. в бесплатных доменах третьего уровня делают пользователи в т.ч. для белоруссии подобная методология, к сожалению, отразить не может.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.