Pull to refresh

Только 4.13% Web соответствует стандартам

Reading time3 min
Views876
Original author: Ryan Paul
Компания-разработчик браузера Opera опубликовала первые результаты исследования, нацеленного на изучение структуры содержимого сети. Для его проведения в компании создали приложение под названием MAMA (Metadata Analysis and Mining Application): работая в качестве паука, оно индексирует разметку и некоторые другие данные с более чем 3.5 миллионов страниц.

Статистический анализ собранных MAMA данных позволил инженерам Opera сделать выводы о наметившихся тенденциях в области Web-разработки и о том, как применяются Web-технологии, основанные на стандартах, в сети. Opera планирует вывести свой проект на более высокий уровень, разработав поисковую систему на основе уже проиндексированных данных. Таким образом, Web-дизайнеры, разработчики браузеров и Web-инженеры смогут легко получать информацию о реальном применении Web-технологий в интернете.

Предварительные данные, опубликованные компанией, предоставляют интересную информацию об использовании конкретных HTML-элементов. Среди проанализированных MAMA страниц, самыми популярными элементами являются head, title, html, body, a, meta, img и table. Реже всего применяют такие элементы, как var, del и bdo.



В компании также изучили распространённость Rich Web Apllications, которые, в основном, связаны с использованием технологии AJAX. Исследование показало, что Adobe Flash используется приблизительно на 35% от всех проанализированных сайтов. Больше всего он распространён в Китае (67% сайтов), меньше всего — в Дании (25% сайтов). XMLHttpRequest, который является основной AJAX, используется на 3.2% всех сайтов. Своеобразный рекорд здесь поставила Норвегия, где использование данного механизма было обнаружено на 10% сайтов.

Исследование также показало, что CSS применяется достаточно широко: почти на 80% ресурсов он был обнаружен в том или ином виде. Самые популярные свойства CSS связаны с цветом и шрифтами. JavaScript также не отстаёт от CSS и находит применение на 75% Web-ресурсов.

Соответствие стандартам?


Opera, помимо всего прочего, решила проверить проиндексированные страницы с помощью утилит валидации от W3C, чтобы определить какое их число соответствует стандартам. Valid XHTML 1.0! Результаты показали, что лишь 4.13% всех страниц являются валидными. Ещё один поразительный вывод заключеются в невалидности около 50% страниц, на которых содержится значок соответствия от W3C. Теоретически, изначально разметка таких страниц соответствовала стандартам, однако позже она потеряла это свойство (например, в результате добавления нового содержимого на страницу).

Инженеры компании попытались выяснить, есть ли какая-нибудь связь между средством разработки и валидностью страниц. Для этого были проанализированы мета-теги страницы. Выяснилось, что созданные с помощью Apple iWeb страницы валидны в 81% случаев. Для сравнения, только 3.4 процента страниц, созданных в Adobe Dreamweaver, соответствуют стандартам.

Результаты проведённых исследований очень интересны, однако потенциал всей системы раскрыт ещё не до конца. Попытка Opera в разработке поисковой системы на основе полученных MAMA данных открывает ещё более удивительные возможности для анализа, которые другие проекты смогут использовать в собственных исследованиях и разработках.

«Интернет фрагментирован, сложен и склонен к постоянному росту. MAMA предоставляет нам информацию об интенсивности применения тех или иных Web-технологий.» — рассказывает вице-президент Opera, Snorre M. Grimsby. «Мы можем использовать эту информацию для тестирования и обеспечения высокой совместимости, надёжности и производительности наших продуктов. Мы хотим поделиться этой технологией с нашими коллегами, чтобы они тоже смогли получить от неё пользу.»
Tags:
Hubs:
+34
Comments88

Articles

Change theme settings