12 October 2009

Какие бывают META теги и зачем они нужны

Website development

META-теги


В продолжении первого поста про DOCTYPE, я, как и обещал, продолжу про META теги.
META-теги — это необязательные атрибуты, размещенные в заголовке страницы, которые могут содержать ее описание, ключевые слова к ней, информацию об авторе, управляющие команды для броузера и поисковых роботов, и прочую служебную информацию, не предназначенную для посетителей.

META-теги имеют два возможных атрибута


— <META HTTP-EQUIV="имя" CONTENT="содержимое">
— <META NAME="имя" CONTENT="содержимое">
META-теги должны находиться в заголовке HTML-документа между <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы).

Стандартом HTML 4.01 значения и имена мета-тегов НЕ оговариваются, поэтому мы будем рассматривать те значения, которые уже устоялись в интернете и используются чаще других.

Пруфлинк: http://www.w3.org/TR/html401/struct/global.html#h-7.4.4.1
(The META element can be used to identify properties of a document (e.g., author, expiration date, a list of key words, etc.) and assign values to those properties. This specification does not define a normative set of properties.)



Атрибут HTTP-EQUIV


META-теги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Теги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки.
Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тегов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов.

Значения поля content для Аттрибута HTTP-EQUIV


Значение Описание Пример использования Эффект
Expires Дата устаревания. Управление кэшированием в HTTP/1.0. Если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять — изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Дата должна быть задана в формате, описываемом в RFC850,
<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 2008 08:21:57 GMT">
что эквивалентно HTTP-заголовку
Expires: Wed, 26 Feb 2008 08:21:57 GMT
Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его.
Pragma Эта директива показывает, что кешированная информация не должна использоваться и вместо этого запросы должны посылаться на сервер. Это директива имеет тоже самое значение что и CACHE-CONTROL:NO-CACHE и представлена для обратной совместимости с HTTP/1.0.

Клиенты должны использовать оба значения PRAGMA:NO-CACHE и CACHE-CONTROL:NO-CACHE когда нужно послать некешируемый запрос к серверу, про который неизвестно – совместим ли он с HTTP/1.1.
Если известно, что сервер совместим с
HTTP/1.1 клиент НЕ должен посылать PRAGMA заголовок.
HTTP/1.1 кэш должен понимать "PRAGMA:NO-CACHE" точно также, как будто клиент послал "CACHE-CONTROL:NO-CACHE".
<META HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE">
Content-Type Указание типа документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тега, то некоторые браузеры выводят такую страницу уже в заданном charset. <META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-2022-JP"> Используют браузеры и поисковые системы
Content-language Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка. <META HTTP-EQUIV="Content-language" CONTENT="en-GB">
что эквивалентно HTTP-заголовку
Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания
Для русского языка – ru-RU
Используется некоторыми поисковиками
Refresh Определение задержки в секундах, после которой броузер автоматически обновляет документ. Дополнительная возможность — автоматическая загрузка другого документа. <META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html">
что эквивалентно HTTP-заголовку
Refresh: 3; URL=http://www.name.com/page.html
W3C не рекомендует использовать этот тег.
Google страницы с таким тегом игнорирует. Другие поисковые системы, возможно, тоже.
Cache-Control Определяет действия кэша по отношению к данному документу. Возможные значения:
Public — документ кэшируется в доступных для всех кэшах
Private — только в частном кэше
no-cache — не может быть кэширован
no-store — может быть кэширован, но не сохраняется
<META http-equiv="Cache-Control" content="public"> Используется некоторыми браузерами



Атрибут NAME



Robots
Тег <meta name="Robots" content="..."> управляет индексацией конкретной web-страницы. При этом роботам можно запретить не только индексацию самого документа, но и проход по имеющимся в нем ссылкам.
Инструкции по индексации записываются в поле content. Возможны следующие инструкции:
NOINDEX — запрещает индексирование документа;
NOFOLLOW — запрещает проход по ссылкам, имеющимся в документе;
INDEX — разрешает индексирование документа;
FOLLOW — разрешает проход по ссылкам.
ALL — равносильно INDEX, FOLLOW
NONE — равносильно NOINDEX, NOFOLLOW
Значение по умолчанию: <meta name="Robots" content="INDEX, FOLLOW">.
В следующем примере робот может индексировать документ, но не должен выделять из него ссылки для поиска дальнейших документов:
<META name="ROBOTS" content="index, nofollow">
Имя тега, названия и значения полей нечувствительны к регистру.
В поле content дублирование инструкций, наличие противоречивых инструкций и т.п. не допускается; в частности, значение поле content не может иметь вид "none, nofollow".
Google поддерживает дополнительное значение NOARCHIVE, которое запрещает помещать страницу в архив google
<META NAME="Robots" CONTENT="NOINDEX,FOLLOW"> Используется большинством поисковиков
Description Значение атрибута CONTENT — строка, которая определяет текстовое описание (краткую аннотацию) конкретной страницы Вашего сайта. Не стоит создавать слишком длинное и подробное описание Вашего сайта в данном теге, рекомендуется ограничиться текстом до 100 символов, поскольку поисковые машины, в большинстве случаев, имеют ограничение на количество индексируемых символов. Этот тег может сильно помочь в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. <META NAME="description" CONTENT="Данный сайт содержит информацию для любителей старинных автомобилей, на нем Вы можете найти описание с фотографиями редких и эксклюзивных автомобилей"> Самый широко используемый тег. Практически все поисковые системы учитывают его при индексации.
Значение этого тега очень важно для раскрутки сайта, практически все поисковые системы опираются на этот
тег, а некоторые выводят содержимое этого тега в результатах поиска (Google), поэтому желательно не просто указывать краткое описание документа, но сделать его содержание привлекательным рекламным сообщением.
Keywords Значение атрибута CONTENT — список ключевых слов, как правило, через запятую, соответствующих содержимому Вашего сайта. Это те слова, в запрос на которые, Вы хотели бы, появления Вашего сайиа в списке результатов поиска. Здесь также рекомендуется ограничиться списком до 30 слов. Можно поместить и наиболее частые опечатки ключевых слов. Также Вы можете здесь записать и английские слова, соответствующие содержимому Вашего сайта. Ну, а какие конкретно нужно писать слова — это уже тема отдельной статьи. Некоторые поисковые системы не индексируют сайты, в которых в данном теге повторяется одно и то же слово для увеличения позиции в списке результатов. <META NAME="keywords" CONTENT="реклама, дизайн, полиграфия"> Учитывается большинством поисковых систем. Точно известно, что НЕ учитывает Google и Rambler
document-state Управление индексацией страницы для поисковых роботов. Определяет частоту индексации — или один раз индексировать (значение Static), или реиндексировать документ регулярно (значение Dynamic). <META NAME="Document-state" CONTENT="Static"> Используется редко
GOOGLEBOT Google поддерживает специальный тег Googlebot с помощью которого вы можете указать Google что он не должен индексировать и архивировать вашу страницу, другие поисковые системы этот тег проигнорируют. <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
Author Автор, создатель сайта. Вряд ли используется поисковыми системами, и нужен скорее всего чтобы можно было показать что сайт сделан именно определенной персоной или фирмой. <META NAME="AUTHOR" CONTENT="www.neo-systems.ru">
Revisit Значение этого тега указывает — как часто обновляется информация на вашем сайте, и как часто поисковая система должна на него заходить чтобы увидеть обновления. В силу сложившихся условий — поисковые системы сейчас самостоятельно определяют частоту сканирования сайта, поэтому, возможно, наличие этого тега ничего вам не даст. <meta name="revisit-after" content="15 days">



Источники информации:


http://www.citforum.ru/internet/search/metatags.shtml
http://web-support.ru/adv/ps_meta_2.shtml
http://www.shtogrin.com/library/web/meta/
http://vancouver-webpages.com/META/metatags.detail.html
http://www.mattcutts.com/blog/keywords-meta-tag-in-web-search/
http://www.webotdel.ru/notes/metatags/
Очень хорошо и понятно написано http://www.w3schools.com/tags/tag_meta.asp
Какие мета-теги понимает Google http://www.google.com/support/webmasters/bin/answer.py?answer=79812
Какие мета-теги понимает Bing
http://www.bing.com/community/blogs/webmaster/archive/2009/07/18/head-s-up-on-lt-head-gt-tag-optimization-sem-101.aspx
Google не использует мета-тег keywords
http://googlewebmastercentral.blogspot.com/2009/09/google-does-not-use-keywords-meta-tag.html
Tags:metakeywordshttp-заголовкимета-теги
Hubs: Website development
+60
217.2k 376
Comments 47