Открыть список
Как стать автором
Обновить

Комментарии 48

А с Google все ок или тоже не индексирует?
С гуглом и бингом всё прекрасно.
Так а по http изображения доступны? В индексе есть?
Нет.
Нет.
Сайт полностью под https.
С http на https есть редирект? С каким кодом?
Да. 301, естественно.
А в чем собственно разница для Яндекса?
Может быть их картиночный бот просто не умеет https?
Так ведь 2014 год на дворе. HTTPS в тренде. На марс люди летают.
Пытаюсь найти оправдание, не спроста же…
Но не могу.
Привет! А подскажите, пожалуйста, а как давно у вас выкатился сайт?
2 месяца назад.
Но дело не в этом. Был официальный ответ яндекса на этот вопрос. Т.е. это не мое предположение, это факт. Принципиальный. Печальный. Непонятный.
А что за ответ, причину назвали?
Электричество на дешифровке больших картинок экономят? :)
Да, действительно, картинки, которые доступны только по https, не индексируются. Мы планируем это исправить в будущем, но нужно понимать, что пока таких сайтов очень мало, поэтому у этой задачи не самый высокий приоритет в наших планах. Важно отметить, что картинки со страниц, доступных только по https, индексируются, если сами картинки при этом открыты и по http. И сами сайты, доступные только по https, тоже индексируются.
А что если открыть картинки для http, скормить их роботу под соусом sitemap-image, но при этом ссылки не менять на страницах, оставить везде img src=https.

Будут ли они ранжироваться как надо? ссылочный вес и т.п.?
Достаточно просто отдавать с http, и всё будет хорошо. Ссылки можно не менять. На ранжирование не повлияет.
Спасибо. Т.е. если я в правилах nginx укажу не ставить редирект с http на https для картинок, то робот, найдя src картинки с https «попробует» её и по хттп, и если найдет — проиндексирует?
Да, всё так.
И все-таки не пойму, как тут может быть невысокий приоритет. Изображения — часть контента.
Фактически выходит, что яндекс индексирует в 2 раза меньше полезной информации с ресурсов, доверять которым можно в 2 раза больше.
Ставит под сомнение качество выдачи.
Позволит украсть картинки с https ресурсов владельцам http ресурсов и выдать за свои.

Считаю, что данный нюанс индексации посредством оставления «норок» по http должен быть тут (http://help.yandex.ru/images/indexing.xml) однозначно.
Да я боюсь ответ один — в косности Яндекса в данном случае и в четком непонимании проблем пользовавтелей.

Я не спец по поиску, конечно, и вообже живу в другой сфере (хостинг), но даже со своей недалекой колокольни могу сказать, что https/spdy 1,2,3/sni должны СРАЗУ же поддерживаться поисковиками, а уже потом должны подтягиваться кастомеры. Ибо это натуральное неприкрытое торможение или даже саботирование технологического прогресса.

Сайт без https и БЕЗ http версии (либо в виде редирект на https) — это вполне себе реальная ситуация. А проблема с тем, что картинки с https сайты нельзя из-за варнингов (постойте, какие нафиг варнинги браузеров для EV?!) решается тем же гуглом что они фигачат картинку прямо в код в base64 :)

Алсо, отсутствие оперативной реакции от Яндекса в виде «Вот это у нас косяк, спасибр, завтра починим» — ОГРОМНЫЙ минус им в карму. Даже больший, чем их уродский вертикальный баннер в левой части экрана.
Вам дали настоящий ответ, только он вам не нравится: https-only сайтов слишком мало для того, чтобы в приоритетах развития картиночного робота высоко стояла поддержка https. Да, это сделают, нет, не завтра.

Нельзя исключить, что мы тут неправы, а приоритет у этой задачи выше. Я пока не вижу фактов, это подтверждающих, но, возможно, я не туда смотрю? Тогда подскажите, что мы проглядели, и почему это надо сделать «СРАЗУ», а не, например, «до конца года». Аргумент про «саботирование технического прогресса», извините, принять не могу.
даже со своей недалекой колокольни могу сказать, что https/spdy 1,2,3/sni должны СРАЗУ же поддерживаться поисковиками
Как и любое другое безусловно категоричное утверждение, это не может полностью соответствовать действительности. Например, оно определенно неверно в части spdy.
А добавление документации про эту «фишку» тоже — «приоритет до конца года»? :)

Ничего личного, но 3е суток хотя бы для добавления информации на вики — вполне достаточное время.
Документация скоро будет. Не волнуйтесь! Этот вопрос, безусловно важный, но в выходные ради него решили всё-таки на работу не выходить ;). А вообще — спасибо за напоминание!
Вот, это зачотный ответ :) Спасибо, ждем!
Почти весь ecommerce заграннет в https. Вообще правило хорошего тона EVSSL и никакого http. Только рашковский тындекс отличился.
Как только я влогиниваюсь — https включается и становится принудительным.

Added: И да, там картинки отдаются после этого с https-only доменов.
Я залогинен, и у меня http. И все карточки товаров показывают по http, только профиль по https. И никакого EV SSL там нет.
Да, Ваша правда.

Персонализированный www.amazon.com/gp/yourstore (туда перекидывает после влогинивания) — https-only, обычный корневой amazon.com — продолжает быть http-only.
EV SSL нету, естественно, но я вообще в упор не могу понять, нахрен он может кому-то быть нужен — поэтому и забыл про него написать даже.
У вас https с использованием SNI?
не настраивался, так как TLS домен всего 1.
Но эт не важно же.
Важно, что картинка с адресом https://site.com/img.jpg не будет проиндексирована яндексом и не попадет в поиск по яндекс.картинкам
В чем проблема выложить статику на какой-нить поддомен аля static.xxx.ru и сделать его доступным по http?
Браузеры будут показывать предупреждения, что на защищенной странице есть незащищенный контент.
Браузерам показывать https, а поисковикам http.
Вполне возможно что сайт просто не может отдавать контент по http ибо вся логика завязана на https.
Что вы имеете в виду? Как я понял из статьи, используется nginx в качестве фронт-энда, а в nginx заменить http на https или наоборот не составит труда. В каком режиме работает фронт-энд, не влияет на логику сайта (бек-энд).
Что это за выброс и почему он не на tosrer.ru?
Потому что на тостере не придет в комментарии представитель яндекса
Можно представителям Яндекса напрямую писать в личные сообщения на хабре, их найти тут дело 10 минут. Можно писать им просто в саппорт, можно писать платонам, можно писать по контактным данным сотни всяких представителей, выступавших на конференциях, можно писать через яндекс-вебмастер, можно спросить на серче. Яндекс — не Google, вариантов с ним связаться и открыто поговорить — масса. И с ними можно конструктивно решать вопросы и я знаю это на личном опыте. А таких записей как выше про каждую крупную компанию можно настрогать несколько десятков, никто не идеален.

А если целью поста было не решение проблемы автора, а привлечение внимания общественности к этому вопросу и поднятие шума с целью влияния на скорость работ Яндекса в этом направлении, то можно было хотя-бы оформить это иначе.

Если хотелось сделать полезное дело и подсказать людям решение проблемы — можно было таки написать в техподдержку/представителям и получить нормальный ответ и потом выложить на хабр готовое решение.

Давайте мыслить конструктивно.
Целью поста было:
1 — решение проблемы автора
2 — привлечение внимания общественности
3 — поднятие шума с целью влияния на скорость работ Яндекса в этом направлении
4 — хотелось сделать полезное дело и подсказать людям решение проблемы
Не вижу диссонанса с манерой оформления поста.
Просто сам факт такого поверг лично меня почти что в шок.
А я был почти в шоке, когда оказалось, что между последними iPhone и MacBook Pro Retina про нельзя кидать файлы по AirDrop. Я до сих пор почти в шоке от юзабилити интерфейсов Google для вебмастеров и рекламодателей (контраст с Яндексом) и от того, что в AdSense нельзя посмотреть доходы с разных каналов youtube. Я каждый день в шоке от работы всех государственных служб, в шоке от новых законов «про интернет» в РФ и еще немного в шоке от недавних событий в своей стране. Да что уж там, этот мир вообще еще может удивлять.

К вам лично претензий нет. Был вопрос, вопрос исчерпан.

Есть теперь вопрос к минусяторам — вы не смогли понять смысл моего вопроса и вам необходимо было развернутое объяснение довольно очевидной фразы в несколько слов или хабр перестал быть ресурсом для здравомыслящих и теперь в тренде не аргументированные отверы/критика/комментарии/пояснения, а немое жмякание кнопок? Как-то это не серьезно.
Да порой мне кажется что Яндекс живет своей жизнью, а интернет, своей… Но кто от этого больше страдает? Я просто не понимаю политики Яндекса в таких вопросах. Вот например около трех лет назад с развитием HTML5 все сайты начали переходить на SEO friendly and accessible url, No more #! Ну а раз сам Google отказался от #! то и индексирует одностраничные приложения без #! замечательно, без проблем, как разумеется и Bing и прочие… Годы идут, для современного мира и тем более интернета три года — это огромный срок, но Яндекс твердо стоит на своем давно устаревшем стандарте. Яндекс не собирается индексировать ваши одностраничные сайты без #!.. Вот только хочу понять как они это обосновывают для себя? Религия не позволяет что ли учитывать новые стандарты? Или позволяет, но на это у Яндекса уйдут десятилетия? Интернету что ли хуже от этого или Яндексу, что он не индексирует?
В общем, можете считать официальным комментарием ;).

Для того, чтобы картинки индексировались, нужно, чтобы робот мог их скачать по http. При этом, очевидно, не нужно нарушать целостность https и класть на страницу картинки с незащищёнными http урлами. Ссылка на https картинку нормально обработается и сохранится у нас в базе. Когда придёт время, робот пойдёт качать картинку с этим же урлом, используя http протокол.

Добавили абзац в документацию. Спасибо за обратную связь ;)
Слушайте, а можете пояснить, почему так получилось?
Паук использует какую-то совсем свою, самописную, имплементацию протокола — и в ней только голому http место нашлось, без s?
Забавно, Тинькофф тоже без картинок остался.
И www.edx.org тоже.
Диджитал оушн тудаже.
Боюсь дальше продолжать.

Нет, оно понятно, — то, что исторически сложилось и обросло кучей всего другого менять очень сложно.
Но, как то вот, именно в этом случае — совсем не правильно.

Может подвинете таску как-то повыше что-ли, в приоритете то.
Логика ведь сама подсказывает — сайты, могущие себе позволить SSL / EV SLL, с большей вероятностью могут себе позволить и более качественные, авторские работы.
Отлично. Минуло 3 недели, а воз и ныне там. Скоростной робот то, блин.
Этот жестокий, жестокий мир.
Можно узнать, как часто картиночный бот кушает джпеги?
Или может они недостаточно приправлены exif 'ами?
Или микроформаты ему не угодили?
А может быть потому, что на картинках нет котят >^'.'^<?
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.