Как стать автором
Обновить

Комментарии 100

Сомневаюсь что подобные меры помогут честной конкуренции. Сеошники закидают алгоритм шлаком и все будет только хуже.
Вот вот. Одна из причин почему алгоритмы гугла закрытые, чтобы уменьшить количество искусственных игр на алгоритме, все эти ключевые слова белым на белом, и прочие магические точки.
Из документа
At the same time, the Regulation seeks to achieve this objective without requiring providers to disclose algorithms or any information that, with reasonable certainty, would result in the deception of consumers or consumer harm through the manipulation of search results (Article 5(6)). Thus, providers are not required to disclose the detailed functioning of their ranking mechanisms, including algorithms, and their ability to act against bad faith manipulation of ranking should not be impaired (Recital 27)


То есть сам алгоритм публиковать не обязательно, а нужны факторы, которые он учитывает.

И претензии у Еврокомиссии вполне обоснованы, рынок контекстной рекламы это сторона темнее продажи наркотиков. Все маркетологи говорят о том, что позиция в поиске повышается на время рекламы и понижается после окончания кампании. А еще у Гугла значится сотня переходов, а в логах веб-сервера пяток. Но поддержка Гугла работает также, как и бан приложений в магазинах — не нравится — не жри.

Эту помойку давно пора регулировать. Все думали покеррумы это зло, но в покере крутилось несколько миллиардов, а тут 300+. В США, кстати, тоже на четверку уже отправили дело в антимонопольный комитет, очень надеюсь, что дело кончится как у Ротшильда. И да, я не кровожадный, просто то, что творят гиганты сейчас это диктатура похуже СССР.
Ой как согласен насчёт поддержки гугла. Но это не только сапорт гугла таким страдает. Mytarget просто игнорит саппорт, им нужно неделю-две писать и тогда они отвечают, но отвечают стандартом «Что именно у вас случилось?»,- и всё опять пропадают, потом появляется новый агент сапорта задаёт такойже вопрос и опять пропадает.
Возвращаясь к поддержке гугла, гугл хотябы ответил на сл день и ответ был более менее объективный.
В статье же есть ссылка на руководство ЕС, там этому посвящена отдельная глава «4. HOW TO SELECT THE MAIN PARAMETERS AND STILL PREVENT BAD FAITH MANIPULATION OF RANKING». Специфику работы алгоритмов раскрывать не требуется, да в случае нейронных сетей это и не реально.

Законодатели требуют раскрывать «ranking parameters», котрые служат входом алгоритмов. Если, например, Гугль предлагает мне товары на основе имеющейся у него истории предыдущих запросов, то это нормально и ожидаемо. А если, вдруг там учитывается и история покупок по скидочной карте в ближайшей аптеке, то возникают вопросы откуда она у них.
А если, вдруг там учитывается и история покупок по скидочной карте в ближайшей аптеке, то возникают вопросы откуда она у них.

А Вы думаете, «Гугл» все расскажет? Он перечислит то, что «нормально и ожидаемо». Исходный код краулеров/рэнкеров/etc. никто не спрашивает.
А Вы думаете, «Гугл» все расскажет?

Можно, конечно, сознательно нарушить закон и сообщить заведомо ложную информацию, но рисковано. Например Volkswagen уже пытался химичить с регуляторами и это нехорошо обернулось всем, вплоть до высшего менеджмента. По-любому, такой закон не навредит. (там в документе, кстати, довольно подробно расписано что нужно сообщать, общими фразами не отделаешься).
Гуглу можно уйти на уровень ниже, и не заявлять историю покупок по карте в аптеке, а заявить «информация из модулей google-analytics сайтов-партнёров и информация из модулей аналитики сторонних android-приложений, установивших AdMob SDK» (а конкретнее — URL страницы, название пакета приложения и классов Activity, с которыми взаимодействует пользователь)

По сути, абсолютно честно, и ничего не даёт регулятору.
«В период с 2017 по 2019 годы Google заплатила примерно $9,71 млрд в виде штрафов в Евросоюзе»
А Google переложил эти выплаты на пользователей платных сервисов.
Помнится, кто-то из представителей поисковиков говорил, что они сами не знаю, как именно работают их алгоритмы… Понятно, что врали, но факторов слишком много, и часть из них зависят от самого ищущего.
НЛО прилетело и опубликовало эту надпись здесь
Я, может, немного в сторону, но всё же…

В своё время я продлевал ОСАГО на свою машину. Поскольку рабочий день был плотным, решил сделать это по телефону с выездом страхового агента на место с уже готовыми документами. Скинул по электронке скан прав, скан СТС, вот это вот всё.

Приезжает…

В страховке (бланк строгой отчётности, на секундочку) вместо полного госномера авто – а-ля Е123КХ199RUS – просто 123, даже без букв, пофиг уж и на регион. Вместо модели машины – а-ля LandRover Discovery II V8 – просто LandRover (я не хвастаюсь, у меня сильно не последний был).

Спрашиваю, что за? Это как вообще? А она мне – а мне компьютер не даёт, только так даёт. И, заметьте, никаких нейросетей тогда и в этом вопросе ещё не было. Тупо полностью переписать модель и госномер из документов – компьютер не даёт, понимаешь.

Риторический вопрос, кто тут верхнее звено, человек или компьютер, оставим за скобками. Но даже безотносительно еврокомиссии… Вам не страшно, что завтра компьютер кому-то снова не даст, или, наоборот, даст кому-то не тому, и что с вами через это сделают? Просто потому, что «компьютер не даёт». Так что желание еврокомиссии, в данном случае, чётко понимать, как оно работает и как выдаёт результаты – очень актуальное и своевременное, на мой взгляд.
Очень просто: сейчас на сайтах многих страховых нельзя вбить модель автомобиля, только выбрать из списка. Например, есть ВАЗ-2109 и ВАЗ-21099. О 21093 и 21091 просто забыли. А были еще и 21097, например… Сколько моделей иностранного производства в этих списках нет — фиг знает. Какого-нибудь «Ford-A» точно нет. Видимо, Ваша ситуация из той же серии.
Однозначно из той же. Но есть подозрение, что в такой ситуации страховой агент должен не мне объяснять, что «компьютер так не даёт», а разработчикам объяснять, что их поделие работает неверно. И разработчик должен взять под козырёк и бежать исправлять, потому что из-за этого компания теряет деньги (я, в итоге, пошёл за страховкой в другое место, где компьютер девушке дал).

А произошло ровно наоборот. Страховой агент, специально обученный (по идее), знающий все тонкости и правила (опять же, по идее) оказался никем перед плохо написанной программой. А ведь отвечать за последствия, если что, пришлось бы не программе, а именно страховому агенту. Но нет, раз компьютер так сказал, так тому и быть.

И заметьте, в данном случае недоработка очевидна, равно как и пути её исправления. А в случае нейросети как быть? Там ведь никакой разработчик не сможет воспроизвести алгоритм и однозначно сказать, почему компьютер принял именно такое решение.

Запрос еврокомиссии несколько глубже, чем кажется. Решения, принимаемые алгоритмами ранжирования, в наше время имеют всё более и более серьёзное значение, а иногда и юридические, экономические и социальные последствия. И необходимо понимать, как эти алгоритмы такие решения принимают. Просто чтобы можно было оценить их корректность (а то и законность), обжаловать их и даже скорректировать. А пока получается, что никто, включая разработчика, не в состоянии сказать, как и почему «компьютер так даёт». И как в таком случае можно позволять этому неведомому управлять нами?
А произошло ровно наоборот. Страховой агент, специально обученный (по идее), знающий все тонкости и правила (опять же, по идее) оказался никем перед плохо написанной программой. А ведь отвечать за последствия, если что, пришлось бы не программе, а именно страховому агенту. Но нет, раз компьютер так сказал, так тому и быть.

А страховому агенту пофигу. Отвечать будет страховая компания, а его дело — продать страховки. Чем больше страховок продаст — тем больше его зарплата. Так что тут еще и проблема неправильных KPI высплывает.

А что касается софта, который не знает отдельных моделей, то ноги, кажется, растут из РСА, которая пытается де-факто регулировать рынок. Там кто-то решил стандартизировать список, чтобы было удобно взаимодействовать страховым компаниям между собой, — список появился, и в него вставили наиболее часто встречающиеся в стране машины. Страховые это с радостью проглотили, потому что им работать с возмещениями, и только в рамках РСА.
Это уже перебор. Хотите чтобы поисковик выдавал нужные вам сайты — заплатите за это, или делайте свой поисковик. Все известные поисковики сегодня работают бесплатно для пользователя, но с показом рекламы. Поисковым компаниям нужно просто сделать платные поисковики без рекламы для тех, кто в этом нуждается.
НЛО прилетело и опубликовало эту надпись здесь
Т.е. объяснение, что поисковик, созданный компанией, живёт за счёт «бесплатной» рекламы других проектов этой же компании — не прокатывает? Я специально взял «бесплатный» в кавычки, поскольку поддержка инфраструктуры, совершенствование поисковых алгоритмов и борьба с поисковым спамом требуют больших денег.

Есть другая модель окупаемости — за счёт донатов (https://duckduckgo.com/about). Если ЕС так беспокоится из-за рекламных вставок — пусть лучше поддержит этих ребят, чтобы они нарастили свою железную инфраструктуру, увеличили R&D и довели свой поисковик до уровня Гугла.
НЛО прилетело и опубликовало эту надпись здесь
Это не домыслы, но факт. Что касается очерёдности, то если какая-то ссылка была перемещена на n позиций вверх в выдаче, то это тоже можно считать рекламной вставкой. Не вижу смысла здесь делать различие.
НЛО прилетело и опубликовало эту надпись здесь
Популярные поисковики известных компаний (Гугл, Яндекс) пихают рекламу в верхние строчки выдачи. И обозначают её пометкой «Реклама». Это актуально по крайней мере для Беларуси.

Если в выдаче есть и другие ссылки, которые были продвинуты на n позиций вверх — их однозначно нужно интерпретировать как скрытую рекламу, и также соответственно помечать. Это я имел ввиду, когда писал что не вижу смысла делать различие между явной и скрытой рекламой.
«Если в выдаче есть и другие ссылки, которые были продвинуты на n позиций вверх — их однозначно нужно интерпретировать как скрытую рекламу, и также соответственно помечать. Это я имел ввиду, когда писал что не вижу смысла делать различие между явной и скрытой рекламой.»

Есть явление, например, случайного подброса, когда поисковик подкидывает по позициям сайт, на котором у него собрано мало поведенческой статистики.
Считать ли это рекламой?
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Я бы посмотрел, как ЕС введёт запрет на google play market…
НЛО прилетело и опубликовало эту надпись здесь
ЕС в свое время потребовал выпустить Windows без Internet Explorer и Media Center. Так появилась Windows N…
Пока нет конкурентов, гуглу пофиг.
Будут продавать устройства без сервисов, пользователи всё равно первым делом поставят эти сервисы, потому что без них не могут.
Тут еще и от производителя железяки зависит. Он может внезапно предложить свою альтернативу, чего, собственно, в ЕС и добиваются.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Samsung Pay — третье по популярности решение, по данным Mediascope; его используют 12,3% опрошенных пользователей
Вроде дискуссия была про Play, а не про Pay :)
Ещё можно посмотреть, какая доля у оболочки OneUI, внезапно окажется, что она равна доле самсунг-смартов на рынке.
НЛО прилетело и опубликовало эту надпись здесь
Изначально дискуссия была про «сервисы гугл», и я лично видел под ними именно магазин приложений, как центральный элемент.

Функциональность всех Pay-сервисов полностью идентична: привязываешь карту и прикладываешь телефон к терминалу оплаты вместо карты. Пользователю абсолютно безразлично (если он не фанат гугла, например), что там — гугл или самсунг, на его опыт это не влияет, комиссии все одинаковые и регулируются платёжной системой. Чего не скажешь об инфраструктуре магазина приложений.

То есть, абсолютно неверно приводить Pay как пример конкуренции экосистем, какими являются магазины гугл-эппл-самсунг-яндекс.
НЛО прилетело и опубликовало эту надпись здесь
То есть вы подтверждаете, что если производители смартфонов предустановят вместо всех приложений гугла что угодно, то пользователю будет всё равно по большей части и он будет использовать их, а не гуглосервисы?
Нет, пользователь будет использовать то, что ему удобно. Если это приложение монополиста, то его. В случае с сервисами гугла, магазин гугла — лучшее решение, а все остальные магазины не нужны. А, например, гугл-карты, которые идут в нагрузку, часто заменяются на локальные, более качественные аналоги (Yandex и 2GIS у нас, что в Европе, не знаю точно, может, карты Nokia).
Я приводил его как пример конкуренции сервисов.
Платёжные сервисы плохо конкурируют. Я уже объяснял, почему. Повторюсь: нельзя легко сменить сервис (привязан к устройству), фичи все плюс/минус одинаковые, комиссия одинаковая. Сервису нечем привлекать клиентов.
А ещё ему не получится навязать условия пользователю «разрешай мне всё или я тебе половину функций смартфона порежу»
Большинству пользователей безразлично, какие там разрешения у какого приложения.
Так нет, форки и приложения яндекса были не про экосистемы с приложениями
Да неужели? Свой магазин они не хотели? Гуглу пофиг было на яндекс-карты, пока они не включили магазин и поиск в набор приложений.
Нельзя выбрать другой поиск, нельзя поставить рядом чужие карты, нельзя поставить другой браузер
Чего??? Возьмите любой Samsung, HTC, любой китайский смарт. Это из того, что я лично в руках держал. Там вам браузер будет альтернативный, и календарь с почтой. А про карты вы откуда взяли?
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
И чем? Разрешите нам наш Samsung Pay, а то… а то что?
А то сделаем альтернативу Google Play.

Платёжные системы это не какой-то жалкий магазин приложений, где люди покупают игрушечки. Тут огромные денежные потоки: люди каждый день покупают еду, бензин, мебель. Даже полпроцента с этих сумм это уже побольше, чем принесёт любой магазин.

И тут Самсунг ради таких денежек может поссориться с гуглом и выставить свой магазин. Пусть продажи смартов просядут, так из-за платёжной системы всё окупится. А для других будет звоночек: Самсунг смог без Гугла, и мы сможем. Так империя Гугла и развалится.

Почему мелкие производители не запускают свои Xiaomi-Pay и Oppo-Pay? Прибыль огромная, а затрат на инфраструктуру не так много, как с магазином. Я думаю, тут их Гугл как-то сдерживает и заставляет ставить свой Google Pay, и они ссориться с гуглом пока не готовы.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Почему мелкие производители не запускают свои Xiaomi-Pay и Oppo-Pay?

Потому что это немного сложнее, чем просто написать приложение и засунуть его в (свой) стор/прошивку.
НЛО прилетело и опубликовало эту надпись здесь
Так это… уже ж
Там и запишем: гугл не смог справиться с Xiaomi, и заставить их использовать Google Pay. Значит, не так силён монополист.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
У «Huawei» получилось. Там, конечно, особая история, да сами «Huawei» те еще жуки, но…
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
либо только наши процы во всех сферах, какие мы укажем, либо везде ставьте свои армы
С железом это не работает, потому что всегда можно купить через третью фирму. Intel мог запросить такие условия под хорошую скидку: даём скидку, если вы будете использовать процы везде, и в ноутах, и в десктопах, иначе покупайте по розничной цене. И тут, я думаю, ни один антимонопольный комитет не подкопается.
НЛО прилетело и опубликовало эту надпись здесь

Не надо передёргивать.
Рекламная выдача в ДАННОМ случае — вторична.
Речь идёт (ну Вы вроде как будто не поняли) о релевантности и соответственно — достоверности поисковой выдачи. Или-же — надо указывть — "релевантные ответы — начиная с 100-го"....

«релевантные ответы — начиная с 100-го»

Кстати, есть субьективное наблюдение, что поисковики сильно ограничивают глубину выдачи (ну или это я такой слоупок и только недавно это заметил). Грубо говоря, если 10-15 лет назад при более-менее популярном запросе выдавалось 100 страниц выдачи, и несмотря на то, что первые 4-5 страниц были завалены продуктом профессиональной жизнедеятельности сеошников и рекламщиков, то на 20-30 той странице все еще была актуальная выдача. Пусть и не очень релевантная в массе, и заваленная всяким дорвейным шлаком, но была, и полезную информацию можно было, скажем, отыскать на полудохлом форуме с 45-ой страницы выдачи. Сейчас даже популярный запрос ведет к выдаче всего условных 10-15 страниц результата.
Я примерно понимаю, что есть резко вырос объем медиаданных, сайты стали полностью динамическими, усложнились алгоритмы оценки релевантности, добавились алгоритмы расширенной персонализации и прочее. Но для пользователя есть неприятное следствие — «окно в мир», предоставляемое поисковиком, сужается до ограниченного (пусть и широко ограниченного) набора сервисов.
Это, если я не ошибаюсь, называется «Поисковый пузырь».
Вроде бы поисковым пузырем называется выдача той информации, на которую вы, судя по вашему профилю, имеете большую вероятность кликнуть. Запрос про быков и медведей выдаст разный контент для биржевого маклера и зоотехника.

А здесь про другое.
Запрос в гугл, первая страница

Почти четырнадцать миллионов ссылок, какая чертова дофигища информации!
Но что это?

Всего девятнадцать страниц выдачи?
А если мы кликнем «показать похожие»?..
Кажется, изменения не столь велики

Сорок пять страниц — это четыреста пятьдесят ссылок, а вовсе не четырнадцать (хорошо-хорошо, 13.8) миллионов.
И как увидеть оставшиеся тринадцать миллионов семьсот девяносто девять тысяч пятьсот пятьдесят ссылок, я не знаю от слова «совсем».
Я этот вопрос задал был представителю Яндекса. Увы, ответа нет, то ли не знает, то ли не по его профилю.
Именно! Выдача имеет узкое «окно», за которое не выглянуть. Яндекс дает, к примеру, 25 страниц выдачи, половина ссылок на которых — реклама или кросс-ссылки на яндексовские сервисы типа дзена и соцсети. В результате, все эти миллионы проиндексированных страниц просто недоступны. У Гугла лучше — выдача глубже и нет дзена, но не принципиально.
что такое дорвейный?
спасибо

На текщий момент несколько поисковиков занимают весь рынок-и дальше могут пользоваться этим продвигая свои продукты и понижая в выдаче продукты конкурентов. Или например влиять на общественно мнение подсовывая определенные статьи.
По сути это использование монопольного положения на одном рынке для продвижения продуктов на другом рынке. И благодаря этому они могут демпинговать на рынке поиска за счет того что окупаются другими продуктами. И это мешает создавать конкурентные сервисы.
Если бы каждый поисковик занимал небольшую долю рынка то этот закон не был бы нужен.

Перебор чего? ЕС хочет прозрачности, поэтому требует описать алгоритмы. Сейчас поиск это черный ящик, который снаружи весь такой независимый, а на самом деле постоянно подкручивает поисковые выдачи без твоего ведома. Никто вроде не требует убрать рекламу. Требуют, чтобы факт этой рекламы был явный. Как вон ютуберы, которые обязаны упомянуть, если у ролика есть спонсор.
И Гугл, и Яндекс уже указывают на рекламных ссылках слово «Реклама». Если есть другие ссылки в поисковой выдаче, которые были специально перемещены вверх, очевидно их также следует рассматривать как скрытую рекламу, и помечать соответственно. Также есть рекламные блоки-вставки с картинками искомых товаров и ссылками на магазин(ы). Так что этот пункт уже можно считать выполненным.

И что значит описать алгоритмы? Насколько подробным оно должно быть? В Интернете уже есть множество статей с описанием различных поисковых механизмов, в т.ч. на Хабре регулярно публикуются специалисты Яндекса. Заинтересует ли широкую публику подробная публикация этих алгоритмов, или она заинтересует только поисковых спаммеров и конкурентов?

Но я бы предложил подумать вот о чём. Допустим, штрафами и запретами госорганы заставят поисковики убрать или максимально скрыть рекламу в поисковой выдаче. Это значит, компании будут меньше зарабатывать на поиске, меньше вкладывать в R&D и поддержание актуальности поисковой базы. Будут, например, сканировать свои и партнёрские сайты регулярно, а всё остальное — раз в месяц. И кто выиграет от этого? Очевидно не пользователи.
И кто выиграет от этого? Очевидно не пользователи.
Если будет потребность, появится и инструмент. Сейчас с гуглом бессмысленно соперничать, и никто этого не делает. Если гугл перестанет качественно индексировать какую-то тематику, появятся по ней сначала сайты-каталоги с ручным обновлением, потом поисковики, потом они неизбежно начнут расти (если это коммерческое начинание) и начнут отжирать аудиторию гугла. Поэтому гугл не будет забивать.
НЛО прилетело и опубликовало эту надпись здесь
Это возражение на то, что при уменьшении доходов из-за действий регуляторов будет падать качество сервиса. Не будет падать, если руководство не хочет похоронить компанию.
НЛО прилетело и опубликовало эту надпись здесь

Кто-то говорил, что Гугл должен выдавать нужные сайты? Или это ваша фантазия?


Речь идёт о том, рекламу нужно маркировать. В России Гугл рекламу маркирует, никто не умер. То, что в Европе это пока не так — само по себе удивительно.


С факторами ранжирования сложнее, но вот данные обо мне, которые Гугл использует, я бы хотел знать. И если Гугл с этим не согласен, он, как говорится, может их просто не использовать.

НЛО прилетело и опубликовало эту надпись здесь
Хотите чтобы поисковик выдавал нужные вам сайты — заплатите за это, или делайте свой поисковик.


Хотите работать на территории ЕС — соблюдайте их законы. В эту игру могут играть обе стороны.

Меня вообще поражает насколько люди готовы прощать всё и вся мегакорпорациям типа Гугла, и удушатся при любых попытках регулировать их. Это идёт от подсознательного «а вдруг я сделаю Гугл когда-то там в будущем и меня начнут регулировать?» или что?
Знаете к чему приводит излишнее госрегулирование? К тому, что повышается порог входа в эти сектора. Мегакорпорации как раз с этим справятся. Но если раньше на коленке клепали свой поисковик, давали поиграться друзьям/колегам, то сейчас начнётся сертификация там, регистрация здесь, ограничение на способы и место хранения БД, обязательное хранение запросов n лет и оперативный доступ кому надо и т.д. и т.п.

Чтобы войти в поисковый бизнес сейчас и быть конкурентным, например с каким-нибудь специализированным поисковиком с уникальными фичами, и так нужно куча денег и времени на R&D. То о какой конкуренции тогда можно говорить? А если завтра госам что-то не понравится, и они зарегулируют ещё какой-нибудь Интернет-сектор, скажем службы языковых переводов, покупку авиабилетов или энциклопедические сайты?
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Так поисковики особо и не скрывают: напишут общими словами про качество, траст… и все.
Если я не ошибаюсь, яндекс уже отписывался, что на текущий момент ранжированием занимаются алгоритмы маш. обучения, параметров дофига, а оптимизируют, скорее всего, показатели отказа/среднее время просмотра/какую-то комбинируемую метрику из характеристик сеанса. И тут проблемка будет, с такой формулировкой запроса — если там задействованы решающие деревья, я хз как считать вклад каждого фактора, если их значение сваливает тебя к той или иной формуле скора.

Что-то я подозреваю, что у гугла такая же техника.
Я подозреваю, что потом на это все накладывается болт в виде проплаченной рекламы. И я не имею ввиду именно рекламу, а то, что сайт, который платит яндексу или гуглу неожиданно взлетает в органической выдачи, а потом по окончанию, также падает. Так что конечный алгоритм оптимизации — деньги.
Вся эта дичь про нейросеть — это запудривание мозгов регуляторам. Мы там типа непричем, не знаем как вот эти сайты которые нам большего всего платят оказались в топе. Нейросеть жеж. Наверное там контент хороший.
Ну знаете, тот хороший контент, когда диссертация сначала идет в магазинах, где ее продают, а потом, где-нибудь на 5 странице ссылка на rsl.

Хорошо, утрируем ситуацию.
Признак «сайт покупает контекстную рекламу» скорее всего, загружен в модель, т.к. является значимым.
Если сайты, покупающие рекламу, в среднем больше нравятся пользователю, потому что у них есть деньги и на качество с дизайном, что вы собираетесь с этим делать?
Я собираюсь ранжировать информацию. Помимо оплаченной рекламы, есть еще и другие признаки. Например, дата создания/индексации страницы. Сколько существует сам сайт. Сколько ссылок (нормальных) на этот сайт.

Я например говорю за диссертации. Я не понимаю, почему официальные хранилища с бесплатным доступом находятся ниже проплаченных сайтов?

Например рандомный дисер "
Управление технологической безопасностью процесса селективной очистки газов на основе нечётких импульсных моделей"

Гугл — dissercat.com потом rusneb.ru почему?
Может, потому что по 1-й ссылке сразу доступна часть текста? А по 2-й в каком-то вьюере можно загрузить PDF, содержимое которого не факт что индексируется.
Там нет всего текста, несколько страниц из дисертации. Весь текст — за деньги.
Ок, разбираем тезисно.
1) Дата создания/индексации страницы. Сколько существует сам сайт. Сколько ссылок (нормальных) на этот сайт.
Как человек, работающий в холдинге интернет рекламы, буду в восторге если третий пункт снова станет важным — раньше это был миллиардный рынок, а все алгоритмы по отсеиванию «нормальных» ссылок хачатся на ура. Первый и второй малозначимы, поскольку практически не коррелируют с качеством.
2) Я например говорю за диссертации. Я не понимаю, почему официальные хранилища с бесплатным доступом находятся ниже проплаченных сайтов?
Гугл — dissercat.com потом rusneb.ru почему?

С вашим примером есть одна проблема — я могу, конечно, ошибиться, но бегло прогнав по 5 запросам из их тематики — рекламу в гугле на поиске не дают ни один, ни второй, вообще в этой тематике не вижу рекламы на поиске. Сети проверить сложнее, но думаю что тоже нет. Для слабокоммерческих сайтов это довольно… бессмысленно.
Более-менее достоверным мне кажется предположение, что это из-за того что dissercat — библиотека диссертаций, а нэб — библиотека вообще. А вы гуглите диссертацию.

«официальные хранилища с бесплатным доступом находятся ниже проплаченных сайтов?» — странный аргумент, попробуйте определить понятие «официальный» с точки зрения поискового движка. Попробуйте придумать, почему бесплатность доступа должна быть значимым/важным фактором.

Для тренировки, кстати, допустим, что поисковая машина путем ранжирования максимизирует свою прибыль, а не пользовательское удовлетворение.
можете формально доказать, с аргументами за и против, почему это плохо?
Походу уже в принципе неважно, какие там факторы влияют на ранжирование… Фактически монопольное положение поисковиков (1,2,3 шт) уже привело к тому, что они перестали тратить усилия на собственно поиск и перешли на продажу рекламы.
— при наличии платной рекламы позиция сайта в поиске поднимается (как заметили выше)
— при попытке организовать на своем сайте какой-либо миникаталог (список полезных сайтов по какому-либо направлению) — получаем плашку «малополезный контент»
— при попытке разместить на сайте независимую рекламу — получаем плашку «сайт нарушает требования поисковой системы»
Как бы это логично. Большая корпорация думает исключительно о своей прибыли и ей конкуренты не нужны.
А как в дальнейшем решать данную проблему — не ведаю.
Создавать конкурентов в поиске…
А как? Сама по себе задача не простая технически.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Другие новости

Истории