alizar 30 ноя 2010 в 21:41

Алгоритм + толпа — этого недостаточно

5 мин

2.2K

Перевод

В последнее десятилетие онлайновым миром управляли две родственные силы: Толпа и Алгоритм. Коллективные «пользователи» интернета (Толпа) создают контент, кликают и голосуют, в то время как математические уравнения привносят масштабируемость и возможность поиска по этому огромному массиву данных (Алгоритм).

Словно луна над океаном, взаимодействие этих двух сил создаёт волны популярности (и забвения) в интернете. Информация более доступна, полезна и эгалитарна, чем когда бы то ни было.

Но со временем (по крайней мере, мне) стали видны слабости системы «алгоритм+ краудсорсинг». Следующая революция кажется неотвратимой.

Давайте для начала рассмотрим некоторые примеры краудсорсингового, алгоритмического прогресса:

• Netflix — мы смотрим, ставим рейтинги и отзывы. Netflix рекомендует (они даже закраудсорсили свой алгоритм).

• Amazon — мы выбираем, покупаем, ставим рейтинги и отзывы. Amazon анализирует данные, пока точно не узнает, что именно рекомендовать (очевидно, что это критическая часть их бизнеса).

• Expedia — мы летаем, снимаем комнаты, спим и отдыхаем. Машины Expedia анализируют, устанавливают цены и вычисляют, как получить максимальную прибыль.

• Google — мы создаём контент, цитируем других и обмениваемся ссылками. Google ползает, сортирует, выдаёт и ранжирует (базируясь в основном на созданном людьми графе ссылок).

• Facebook — мы дружим, обновляем и лайкаем. Facebook строит идеальную систему для таргетинга контента и рекламы.

• Reddit/Digg/StumbleUpon — мы предлагаем темы и голосуем за контент. Они принимают их и определяют, как долго тема должна висеть на главной странице и для кого она будет видима.

• Yelp — мы ужинаем, посещаем заведения и делаем покупки, оставляем отзывы. Yelp классифицирует, ранжирует и рекомендует.

Мы не полностью зависим от этих алгоритмов, ведь имеем возможность копать глубже, искать дальше и собирать больше данных для принятия решения (и часто мы так делаем). Но, поскольку машины делают предположения о том, что нам надо, бывает легче воспользоваться решением по умолчанию, чем искать альтернативный путь.

Сравните это с альтернативными методологиями до эпохи интернета:

• Видеопрокат — кассету для просмотра помогали выбрать секции «рекомендации персонала», «выбор критиков» и «номинант премий».

• Журнал о технике (Consumer Reports) — эксперты анализировали и тестировали продукт со всех сторон, а потом ставили оценки и рекомендовали лучший, с их точки зрения.

• Турагенты — путешествия бронировались профессионалами, которые имели уникальный доступ к базам данных с информацией о билетах и гостиницах.

• Путеводитель по ресторанам — такие справочники включали в себя рейтинги ресторанов и отзывы от анонимных оценщиков из десятков городов.

• Личные рекомендации — когда не было ни одного справочного ресурса, то друзья, родственники, коллеги и различный сервисный персонал (консьерж в доме, справочная по телефону) могли предложить свои варианты настолько личные, релевантные и ценные, что эта методология часто используется даже сегодня.

Поймите меня правильно, я считаю, что в большинстве случаев эти предшественники современного подхода «алгоритм+краудсорсинг» не могут сравниться по качеству, надёжности и полезности. Их диапазон часто были слишком ограниченным, иногда искажённым коммерческой выгодой и временами просто неправильным.

Но эти предшественники имели реальные преимущества — главное, что каждый мог понять, на чём основана рекомендация. Сравните это с загадкой наших сервисов «алгоритм+краудсорсинг».

Почему эта страница выводится первой по определённому запросу Google? Почему одна ссылка держится на главной странице Reddit часами, а другая с таким же количеством голосов исчезает за несколько минут? Почему Facebook показывает мне рекламные объявления о работе в службе поддержки Comcast? Почему Amazon рекомендует покупать цельное молоко вместе с этим самодельным танком?

Если мы не понимаем, в чём причина подобных рекомендаций, может ли это снизить наше доверие к будущим рекомендациям этих сервисов?

Фред Уилсон недавно написал интересную историю о том, почему мы не должны инвестировать в то, чего не понимаем:

… отрасли рынка венчурного капитала заполнены инвесторами, стремящимися за прибылью. И некоторые из них не понимают, во что они инвестируют. Несколько недель назад мне позвонил частный инвестор, который хотел вложиться в одну компанию из нашего портфеля. Он задал несколько вопросов о компании, и стало вполне ясно, что человек не вполне понимает суть её деятельности. Но затем он предложил свои инвестиции. Это меня пугает.

Меня в последнее время посещают некоторые иностранные представители, многие из которых инвестируют миллиарды долларов от имени своих боссов. Все они хотят влезть в наши фонды и в наши сделки. Когда я спрашиваю о причинах, они не могут даже сформулировать убедительный аргумент об экономическом потенциале социальной сети. Но они видят прибыль и тоже её хотят. Это меня пугает.

Я считаю, что для некоторых людей в равной степени трудно и глупо доверять сервисам рекомендаций, чьи алгоритмы они не могут понять. Эти самые люди могут обратиться за рекомендациями к источникам, которые им понятны, и результаты которых они могут логически вывести.

Моя точка зрения не в том, что Google, Netflix, Amazon, Yelp или кто-то ещё обречён на неудачу. Но я считаю, что есть бизнес-возможность для предпринимателей, веб-сайтов и компаний добавить редакторский компонент в парадигму «алго-толпы».

Многие стартапы уже действуют в этом ключе.

• Quora / FormSpring / StackExchange — в отличие от ответов Google или даже Википедии, где порядок выдачи результатов либо источник информации неизвестны и свободны от ответственности, современные системы Q+A отдали власть в руки толпы, алгоритмов и экспертов.

• Techmeme / Memeorandum / Mediagazer — толпа блогеров создаёт контент и цитирует друг друга. Алгоритм компилирует и сортирует информацию, в то время как кураторы обеспечивают качество и актуальность.

• Alltop — отобранная под надзором Гая Кавасаки коллекция фидов по отраслям. В данный момент алгоритмический элемент отсутствует, но я думаю, так долго не может продолжаться.

• Oyster / Raveable — Туристические сайты печально известны слишком большим количеством сомнительных комментариев и лишённых достоверности отзывов подозрительного качества от коммерческих партнёров, финансово мотивированных аффилейтов. Oyster действует, посылая в отели редакционных экспертов для написания собственных отзывов, а затем применяя пользовательские данные и алгоритмическое ранжирование/оптимизацию, чтобы помочь читателям сделать наилучший выбор. Raveable сочетает лёгкий редакторский надзор с мощным дата-майнингом и алгоритмом сортировки для помощи в поиске отеля.

• Groupon / LivingSocial / Gilt Group — Сайты с купонами и предложениями в Сети уже около десяти лет, но эти три (и ещё куча похожих на них) произвели революцию в индустрии и становятся одними из самых известных брендов в онлайне благодаря социальным фичам (краудсорсинг маркетинга и рекламы предложений), алгоритмической фильтрации для персонализации/локализации предложений и редакторскому надзору (так что сделки, которые они предлагают, действительно достойные).

• TheSixtyOne / Pandora / Last.fm / Spotify — Музыкальные рекомендации становятся всё лучше, и последнее поколение подобных сервисов представляет собой помесь алгоритмов, краудсорсинга и редакторского выбора, которая доставляет симфонический восторг многочисленным пользователям.

Я думаю, мы увидим ещё больше примеров подобного подхода в будущем, возможно, даже на сайтах/сервисах, которые я упомянул в самом начале (Yelp, Amazon, Netflix и др.). Я уверен, что алгоритмы и краудсорсинг можно сделать сильнее с добавлением третьей опоры — уверенных, благожелательных редакторов.

Теги:

Хабы:

Краудсорсинг

Алгоритм + толпа — этого недостаточно

Публикации

Истории

Ближайшие события