Как стать автором
Обновить

Комментарии 417

Напишите SQL, который определит возраст человека по фотографии (или вообще присутствие человека), плиз. Не те сравнения Вы приводите в статье. Вы привели примеры стандартного функционала любого интернет-магазина, и сомневаюсь, что кто-то использует AI\ML для тех же целей
Статья как раз о том, что AI\ML часто пытаются тащить в проекты со стандартным функционалом, где вполне хватает обычного SQL.
Только дело не в SQLконкретно, а в обычной статистике. Понятие AI/ML более широкое, чем SQL и сравнивать их неуместно. Правильнее сказать: вам не нужно машинное обучение, вам хватит статистики с головой. А уж в excel это будет сделано или с помощью sql, это ваше личное дело.
НЛО прилетело и опубликовало эту надпись здесь
С использованием AI/ML всё становится лучше. Как десятью годами раньше с Bluetooth.

Приветствую! Думаю автор хотел на конкретном примере показать суть общей проблемы (читайте проблема как перевод задача). То есть далеко не все задачи требуют новомодных веяний для простой и эффективной реализации. Можно и иначе сказать известным выражением "Из пушки по воробьям".
Вы же противопоставляете узкую задачу. Кстати, в таком примере, справедливости ради, нужно точно так же описать конкретно решаемую задачу с помощью выбранной технологии и описать ее эффективность. А то часто слышны абстрактные тезисы без доказательства. Что не справедливо при сравнении. Потому что противопоставляем конкретный пример, конкретный результат с теоретически возможным. Заранее приношу извинения, что делаю такое замечание. Тут нет неуважения к технологии и задаче, как и к тому, кто высказался.
Никто не отрицает, что те или иные технологии наиболее эффективны при решении определенных задач. Или то, что технологии порождаются необходимостью решать определенные задачи. Но при этом дОлжно руководствоваться прагматизмом, а не фанатизмом. Увлечение одной из технологий не должно влиять на выбор при решении конкретной задачи. Я не отрицаю в том числе и процесс эксперимента и выбора из нескольких решений. Но в реальном мире все имеет не эмоциональные метрики, а вполне материально исчисляемые.
Как пример могу сказать, что в конце производственной линии дешевле установить промышленный сканер шк, чем систему, которая по видео будет определять наличие шк, потом обрабатывать и передавать эти данные. Тут все просто: стоимость программного решения, скорость отклика, надежность считывания данных, стоимость дополнительного вычислительного оборудования. Есть и еще дополнительные минусы.)

Я полностью согласен, если посыл статьи был именно в этом — отлично, но на данный момент, сравнение SQL с ML больше похоже на пиар-ход для вывода статьи в топ в силу популярности ML

Судя по минусам моего комментария, я был не прав в конкретной фразе «сомневаюсь, что кто-то использует AI\ML для тех же целей» и судя по другим комментариям действительно есть такие примеры. Так вот статью, где приводились бы примеры подобных «странностей» я прочитал бы с бОльшим удовольствием, нежели чем статью, где скорее пытаются паразитировать на хайпе той или иной технологии, чем открыть людям глаза

Но автор с тем же фанатизмом "впихивает" SQL, где лучше сработал бы ML и говорит что SQL справляется лучше.


Скажем, человек купил пару обуви, солнцезащитные очки и книгу. В рассылке для него мы покажем обувь, солнцезащитные очки и книги. Это гораздо более уместно, чем посылать случайные вещи

Мне покажут обувь, когда я купил обувь; очки, когда я купил очки и случайные книги, когда я купил книгу.


В то же время ML мог показать товары, которые сочетаются с теми что я взял:
шнурки для обуви, одежду под цвет кроссовок, книги, которые покупают люди, у которых такие же интересы и т.д.
upd: те кто покупали телефоны в интернет магазинах сразу меня поймут — ты только добавил телефон в корзину, тебе уже советуют чехол, защитную пленку, PowerBank и автомобильную зарядку


Мне кажется, рекомендательная система — это одна из сильных сторон ML.


Смысл статьи как всегда: "не забивать гвозди отверткой и не закручивать молотком".

Рекомендательная система — пограничная область. С одной стороны алгоритм рекомендаций легко программируется на SQL. С другой стороны тонкая настройка уже требует ML инструментов — в частности нейронных сетей.


И автор в целом прав, когда говорит что лучше бы использовать простой инструмент пока не появится явная необходимость в сложном, да еще с эффектом черного ящика.

Автор слишком безапелляционен.

Такой стиль, внезапно, заходит лучше, чем сухая аналитика.

Не нужно быть столь категоричными в оценке того, что "… тонкая настройка уже требует ML инструментов...".
Потому что понятие "Рекомендательные системы" существовало задолго до "ML". Это всего лишь еще один способ. И, кстати, не самый лучший.

ты только добавил телефон в корзину, тебе уже советуют чехол, защитную пленку, PowerBank и автомобильную зарядку
Это не ML, это тупой поиск на SQL принадлежностей, подходящей к данной модели телефона.

ML — это когда в придачу к веревке советую купить мыло и табуретку. :-)

Мне кажется, рекомендательная система — это одна из сильных сторон ML.
А мне эти рекомендательные системы кажутся просто спамом. Ну кроме самых тупых, просто показывающих подходящие к гаджету аксессуары. Эти, тупые, эквивалентные условию в поиске — ещё хоть как-то полезны. А остальное — только тупо поржать.
А вы им достаточно информации для обучения даете? У меня почти вся реклама релевантная.
Угу, вы верно угадали, почему ML бесполезны. Если иметь одну ML на все магазины и обучать её 10 лет особенностям каждого покупателя — толк будет. Если данных меньше — то не справится не только ИИ, но и живой человек-психолог.

То есть даже человек-консультант при эпизодических покупках может лишь посоветовать что-то а ля SQL-решение, то есть аксессуары, совместимые с основной покупкой.

Может быть когда-нибудь что-то прилично заработает у Яндекса или Гугла. Но пока что качество — ниже плинтуса.

Причем раздражает — безумно. Если я искал (и купил линолеум) — яндекс начинает подсовывать мне этот самый линолеум. А нафига он мне, если я его уже купил? Лучше уж тупая сегментация по полу, возрасту и доходам — там иногда что-то интересное бываеь.
Machine learning в плане рекомендаций работает примерно
вот так
image

Но нет.

Угу. Важный момент — не «купил», а поискал на десятке сайтов. Этого достаточно, чтобы стали массировано предлагать диваны. А вот что диван уже купил — система как раз пропускает мимо ушей.
Надо добавить кнопку «уже купил».
Которая ведёт прямиком на специальный сайт к ворам. Как приглашение посетить дом в отсутствие хозяев.
>ты только добавил телефон в корзину, тебе уже советуют чехол, защитную пленку, PowerBank и автомобильную зарядку

Для этого не нужно ML, скорее всего аксессуары забиты в базу как аксессуары к телефону.
Речь скорее идет не про это. Автор имеет ввиду то, что достаточно большая часть людей используют новомодные примочки для решения элементарных задач. Которые можно решить по другому (в его примерах через SQL)

Еще одна мысль, выраженная не так явно — для решения некоторых задач можно применять простые подходы, вместо навороченных сложных. Инструментарий для решения вшит в систему, его надо просто знать.

О чем умалчивает автор при решении своих проблем — надо вести документацию по тому как и что делается. Это основная затыка такого метода решения проблем. Дело в том, что я сам пользуюсь подобным подходом, и у меня много заданий стоит в CRON-е. Вот их надо как-то систематизировать.
в Rails проект cron управляет gem whenever, и вся систематизация заданий хранится в файле
schedule.rb, где они разбиты на группы, модули и содержат комментарии
в Rails лучше юзать sidekiq-scheduler чтобы избавиться от недостатков крона. Очередь задач более надежна.

Есть такой момент, что при использовании ML документацию вести невозможно, нельзя понять почему после обучения нейросеть дает именно такой вывод на такой набор исходных данных. Не то чтобы это плюс. В результате имеется черный ящик, который работает, вроде бы, но это не точно.

Есть такой момент, что при использовании ML документацию вести невозможно, нельзя понять почему после обучения нейросеть дает именно такой вывод на такой набор исходных данных.

Во-первых, почему вы приравниваете ML к нейронным сетям? Есть и другие алгоритмы, в том числе полностью объяснимые (иногда объяснимость принятого решения является требованием).


Во-вторых, в случае машинного обучения документируется не то, как получившаяся модель принимает решения (потому что она будет регулярно переобучаться), а то, как эта модель выбиралась, какие метрики использовались и должны использоваться в будущем для оценки ее качества (ну и банальные для любой интеграции форматы ввода-вывода).

В-третьих, сейчас уже есть методы, которые поясняют, почему сетка делает такие выводы на конкретную точку данных ;)
Да суть-то в том, что современные айтишники штопают обычные вещи с использование модных технологий не задумываясь даже над вопросом «зачем» эта технология там нужна.
Недавно увидел лэндинг с парой фотографий и контактной формой. И этот лендинг написан на Ангуларе!
Лэндинг был совершенно обычный, хороший верстальщик такой за пару дней сделает с нуля на чистой троице.
А как вам магазин с оборотом 300 000 тыс рублей в месяц, основанный на ВООКОММЕРЦ, но с машинным обучением для анализа спроса? Зачем?
И таким проектов масса. Я понимаю, что часть из них — просто выкачивание денег из заказчика, но остальные — явно глупое следование трендам.
Самообразование не рассматривается? Я недавно хотел уволиться, директор очень не хотел отпускать, дал другой проект не особо технически сложный, но сказал, что могу там делать всё что хочу, если нужно для развития.
А я с автором статьи согласен. Любой инструмент должен использоваться по прямому назначению.
Например: для автоматического чтения заполненного человеком бланка вполне годно и сетку потренировать, а вот обрабатывать статистику по прочитанному, это к SQL.
Я пока к искуственному интелекту отношусь с настороженностью. Во всем, что мы создавали до сих пор, мы точно понимали физику процесса. Впервые люди пытаются создать что- то, чего сами до конца не осознают.
И что же такого «неосознанного» в ИИ?)
Вы уверены, что точно знаете как работает ваш мозг? Как вы усваиваете информацию и обучаетесь ею пользоваться? Как обобщаете, и переходите, от частных фактов, к общим закономерностям? Как вы принимаете решения, особенно в экстремальных ситуациях? Что есть ваша интуиция и как она работает?
А ведь человек пытается скопировать свой мозг. И мало того, что скопировать, еще и доверить ему принимать решения вместо себя.
А ведь человек пытается скопировать свой мозг.

Вообще-то, нет. Подавляющая часть современного ML не имеет никакого отношения к тому, как работает человеческий мозг.

Подавляющая часть современного ML не имеет никакого отношения к тому, как работает человеческий мозг.


Не исключено, что он знает о том как Вы работаете намного больше, чем наоборот. ( шутка ).

В конечном итоге, человек устроен не только из мозга. И по этой причине его мозг работает на режимах кратно хуже оптимальных, это медицинский факт. По этой причине машинное мышление намного более совершенно. Основная проблема при его обучении описана Азимовым довольно давно. Мотивация машины не может отойти в сторону от задачи, для переоценки критерия. Задача бизнеса деньги. Поэтому машина неизбежно в той или иной форме придет к предложению убрать тех или иных пользователей, включая физически.
По этой причине машинное мышление намного более совершенно.

Эээ… нет. Чтобы машинное мышление было более совершенно, чем "неоптимальное" человеческое, оно (а) должно быть оптимальным и (б) должно вообще существовать. Ни то, ни другое сейчас не выполняется.


Мотивация машины не может отойти в сторону от задачи, для переоценки критерия.

У машины сейчас вообще нет мотивации.


Задача бизнеса деньги.

Первая, но не обязательно единственная. Соответственно, и алгоритму тоже ставится не один критерий, но несколько.


Поэтому машина неизбежно в той или иной форме придет к предложению убрать тех или иных пользователей, включая физически.

Нет, потому что это приведет к санкциям для компании, которые экономически невыгодны.

В споре рождается истина.

Что касается слова «санкции», то здесь выгода это важнейший параметр. Если убийство многих людей Ирака привелу к возникновению большого количества очень состоятельных Американцев, то санкции это как раз то «волшебное слово», описывающее механизм уничтожения одних людей, с целью принесения выгоды другим людям. Машины, в этой ситуации, с их неизмеримыми достоинствами могут помочь получателю выгды увеличить эти самые прибыли, при чем очень существенно. Ливия замечательный пример подобной итерации. Издержки на отнятие Ливийской нефти в пользу Американских выгодополучателей были значительно уменьшены, а выгоды значительно увеличены. Так например, один месяц финансирования машины уничтожения и подчинения Ирака стоили США 10 миллиардов долларов в месяц. В Ливии вся операция от начала до конца обошлась в 3-5.

Можно себе только представить, что будет, когда машины начнут подсказывать людям, или выполнять поручения, по уничтожению людей, с целью предотвращения потерь или приобретения выгоды.

Наверное единственное в чем машина уступает человеку, это как раз в мотивационном аспекте.

Суть в том, что машину, принявшую неправильное решение можно обновить, либо лишив сегодняшней версии «сломанного» ума, вставить лучший, и запустить с того места, где она сделала ошибку, либо просто разобрать, засунуть в плавильную печь и получить через какое — то короткое время назад ту же машину, только лучше. У людей есть мотивация ограждать себя от подобных событий.

Поэтому моё личное мнение, что серьёзнейшим преимуществом человека над машиной, в плане мышления, являются не совершенства, в которых машины давно обогнали человека, а как раз в недостатках.
Наверное единственное в чем машина уступает человеку, это как раз в мотивационном аспекте.

Далеко не единственное.


Поэтому моё личное мнение, что серьёзнейшим преимуществом человека над машиной, в плане мышления, являются не совершенства, в которых машины давно обогнали человека

То есть тот факт, что компьютеры до сих пор не умеют мыслить, вас совершенно не волнует?

То есть тот факт, что компьютеры до сих пор не умеют мыслить, вас совершенно не волнует?

Волновать должен тот факт, что на данный момент никто даже не знает, что такое "мыслить".

Это да, никто не понимает до конца что такое сознание, интеллект и мыслить. Однако это абсолютно не мешает оценивать результаты этого всего. Поэтому апеллировать к этому факту ну такое. Человек мыслит, компьютер нет. Однозначный факт.
«То есть тот факт, что компьютеры до сих пор не умеют мыслить, вас совершенно не волнует?»
***
Извините, но это не факт, это Ваше личное мнение. К сожалению весьма невежественное.

С точки зрения профессионалов, машины выиграли в шахматы у человеческого чемпиона мира по шахматам в далеком 1997-м году, на чем возражения по поводу способности машины мыслить закончились.

Вопрос в том, что отдельно взятый процессор может общаться со всеми остальными процессорами в мире. Поэтому эффект предоставления массивов данных одному процессору неизбежно означает предоставление этого массива всем.

Совсем недавно США познакомились с эффектом, который подобный обмен массивами данных может иметь на способность одного кандидата на пост президента США обойти другого кандидата на пост президента США. И они отреагировали на эти способности процессоров крайне негативно.
Извините, но это не факт, это Ваше личное мнение. К сожалению весьма невежественное.

Ну давайте поговорим как вежественные люди. Начнем прямо вот с простого, с определений. Открываем википедию:


Мышле́ние — это познавательная деятельность человека

В принципе, этого уже достаточно, но вот вам продолжение:


Результатом мышления является мысль (понятие, смысл, идея).

А теперь покажите мне хотя бы одну мысль, произведенную машиной.


С точки зрения профессионалов, машины выиграли в шахматы у человеческого чемпиона мира по шахматам в далеком 1997-м году, на чем возражения по поводу способности машины мыслить закончились.

Каких профессионалов? По шахматам? Согласно какому определению мышления оно необходимо для того, чтобы выиграть в шахматы?


Вопрос в том, что отдельно взятый процессор может общаться со всеми остальными процессорами в мире.

Нет, не может.


Поэтому эффект предоставления массивов данных одному процессору неизбежно означает предоставление этого массива всем.

Нет, не означает.


Я не люблю аналогии, но иногда приходится: "Отдельно взятый человек может общаться со всеми остальными людьми в мире. Поэтму предоставление данных одному человеку неизбежно означает предоставление их всем".

Мышле́ние — это познавательная деятельность человека

Это, вообще говоря, не с совсем корректное определение. Мышление — это ощущение, в первую очередь, а не процесс и не деятельность. Человек мыслит тогда, когда он чувствует, что мыслит, и это единственный реальный критерий. Далее мы просто предполагаем, что есть некоторый процесс, который это ощущение вызывает, и называем мышлением уже его. Но вообще нет никаких достоверных сведений о том, что данный процесс действительно можно выделить.

Это, вообще говоря, не с совсем корректное определение.

Я привел определение из википедии, суть которого в том, что мышление, как бы мы его не определяли, принадлежит исключительно человеку.


(кстати, забавно, что англоязычная википедия в этом вопросе придерживается того же мнения, но немного более явно)

Я привел определение из википедии, суть которого в том, что мышление, как бы мы его не определяли, принадлежит исключительно человеку.

Потому что это экстенсиональное определение. Мы не знаем, что такое мышление содержательно, а потому можем определить его только ткнув пальцем: "вот это мышление!", ну а поскольку никаких примеров мыслящих существ кроме человека нам неизвестно, то тыкаем в человека.
Но это не значит, что не-человек не может мыслить, просто если не-человек будет проявлять некоторые свойства, которые нами будут интуитивно восприниматься как "оно мыслит" то и определение сразу откорректируется.

Я подозреваю, что происхождение было обратным: вот у нас есть такая деятельность человека, нам надо ее как-то назвать, пусть будет мышление. Никакого признакового определения этой деятельности мы дать не можем, поэтому у нас нет никакого способа говорить, есть ли "такая же" деятельность у кого-либо (чего-либо) еще.

Я подозреваю, что происхождение было обратным: вот у нас есть такая деятельность человека, нам надо ее как-то назвать

Так деятельность эту как раз никто не наблюдал, по-этому нельзя сказать "вот у нас есть такая деятельность". Мы только предполагаем, что она существует (хотя, может, и нет).


Никакого признакового определения этой деятельности мы дать не можем, поэтому у нас нет никакого способа говорить, есть ли "такая же" деятельность у кого-либо (чего-либо) еще.

Правильно. Но, смотрите, если вы сидите на стуле и спросите у меня: "что такое стул?" и я отвечу: "та штука, на которой вы сидите", то это не значит, что если вы на чем-то не сидите — то это не стул.


Аналогично, если я говорю, что "мышление — это вот такая штука, которой человек занимается во время Х Y и Z" то это не значит, что мышления не может быть у грибов с альфа-центавры.

Так деятельность эту как раз никто не наблюдал, по-этому нельзя сказать "вот у нас есть такая деятельность". Мы только предполагаем, что она существует (хотя, может, и нет).

Э нет. Термин появился для обозначения какого-то существующего процесса или деятельности.


Аналогично, если я говорю

Это сильно зависит от понятийной системы. В вашей формулировке ("вот такая штука, которой занимается") — не значит, но в формулировке "вид человеческой деятельности" — уже значит.


It's complicated.

Э нет. Термин появился для обозначения какого-то существующего процесса или деятельности.

Нет, мы только предполагаем, что такая деятельность есть.


Это сильно зависит от понятийной системы. В вашей формулировке ("вот такая штука, которой занимается") — не значит, но в формулировке "вид человеческой деятельности" — уже значит.

Нет, в обеих не значит. Определение построено точно по тому же самому принципу, как ответ "штука, на которой вы сидите".

Это все уже из области философии. Есть условные градации определения мышления и вы говорите о самом абстрактном определении. Если взять уровень абстракции чисто биологический, то по некоторым признакам можно сказать что у грибов есть мышление. Более абстрактный уровень, например психолингвистика, докажет что у высших приматов есть мышление, хотя и на уровне трехлетнего ребенка. Если говорить о мышлении как о процессах, которые можно изучать в рамках психологии, то тут понятие мышления применимо только к человеку. И круг замыкается: к человеку какого возраста? У детей 1-2 лет есть мышление?
Это все уже из области философии.

А само понятие из философии. Больше его нигде не существует.


У детей 1-2 лет есть мышление?

А что такое мышление? Это некоторый гипотетический процесс, в существовании которого мы не уверены. С-но, невозможно объективно утверждать, что кто-то обладает мышлением либо нет.
Мы утверждаем, что сами обладаем мышлением (т.к. имеем определенные субъективные переживания, которые, как предполагается, являются следствием этого процесса), мы предполагаем, что другие люди тоже испытывают эти же переживания (но не можем быть уверены). Испытывают ли их дети 1-2 лет — непонятно, т.к. мы не помним себя в этом возрасте. Грибы их не испытывают потому, что они в принципе никаких переживаний не испытывают. Для приматов вопрос так же открыт, как и для детей.

Нет, определение мышления не философское понятия.

Экзистенциализм, это философское понятие. Мышление понятие конкретное определяющее род деятельности вполне поддающееся оценке, используя род деятельности, где потенциал мышления одного оппонента измеряется с потенциалом мышления другого оппонента. Шахматы, это один из примеров такой деятельности.
Нет, определение мышления не философское понятия.

А какое? У вас есть какое-то нефилософское (корректное) определение?


Шахматы, это один из примеров такой деятельности.

Компьютер играет в шахматы, но при этом не мыслит.
Кроме того, каким образом вы определяете те виды деятельности, которые предполагают наличие мышления? Почему шахматы, а не прыжки в высоту?

Термин появился для обозначения какого-то существующего процесса или деятельности.

Флогистон, эфир слегка опровергают эту идею.
Флогистон, эфир слегка опровергают эту идею.

Отнюдь. Было нечто, что проявлялось в наблюдениях, и чему было нужно дать название. Просто это нечто неправильно определили.

Отнюдь. Было нечто, что проявлялось в наблюдениях, и чему было нужно дать название. Просто это нечто неправильно определили.

Ну вот и с мышлением может быть ровно такая же ситуевина.

Насчет эфира Вы явно не знаете о чем речь.

Эфир не был обозначением существующего процесса или деятельности. Это была гипотеза, предположение. Её доказательство провалилось.

Шахматы, это род деятельности основанный на мышлении. Утверждать, что компьютер, играющий в шахматы, не мыслит, это все равно что махать на льва платочком и говорить, что его на самом деле нет. К сожалению у некоторых людей процесс мышления не оформился, и пока их этот самый лев не кушает, они склонны утверждать что их левой пятке чешется.
Шахматы, это род деятельности основанный на мышлении.

Одни и те же действия можно выполнять разными способами. Если человек мыслит играя в шахматы, то это не значит, что для игры в шахматы необходимо мыслить.


Утверждать, что шахматы — род деятельности, основанный на мышлении, то же самое, что утверждать будто прием пиши — род деятельности, основанный на использовании столовых приборов.
Животные едят, ergo — пользуются столовыми приборами.


Утверждать, что компьютер, играющий в шахматы, не мыслит

Он совершенно точно не мыслит, т.к. не чувствует.

«Он совершенно точно не мыслит, т.к. не чувствует.»
***
Если мышление, побеждающее в шахматы, измерять приемом пищи, то можно прийти к удивительным открытиям.
Если мышление, побеждающее в шахматы, измерять приемом пищи, то можно прийти к удивительным открытиям.

Верно. Потому и не надо так делать. А то иначе окажется, что мыслить может любая система, способная действовать по заданному наперед алгоритму. То есть, ну, любая система.

Эфир это термин, обозначающий то, чего нет, но предполагалось, что есть по косвенным признакам. (с мышлением человека может быть та же петрушка) А lair в 18907737 утверждал, что термины есть только у существующих вещей и этим пытался доказать, что мышление существует.

Шахматы это игра без случайностей с полной информацией. То есть самый тупой вид игр из возможных. Просто перебор затруднён количеством вариантов.

Компьютер же в любом случае исполняет алгоритм. Игра в шахматы это или рисование очередного кадра из стрелялки — разница не велика.
Остаётся понять, по каким признакам некоторые алгоритмы можно назвать мышлением?

Или мышлением можно называть только специфичный химический процесс? тогда им обладают все живые (ну или живые с мозгами) и пытаться повторить его на компе не то что невозможно, но и бесполезно. А повторять надо некую модель этого процесса, которая приводит к интересным решениям у животных, для которой термина нету.
Логическая ошибка.

Человек играет в шахматы -> человек мыслит -> шахматы — это мышление;
Машина играет в шахматы -> машина мылит;

На самом деле человек, играя в шахматы, тоже лишь перебирает варианты и стратегии. Просто машина перебирает больше и быстрее.
Программ, которые играю в шахматы множество. Есть программы, которые никогда не обыграют шахматиста КМСника, но в 100% случаем обыграют меня. Можно ли сказать что у такой программы есть мышление?
Шахматы, это род деятельности основанный на мышлении.

Прямой перебор всех вариантов — это мышление?

А Вы думаете Магеллан обошел земной шар с помощью некоего магического фокуса, а не пройдя водную гладь, шаг за шагом. Или по Вашему его доказательство того, что Земля круглая не было проявлением мышления.

Я думаю, что вы подменяете процесс мышления и результат этого процесса.

В википедии это определение уже прямо со старта гвоздями прибили К ЧЕЛОВЕКУ. Если же мы примеряем его по отношению к машине… оно уже будет иным. И по правде должно быть иным — нужно такое определение в котором не было бы привязки к ЧЕЛОВЕКУ и только тогда можно сравнивать мышление человеческое и машинное.
В случае с шахматами — машина таки мыслит, но в очень узких рамках заданных самой шахматной игрой, в результате появляется мысль-решение какой сделать ход. Но эта же машина не может победить человека в другой деятельности где так же нужно мышление — человек оказывается гибче.
И по правде должно быть иным — нужно такое определение в котором не было бы привязки к ЧЕЛОВЕКУ и только тогда можно сравнивать мышление человеческое и машинное.

Но такого определения нет, и поэтому такое сравнение невозможно.


В случае с шахматами — машина таки мыслит, но в очень узких рамках заданных самой шахматной игрой, в результате появляется мысль-решение какой сделать ход.

Чем это отличается от "мышления" калькулятора, который "знает" результат данного ему выражения?

Машина не знает результат, она его определяет перебором и/или по шаблонам практически так же как это делает человек. Ладно шахматы, тут хотябы есть смысл какие-то варианты перебирать. Взять к примеру игру Го. Там ни вычислениями ни перебором не выиграешь. Тут уже нужно стратегии развивать.
Машина не знает результат, она его определяет перебором и/или по шаблонам практически так же как это делает человек.

Результат выражения. Перебором.


А если вы считаете, что выполнение алгоритма — это "по шаблонам практически так же как это делает человек", то, гм, станок Жаккарда тоже "мыслит".


Взять к примеру игру Го. Там ни вычислениями ни перебором не выиграешь.

Тем не менее, AlphaGo использует именно вычисления (нейронные сети) и перебор (метод Монте-Карло для поиска в дереве).

А вы в состоянии объяснить, почему нейросеть дала такой ответ а не другой? В четких алгоритмах есть понимание как они работают. Если такое понимание в нейросеть? Или это просто "магия чисел"?

Во-первых, понимая работы человеческого мозга нет ни у кого, поэтому сравнивать сетки с мозгом — по определению глупость.

Во-вторых, то, что архитектуру нейросети пытаются сравнить с «архитектурой» мозга, это просто удачный пиар ход и допущение. Алгоритмы работы совершенно другие. ИИ объясняют на примере архитектуры мозга потому, что так проще объяснить.

В-третьих, любая сетка — это набор алгоритмов и вычислений, которые основаны на жестких правилах, которые разработаны человеком. И ничего магического там нет.

В-четвертых, если хотите понять «как» — возьмите данные на входе, перемножте на все веса всех слоев и получите 100% точный ответ, почему получен такой результат. Сможете ли вы осознать почему именно такие веса использовались — нет, и только потому, что на обучение подавалось слишком много данных, чтобы человек физически смог сам выявить в них закономерности. Но ML для того и создан, чтобы обопщать и обрабатывать большие объемы данные, которые не может обработать человек. Но по четким правилам и алгоритмам. Никакой магии там нет.
В-четвертых, если хотите понять «как» — возьмите данные на входе, перемножте на все веса всех слоев и получите 100% точный ответ, почему получен такой результат. Сможете ли вы осознать почему именно такие веса использовались — нет, и только потому, что на обучение подавалось слишком много данных, чтобы человек физически смог сам выявить в них закономерности.

Здесь вообще есть такой момент, как повторяемость. То есть — окей, что мы не понимаем, почему именно такие веса, но мы должны понимать, как мы к ним пришли и суметь повторить. А учитывая что алгоритмы обучения сейчас стохастические, то в итоге две сетки обученные по одному и тому же алгоритму с одними и теми же параметрами на одних и тех же данных могут привести к разным результатам. И вообще в итоге обучение сложной сети приходится проводить под постоянным человеческим контролем (то есть "без учителя" это на самом деле нифига не без учителя, учитель там есть, целый отдел учительский).
При этом, как и у любого учителя, возникает проблема контроля знаний. На данный момент для сложных задач нет никакого способа достоверно убедиться, что сеть усвоила то, чему вы ее учили.

1. Понять как пришли к весам очень просто — достаточно понимания принципа работы алгоритмов первоначальной расстановки весов, целовой функции, функции активации и метрик их балансировки.

2. Стохастика определяется параметрами RNG. Установите констатное значение RNG — получите повторяемый процесс обучения сети.

3. Не подменяйте понятия. В методике обучения сетей: «без учителя» — когда нет известных целевых значений, «с учителем» — когда есть известные целевые значения. Вопрос только в том, что пытается сблансировать сеть — кластерные характеристики или целевую функцию.

4. Есть целвеая функция, есть критерии / метрики / методы её оценки. Правильное определение целевой функции, контроля её допущений и метрик оценки — и любой аналитик имеет полный арсенал методов убедиться в том, что он на выходе получил ожидаемое.

Мой ключевой месседж — то, что мы не можем что-топовторить (ввиду физических ограничений) не означает, что мы не понимаем, как это делает сетка.
НЛО прилетело и опубликовало эту надпись здесь
Просто пример: вы сможете в уме разделить 32432749324 на 234239408? Врядли, по результатам калькулятора ведь доверяете, правильно. И вы даже можете не знать, как он это делает — в столбик, остатками и т.д. Но вопросов не возникает. Изучите теорию нейросетей и все вопросы отпадут сами собой
Нейросеть — нет. А вот латентно-семантический анализ или градиентный бустниг над решающими деревьями вполне понятные (не мне =) ) алгоритмы, которые тоже относятся к ML.
Вообще, согласен. Зачем заминусовали Вас не понятно. Действительно, обычный функционал на основе данных можно реализовать при помощи SQL. Вся соль ML заключается в том, что когда логики с данными уже много, т.е., например, логика зависит от поведения клиентов, и это поведение иногда меняется, то логика на SQL над этими данными устаревает быстрее, чем вы реагируете на это поведение. Далее вы переписываете логику над данными, подстраивая ее под новое поведение клиентов, возможно, для вас это будет дорого. Это то, что касается классики работы с данными, например, с использованием SQL. Если же вы используете ML для реагирования на поведение клиентов, то при изменении поведения, на самом деле во всей внутренней математике этого самого ML логика выстраивается сама на основе этих данных, и не нужно ручками ничего переписывать, мы вовремя среагировали на поведение клиентов и попали в ЦА. Поэтому если данных не очень много, и проще использовать SQL -используем. Если данных много и SQL использовать затратно, а также интересно не явное поведение клиентов — используем ML. Примерно так.
дык а причем тут ML, это лишь один из методов. У нас в ЛЭТИ отдельный курс был по распознаванию лиц, нормально все распознавали
НЛО прилетело и опубликовало эту надпись здесь
страшно подумать, что будет предлагать «SQL-запрос», если купить две пары кроссовок, и три раза солнцезащитные очки…
а вот у ИИ есть интересные варианты…
Хотя и полностью отвергать простые запросы (т.е. «старые известные технологии») нельзя.
НЛО прилетело и опубликовало эту надпись здесь

А если у вас тысячи наименований и при этом есть нетривиальные корреляции? Например, если человек купил А и Б, то он склонен купить С, но если при этом он еще купил Д, то вместо С надо Е.
Кто будет эти правила забивать, и главное, откуда он вообще их возьмет?

НЛО прилетело и опубликовало эту надпись здесь
Возьмёт он их, собственно, из статистики и выберет главное.

Ну так это и есть machine learning. Он же включает не только модные нейронки, но и подходы вроде байесовских сетей или экспертных систем, которые уже десятилетия назад себя зарекомендовали. С-но, ваше предложение ниже:


ну и? собираешь на год команду правило-мейкеров. Потом смотришь, где проценты просмотра подобных товаров наименьшее, и стараешься исправить.

это типичный ml.


Зачем тогда думать над сложной математической моделью, если можно составить простую логическую?

Ну будет не сложная мат. модель, а простая. В чем разница?

>Кто будет эти правила забивать, и главное, откуда он вообще их возьмет?

Если говорить об ИИ, то рекомендации будут на основе поведения конкретного человека. Но в том и «глупость» — чтобы натаскать сетку на конкретного человека, нужны большие объемы данных (его трафик и его конверсии). Эти данные есть у поисковиков. Но на обычных сайтах чтобы собрать такой объем потребуется… ну оочень много трафика и конверсий этого конкретного человека. Именно поэтому рекомендательные системы пишутся на основе различных эвристик и прочих коллаборативных фильтраций, основанных на статистике.

Для нетривиальных корреляций как раз уже нужен AI. Потому что sql для этого слишком structured. Я понимаю, статья о том, что в элементарных вещах его вполне достаточно. Иными словами, можно сделать запросы на основании имеющегося жизненного опыта и наблюдений. Но с AI всё же интереснее, покуда эти самые наблюдения и опыт он обретает сам, без участия программиста. Например, если человек купил вино и шоколад но не купил презервативы — на основании статистики он может через 40 недель предложить ему памперсы и детское питание (а может и не предложить).

вручную — замучишься.
я вот навскидку могу добавить правила типа «купил очки и/или кроссовки» — предложить шорты/панаму/плавки. покупал раньше детские кроссовки и купил очки — предложжить детские очки. купил детские плавки/купальник или надувной круг -предложить водный пистолет. и еще 100500 различных подобных правил.
НЛО прилетело и опубликовало эту надпись здесь
а через год меняется один из поставщиков, или из ассортимента выводится (вводится) другая группа, и все переписывать заново…
кстати, хорошая идея для самообучения. только где бы взять датасет…
НЛО прилетело и опубликовало эту надпись здесь
AI масштабируется, а ваш подход не масштабируется. С ростом магазина просто потонете в этой бессмысленной работе. Вот у вас к примеру 10000 SKU в магазине, и каждый день 1000 из них выбывает и столько же прибывает, их всех надо сопоставить ВРУЧНУЮ с оставшимися(обычный SQL вам не поможет отличить мочалку от тазика или очки от футболки) и придумать правила комбинаций. Это работы на целый штат сотрудников. При росте магазина становится всё только хуже. И библиотеки не помогут, поскольку между магазинами может не быть вообще каких-либо общих SKU и информация с другого магазина вам ничем не поможет.
Веселья добавляет ещё групповая покупка — когда несколько человек для удобства покупают через чей-то один аккаунт совершенно разные товары, которые создают очень интересные комбинации вплоть до несовместимости.
НЛО прилетело и опубликовало эту надпись здесь
возможно амазон пользуется и AI, и списками, но больше всего он полагается на «люди купившие это, так же купили».

Ну так FBT — это один из стандартных кейсов для ML, потому что зависимости выявляет машина.


Есть маленькие магазины, у которых никогда не будет того самого роста.

… и которые зачастую были бы рады купить сервис по продуктовым рекомендация или восполнению складов, чтобы уволить тех людей, которые занимаются ведением списков.

А скуль уже не может выбрать «для всех корзин (всех клиентов) в которые входил товар, купленный данным клиентом вывести табличку товар — число покупок и запустить в рекламу этому клиенту по 5 штук в неделю с топа и вниз»
Мне кажется полезнее брать не топ того что входит в корзины с тем же товаром, а брать корзины максимально пересекающиеся по товарам, а уже сверху этого можно и топ товары.
для всех корзин (всех клиентов) в которые входил товар, купленный данным клиентом вывести табличку товар — число покупок и запустить в рекламу этому клиенту по 5 штук в неделю с топа и вниз

Может. Однако есть два нюанса.


  1. представьте себе, что данный клиент кликнул на товар из нашей рекламы, и мы теперь хотим, чтобы у остальных клиентов с похожими выборками это товар был ближе к топу
  2. представьте себе, что мы хотим сделать все то же самое не для конкретного товара, а для похожих — то есть, если клиент купил кроссовки Абибас, то мы хотим учитывать заодно и корзины с кроссовками Нук (ну потому что носки все равно нужны и тем, и другим)

И да, это тоже можно сделать на SQL. На нем вообще почти все, что угодно можно сделать. Просто иногда уже проще начать использовать другие инструменты.

ибо придется класссифицировать мочалку и тазик по куче разных ортогональных признаков (которые надо еще придумать).
а совместная покупка действительно добавит веселья — и магазину, и покупателю…
Вот, это ближе к ответу. Вопрос в масштабах. Если это новый мелкий бизнес, то SQL + клиент с разного рода алгоритмами — это чуть лучше, чем бумага и excel. Но, это работает, если объемы не большие. В том случае, если за первый год, бизнес-модель показала свою состоятельность, то можно и нужно думать внедрять ИИ с МО. В целом принятие таких решений может занять до 5 лет. А сразу лепить ИИ/МО — это слишком сложно. Да, если уставной капитал исчисляется миллионами долларов и планы расписаны на 10 лет, то SQL — это будет потерей времени и ресурсов.
да-да-да! и либо скоро назойливая реклама исчезнет как класс, либо будет «купил кроссовки — увеличь пенис, и выучи английский !»
Если кроссовки брендовые, пенис увеличивать вовсе не обязательно.
Какую библиотеку? 100500 лет работают паттерны «С этим товаром смотрели» и «С этим товаров купили». Нафига усложнять все? Статья именно об этом: прежде чем пилить блокчейн с диплернинг на бигдате, стоит повспоминать/подучить проверенные практики.
НЛО прилетело и опубликовало эту надпись здесь
Ну, рекомендации такая штука, которая в принципе не выстрелит сто из ста. А количество шлака «легко» минимизируется. Сегментация пользователей по группам, сегментация правил рекомендаций по группам пользователей, сегментация по истории посещений внутри группы пользователей, сегментация по… да по чему угодно. Естественно это должен делать грамотный маркетолог, а не разработчик, который руководствуется своими догадками.
отсюда вопрос: с чем легче «договориться» маркетологу?
Не понял вопроса.
для какого инструмента маркетологу легче поставить задачу?
маркетологи — люди своеобразные… вот сколько они мне в свое время (после я просто перешел в другую область) задач не ставили — формализовать задачу было порой весьма нетрииально… сейчас вот захотелось поднять старый список задач, и попытаться решить их на ML/
>для какого инструмента маркетологу легче поставить задачу?

Опять не понял =)
Он, маркетолог, работает со статистикой и выдает рекомендации. Как они реализуются — вопрос разработки.

>попытаться решить их на ML

Алгоритмические рекомендательные системы (SQL) на вход получают только статистику. Маркетолог — статистику, свой опыт и здравый смысл.

ML это попытка заменить маркетолога и как-то прикрутить на вход «опыт». А «здравый смысл» задается в исключениях. Например не стоит предлагать холодильник через пол года после покупки холодильника. Или ласты зимой, несмотря на то что летом шорты+ласты заходят на ура, тогда как зимой шорты покупаются для спортзала и ласты в предложке уже безумство, а не cross-sell.

И вот эти самые исключения и есть самое узкое место в ML. Например коллаборативная фильтрация «увидит в статистике», а маркетолог поймет из опыта (или тоже из статистики), что генератор для Приоры можно предлагать хоть каждые 2 месяца, а для Тойоты не стоит вообще его рекомендовать. А чтобы обучить таким исключениям ML нужен нехилый такой датасет. Поэтому я не верю в то что ML лучше. По крайней мере для относительно небольших сайтов и сроков. Если это Амазон и задача за год натаскать сетку, то возможно.
зато если «зимой плавки+чемодан» — то можно предложить и ласты. а холодильник через пол-года — это примерно как кроссовки через три месяца…
в общем, попробую в самообразовательных целях попытаться — может, чего и получится…
>зато если «зимой плавки+чемодан» — то можно предложить и ласты.

Нельзя. И маркетолог, и SQL движек это поймут — движек из статистики (предлагали, не заходит), а маркетолог из опыта (на курорт со своими ластами не ездят). ML тоже научится, но сроки…

В академических целях это безусловно классный опыт. Удачи.
ML тоже научится, но сроки…

Те же, что и у "движка" — если есть статистика "предлагали — не заходит", то она уже есть.

Тогда зачем вкладываться в ML, если можно дешевле в движек?

При подходе «конверсия B при А+В >5% — кидаем в рекомендации» ML не нужен. Он нужен в случае если мы хотим «конверсия B при А+В <2%, но вот конкретно этот персонаж/сегмент конвертнется с вероятностью >80% — кидаем в рекомендации». Вот это пример «обученного». Для этого нужен датасет именно этого человека/сегмента.

В этом случае будут точечные рекомендации и получится избавиться от маркетолога, ради чего, собственно, все и затевается.
Тогда зачем вкладываться в ML, если можно дешевле в движек?

Во-первых, еще надо доказать, что дешевле. Я вот даже не буду пытаться на SQL посчитать feature matrix для рекомендаций, а уж тем более — построить по нему расстояния, хотя на питоне это работает только в путь.


А во-вторых, это вообще некорректное противопоставление, потому что когда вы вытаскиваете закономерность из существующей статистики автоматически — это уже ML. A и B — признаки, конверсия — существующие показания, 5% — порог отсечения для классификатора.

Но и тут опять все упирается в сегментирование трафика: в северном климате не работает предложка, которая на ура заходит в южном. Например. Откуда ML возьмет это исключение? Маркетолог задаст. Так, стоп, мы ж хотели заменить его на ML…

Да, он конечно же обучится сегментировать сам. Со временем. Но это уже вопрос готов ли бизнес ждать.
А «здравый смысл» задается в исключениях.
Наверное, не только в них.
Маркетолог может сформулировать рекомендацию вида «с этим товаром обычно забывают купить...»
А такой ML-алгоритм, по-видимому, невозможен. Хотя не знаю, как у него коммерческая эффективность.
Но вот к только что купленному принтеру предложить дополнительный комплект картриджей — казалось бы, предсказуемая глупость, которую МО на статистике не сделало бы, а на самом деле постобслуживание информацией о продукте).

Для корректного ранжирования "с этим товаром смотрели" и "с этим товаром покупали" как раз ml (а конкретно — нейронные сети) нужен.

Просто, реальные правила, которые можно изменить — лучше закрытого механизма AI,

Довод из восьмидесятых. Экспертные системы (с ручными правилами) заняли свою узкую нишу, но мало кто уже скажет, что они лучше ML.


Но опять же, хотите делать экспертную систему — пожалуйста, пробуйте. Потом напишете на Хабре историю успеха (имхо, вряд ли).

Маленькое замечание. Я скажу что пока нельзя утверждать, что ML лучше старых экспертных систем из 80-х. )
Не мало ведь уже критических статей на тему ML. Так же не приведете пример истории успеха для ML. Не далее как вчера упоминался Watson IBM в несколько ином свете. А ведь замахнулись на медицину.
Да и нам всем тут не нужно меряться "длиной"… Скорее поразмыслить ПОЧЕМУ? Ведь мы все (надеюсь) стараемся сделать не только ради тщеславия, но и ради пользы свои продукты. Поэтому анализ почему не взлетело или не взлетает очень даже необходим.
Надеюсь никто не станет возражать против того чтобы не изобретать колесо заново? Прошлый опыт интересен. Более того, и в 80-х были идеи, которые не получили должного воплощения в автоматизированных системах. Не созрели еще технологии. А просто взять и отмести не изучив… Помнится в университете мы проходили основы основ математики, которым сотни лет.
И, как всегда, из практики. Несколько раз видел как разработчики изобретали квадратное колесо. Потом они уже начинали изобретать восьмигранное… и все еще деревянное. На следующей итерации они изобретут 16-ти гранное. Далее не буду продолжать. Когда они доберутся до каучука один Бог ведает. Боюсь, могу и не дожить. А причина в том, что существует убежденность в том, что они создают нечто уникальное и чужой опыт им не нужен. Хотя, очевидные методологии и техники уже эксплуатировались еще до их рождения. Хуже, что и слышать они не хотят об этом.

Я скажу что пока нельзя утверждать, что ML лучше старых экспертных систем из 80-х. )

Можно, конечно. В рамках обсуждаемой задачи (рекомендательная система для интернет-магазина) кто сейчас вообще будет использовать экспертную систему? Есть истории успеха? А простейшую коллаборативную каждый каждый третий, наверное (или более быстрые варианты).


Вот серьезно, кто-то вручную задаёт правила? Хотел бы узнать, если такие примеры есть.

Я приводил пример медицины. ) Есть. История успеха, скажем, была. Мне было очень интересно изучить. Тем более, что я общался с реальными участниками событий. В том числе и с людьми, которые занимались вопросами со стороны государства. В том числе есть и истории, когда кто-то получил и гос. награду…
И, кстати, только одна из историй, когда произошел взрыв и использование экспертной системы позволило спасти многие жизни уже достаточен. Не все ведь меряется деньгами.)

И получается проект на год и десяток миллионов. Вам никто не запрещает так делать, конечно. Почему так обычно не делают (ну я не слышал про такие истории)? Коллаборативную фильтрацию можно внедрить за пару месяцев силами одного программиста.

Тут как раз AI выгоднее — можно искать корреляции автоматически. Но AI в этом контексте — это не нейронные сети, а вполне детерминированные алгоритмы кластеринга, сегментации и т.п.
НЛО прилетело и опубликовало эту надпись здесь

А можно и не вручную. Простым запросом на тему "с этим товаром также часто покупают".

Это называется кластеринг и относится-таки к области AI/Big Data. При этом AI != ML, т.к. в общем случае никакого обучения нет.

Вы никогда не слышали термин unsupervised learning? Если что, алгоритмы кластеризации сейчас принято относить именно туда.

Это такая мантра для инвесторов, а на деле — примерно как утверждение что теория асимметричной криптографии (или вообще — простых чисел) относится к криптовалютам.

Ну да, ну да, а логистическая регрессия — это статистическая модель, а матричное разложение — задача из линейной алгебры.

Потому что рано или поздно вы задолбаетесь составлять и поддерживать эти таблицы.

А вот тут как раз ML поможет. Хотя опять же — посмотреть что еще покупали люди, которые купили очки шлепанцы и книги, можно и с помощью SQL и предложить человеку, например, солнцезащитный крем. Или зонтик от солнца, потому что обычно это идет в наборе покупок у других людей.
Чтобы ИИ научился предлагать что-то интересное, нужно данных на сотню терабайт.
вполне подойдет аналог ф-ии «с этим товаром покупают...» для работы достаточно sql
Если говорить об ИИ в рамках одного, пусть и очень большого интернет магазина, у ИИ шансов сделать точное предложение едва ли не больше, чем у SQL запроса. Из того, что я купил кроссовки, совсем не следует, что я занимаюсь спортом, а если перехал в гористую местность, совсем не значить, что я встану на горные лыжи.
Другое дело поисковые системы. С ними мы общаемся чаще, и спектр запросов шире. Здесь есть где разгуляться аналитикам, и SQL здесь явно недостаточен.
НЛО прилетело и опубликовало эту надпись здесь
Потому что с ненулевой вероятностью человеку нужна будет и ВТОРАЯ пара обуви, не обязательно такая же как купил — для занятия спортом, велосипедная или зимняя. То же самое касается и очков. Одни купил, но вероятно через месяц захочет другие очки уже не тёмные а прозрачные для езды на велосипеде. Или первые поломал. Обувь, очки — это считай расходники. Их будут покупать и покупать…
а если купил две пары — значит, понадобится еще две. итого четыре. и так в геометрической последвательности…
или купил кроссовки — начинаем предлагать валенки и шлепанцы?
купил кроссовки для баскетбола — аксессуары для баскетбола и вторая пара через 3 месяца или когда скидка. Купил 2 пары туфель — предложение через время, когда есть скидка. Геометрическая прогрессия — это какой-то средний-крупный опт. Эти все алгоритмы — очень своеобразные ибо держаться на вкусах и предпочтения. А о вкусах не спорят. И говорить, что при покупке кроссовок тебе не понадобятся шлепанцы — не корректно. На самом деле, может понадобится очень много, о чём даже сам человек не догадывается.
для того, что бы определить, что «кроссовки для баскетбола» — они должны быть как-то классифицированы.
«купил кроссовки — начинаем предлагать валенки и шлепанцы» <> «говорить, что при покупке кроссовок тебе не понадобятся шлепанцы — не корректно»
я про то, что «купил кроссовки — предлагаем еще кроссовки» глупо, но «купил кроссовки — предлагаем все, кроме кроссовок» еще хуже.
вот я реально позавчера купил кроссовки. сегодня мне нужна зубная паста. это не свяжет ни SQL, ини AI. а вот предложить средства для чистки кроссовок — вполне по силам обоим.
купил кроссовки — предлагаем еще кроссовки» глупо
Я написал о том, что нужно и можно предлагать через время. За лето, на асфальте я могу стереть подошву. Так и было в прошлом году, в сентябре купил другую пару, по скидке. Но я бы купил текущие, но скидок не было.

а вот предложить средства для чистки кроссовок — вполне по силам обоим.
а я о чем писал?
купил кроссовки для баскетбола — аксессуары для баскетбола и вторая пара через 3 месяца или когда скидка.
Это барахтанья о том, что кто-то предложил не правильный алгоритм, в общем и целом — просто вкусовщина. Не эффективно для 99% — так и быть, но даже 1% — это много. Тупая раздача листовок — это 3% эффективности. Но они работают и их раздают.
Например, арбуз. Кроссовки то баскетбольные, а мяч круглый. Арбуз тоже (с некоторыми допусками, конечно)
Плюс это один из тех очередников на особое место в аду из-за которых пришлось изобретать режим «ночной, не беспокоить» на телефонах пару лет назад. Емейл, у него, ссссука, по крону в два часа ночи, чтобы покупатель проснулся и обрадовался… прямо руки тянутся лично дров ему купить.
Вообще вся статья написана каким-то махровым ретроградом. Нет, я конечно согласен с основным посылом о том что не надо пихать AI/ML везде где только можно, но примеры которые он приводит уж совсем из девяностых интернета. Так и кажется что следующее предложение упомянет скрипты на перле в /cgi-bin/ для apache с нежностью и теплотой, как родных детей. Все-таки крайности это плохо с какой бы стороны они не стояли. Аргументировать крайность использования AI/ML там, где это не нужно, крайностью «в наше время у всех было по 640 килобайт памяти и этого было достаточно!» — тоже аргумент так себе.
Именно.
Если они добавили товар в корзину, то имели намерение его купить. Каждого потенциального клиента надо обязательно догнать и трижды осчастливить, невзирая на отчаянное сопротивление.
Впрочем, упоминание валюты определенной страны как бы намекает, там богатый опыт поиска клиентов в сети, знаете ли…
Плюс это один из тех очередников на особое место в аду из-за которых пришлось изобретать режим «ночной, не беспокоить» на телефонах пару лет назад. Емейл, у него, ссссука, по крону в два часа ночи, чтобы покупатель проснулся и обрадовался…

Я сначала тоже так подумал. А потом увидел что они измеряют результат и получают таки увеличение продаж. Значит это таки работает, им очевидно важнее вернуть 25% своих клиентов, и плевать на остальные 75% которые и так ничего бы не купили.

К тому же, может быть это опыт страны в которой интернет на телефоне у менее 1% населения (не пинайте, я не знаю как там в Нигерии). Если 99% клиентов получат письмо утром — то всё отлично (как и написано в статье).
Емейл, у него, ссссука, по крону в два часа ночи, чтобы покупатель проснулся и обрадовался… прямо руки тянутся лично дров ему купить.

Тут вы как-то зря наезжаете. Про смс-ки ночью еще понятно. Но емейл — вещь не мгновенная и не срочная. Оповещения на емейл не должны быть громкими и тем более работать ночью. Как быть с письмами из магазина на другом конце света, в другом часовом поясе? Это плохая настройка телефонов, а не магазина, отправляющего письма в 2 часа ночи.

нафига мне ещё одни очки и вторые кроссовки, если я их только что купил
Они вам нужны. Только не сейчас, а чуть позже. И это тоже можно «предсказывать» с помощью SQL.

Часто проблема в том что когда они мне станут нужны этой модели уже не будет (не знаю в чём смысл смены моделей по два раза в год, но ни одной модели удобных для меня кроссовок через год после покупки найти было невозможно. :)

Через SQL делается интересный запрос, через который вытягивает все те товары, которые покупают люди тех же +- критериев как текущий покупатель после того, как (если данных много) купили А и Б во время года В.
Уверен "ИИ" жирный скрипт от "рога и копыта" будет стоить дороже, чем тот SQL, тратить в 5 раз больше ресурсов, но выполнять то же.

Самое интересное в этом "интересном запросе" — это пункт "тех же критериев".

Иными словами… рисуем_сову_в_два_этапа.jpg

Ну, так голова для чего?
В правильно спроектированной базе я не вижу проблем или тормозов для поиска той или иной инфы.
Далее есть Oracle с PL/SQL.

Недостаточно правильно спроектировать БД, нужно еще правильно наполнить ее данными. А за это отвечает далеко не тот, кто БД проектировал.


Отдельным пунктом мне интересно, как именно вы будете определять, какие из k "критериев товара" должны совпадать для "тех же" товаров, а какие — нет, особенно учитывая, что категорий товаров n, и у каждой категории "критерии", очевидно, разные.

какие из k «критериев товара» должны совпадать

Ну в статье же сказано: купил кроссовки — будем предлагать еще больше кроссовок
В правильно спроектированной базе я не вижу проблем или тормозов для поиска той или иной инфы.

Инфу еще как-то интерпретировать надо. Какая у вас есть информация о покупателе? Какой-то предельный минимум личных данных, из которых ничего полезного не извлечь, плюс, с-но, история покупок.
Можете сходу назвать несколько своих критериев?

Да, ща, сделаю, сек, падажи меня тут.

Человеку можно рекомендовать то что покупали другие пользователи с этими товарами. Эти выборки можно делать с помощью SQL.
НЛО прилетело и опубликовало эту надпись здесь
За это надо расстреливать на месте.

С чего вдруг?
Не вижу проблемы, если предлагается не просто тотже товар, а его альтернативы (Кроссовки -> шлёпанцы, тапочти, обувь на следующий сезон (Ботинки, например)).
Или просто другие модели. Вполне возможно, что чтото понравится больше, чем то, что купил.
Или клиент захочет купить обувь для детей/друзей/родителей/себя…

С остальными категориями также.
Тоесть тут вопрос именно в предложении товара из тойже категории, а не «Точно такое, как уже купил».
До кучи вполне можно опираться на личные данные клиента — Дату рождения и пол, которые почти всегда заполняются в личном кабинете, и предлагать товары для соответствующей категории.

В общем — никакого ИИ. Только собственная голова на плечах и умелое оперирование имеющимися данными.
На кой черт мне второй холодильник если я только первый купил?
На кой черт мне второй холодильник если я только первый купил?

Ну не себе, так друзьям/родным/детям/внукам…
Хотя да — хорошим тоном было бы предлагать Аксесуары к холодильнику — контейнеры для еды, формочки для льда и т.п.
Ну не себе, так друзьям/родным/детям/внукам…

С тем же успехом можно предлагать любой рандомный товар
НЛО прилетело и опубликовало эту надпись здесь
а когда бумаги не было?

Высекали запросы на камне.

НЛО прилетело и опубликовало эту надпись здесь
не все же так виртуозно пишут SQL запросы.
в этом нужно разбираться. вникать. сейчас это мало кто делает. всем нужны быстрые результаты и минимум усилий
то есть прикрутить и организовать нормальную работу AI\ML, да и разбираться в этом, проще, чем знать SQL на нормальном уровне? да ну бросьте

Основная проблема в том что 2 системы параллельно одному заказчику не ставят, поэтому сравнивать особо нечего и соответственно оценить "нормальность" системы (кроме случая полного отсутствия отклика клиентов) весьма непростая задача.

Похоже автор не совсем понимает задачи и область применения ML. От слова «совсем». Отсюда и статья…
Задача SQL — хранение и извлечение информации. Кстати, обработка этой самой информации не является прямой задачей SQL.
Задача аналитика — формирование гипотез, которые он может подтвердить / презентовать с помощью данных. Для этого он может использовать тот же SQL.
А вот задача ML — выявление и/или подтверждение гипотез аналитика, которые он не может сам выявить/подтвердить/презентовать по причине или их неявности, или слишком большого объема данных и их зависимостей, которые человек физически не способен обработать.

Не путайте мух с котлетами и все будет хорошо. У каждой задачи есть свои методы и инструменты. Вряд ли вы будете использовать SQL, чтобы сделать одну заметку, точно так же, как вы вряд ли будете использовать Блокнот, чтобы отредактировать фото

Тут так же верно утверждение, что вопрос к квалификации аналитика. И к тому же целесообразность применения ML на примере, который привел автор статьи.
Пусть аналитик применяет ML для проверки и подтверждения гипотез. Тогда речь идет о чем-то ОЧЕНЬ крупном. Тогда, может быть, но не факт оправдана теория применения ML как дорогостоящей технологии. Да и аналитик в большом проекте стоит дорого.
И вообще рассуждения уходя в область про "сферического коня в вакууме". ))
Думаю, что никаких мух и котлет нет. Просто есть конкретные задачи и наиболее эффективные способы их решения.

1. ML применим не только к очень крупным объемам данных. На моей практике были модели на основании 20-30 точек, и в этих кейсах без ML было не обойтись.

2. Дорогая стоимость ML тоже отчасти миф — простые методы можно применить хоть в Excel. ДЛя сложных методов есть бесплатные open-source решения, которые потом летят в продакшн точно так же не дорого. Явно не дороже, чем аналогичное решение на стандартной ИТ-инфраструктуре без ML-движков. Можете почитать целую подборку статей i_shutov

3. Я как раз и писал о том, что у каждой задачи и метода есть своя область применения и инструменты. Нельзя утверждать, что задачи ML можно решить с помощью SQL, как это делает автор статьи в самом заголовке. И то, что для подтверждения этого выбран неудачный пример — обычная манипцляция
  1. Ну проявите немного уважение к собеседникам. ) Не таите что за задачи. тем более что из практики. Именно для этого сайт и создан. да и предметное обсуждение всегда интереснее.
  2. Ключевое слово "отчасти". исключения часто подтверждают правило. в целом технология дорогая. Как и стоимость специалистов. Средний менеджер/аналитик, который пользуется excel вовсе не специалист в ML. Спасибо за статьи. Конечно чтение не повредит. )
  3. Согласен с некоторой провокативностью заголовка статьи. Пример из практики всегда удачен. Он может быть спорным. Но все же лучше, чем просто голословные утверждения о том, что одно лучше другого, без примера из той же практики. Все измеряемо и измеримо. И приводя примеры мы можем сказать, что данная технология позволила то то и то то в сравнении с другой. Грешат и сильно грешат диванные теоретики ML тем, что не имеют реальной решенной прикладной задачи. Это не добавляет, а наоборот понижает степень их правоты. Я правоту не исключаю. Потому что всегда смотрю в сторону лучшего, менее затратного и оправданного экономически способа решения поставленной задачи.
1. Построение модели прогнозирования влияния эффекта макро-ожиданий на портфельные показатели финансовой организации. Т.е. некий микс матриц миграции Маркова по которым считался прогноз портфельных показателей и регрессии, по которой считался эффект от макро на матрицу.

2. К сожалению, не могу оперировать точными ценами, но разве развернуть open-source решение на базе R+shiny на сервере будет дешевле, чем развернуть решение на базе SQL + еще какой-то движек нужен для UI? Интуитивно — очень сомневаюсь.

3. Так я это и пытаюсь сказать — нет смысла утверждать, что SQL лучше ML-движков. ДЛя одних задач подходит SQL, для зругих — ML.
Давайте представим пример из полу-практики. Считаем что объективно нужно разработать и процессить в продакшине очень просутую ML модель. Пусть будет линейная регрессия и логит. Можно ли это сделать в SQL? Можно! Есть много гик-статей, где есть примеры реализации в SQL. При этом решение задачи в R или Python — до 10ти строчек кода.

Если задачу можно технически решить каким-то инструментом, еще не факт, что этот инструмент является лучшим выбором для этой задачи.

Вот приведение примеров и дает более наглядно видеть как и для чего применяются различные технологии. И в чем бывают их преимущества и недостатки.
Прекрасные примеры. Из которых становится понятнее почему именно выбранная технология более применима.
А еще курьезы в том, что люди занимаются совершенно разными задачами. И, естественно, рассуждают через призму того, что сами делают. Не делая поправки на те задачи. которые решают оппоненты. Я бы сказал больше — даже не интересуются этим. ))
Из практики могу тоже привести пример. Есть промышленная система написанная на Delphi (не ругайтесь). Скажу просто, что она успешно применяется и отказ от нее нецелесообразен. Для быстрой проверки реализации некоего функционала используется Python в силу того, что достаточно несколько строк, чтобы проверить именно функционал. Не нужны ни формы, ни рюшечки. Но реализация все-равно останется и будет в Delphi.
Это я к тому, что наличие альтернатив не всегда бывает допустимо к применению в конечном продукте. Это риторика, которую в общем комментировать не нужно. ) относится к конкретному продукту. Скажем опыт, который не обязательно заимствовать. Но знать полезно.)

Ну, путает, допустим, не автор, а те, кто пытается все задачи решать через ML/AI. А автор всего лишь напоминает, что иногда другие инструменты удобнее.

Не иногда, а всегда. Почитайте залоголовок — ML не нужен, нужен SQL.

Заголовок — это да. Желтушные заголовки — наше всё.
Но в тексте всё нормально.

Прямо с языка снял, все именно так.
Не так плоха новая технология, как неумение ее применять.
Всегда вспоминается «Идиократия» с Brawndo.
<sarkazm=«ON»>Плохой продажник, в связи с тем, что он не может придумать нормальную концепцию хорошей вещи, берет количеством модных словечек. Да, это работает только на неразборчивых клиентов, но работает же. Рыночек порешал, если продажи растут, значит, все правильно делается.<sarkazm=«OFF»>
Ну разумеется, в e-commerce эффективней такие методы, но как насчёт других областей, где ведётся прогнозирование природных явлений или человеческих действий и т.п.? В областях, где нет цели навариться на потребителях? Имхо, заголовок слишком некорректный.
Никогда не понимал вот этого «навариться на потребителях». Что плохого в том, чтобы заниматься созданием/поддержкой удобного сервиса/магазина для покупок? Как вообще люди представляют себе мир без того самого «e-commerce»?
жили когда-то «без того самого».
е-коммерс — просто один из удобных инструментов для жизни.
Слишком неоднозначно у меня выглядит, но всё-таки я не вкладывал плохой смысл в свои слова.

С одной стороны вы правы, с другой — блокировщиками рекламы и спам фильтрами активно пользуются.

Никогда не понимал вот этого «навариться на потребителях». Что плохого в том, чтобы заниматься созданием/поддержкой удобного сервиса/магазина для покупок?
Между «заработать делая бизнес» и «навариться на потребителях» разница примерно такая же как между банком и мфо.
поезда — непохая штука, вон такой-то завод ими пользуется, руду возит и трубы.
но если у вас маленький огород — то вполне достаточно небольшого авто.
а если дорога раздолбанная, в ямах, а возить надо еще и навоз, то чем дешевле машина тем лучше.
в статье я покажу пару примеров как вместо поезда я поехал на дачу на своем авто и остался доволен.
а в следующей статье помогу понять, что велосипед еще лучше автомобиля и приведу пару кейсов.
НЛО прилетело и опубликовало эту надпись здесь
Статья оставляет впечатление что автор топит за использование только SQL в принципе везде где это хоть как то возможно. Особенно эпичен кейс с рекомендацией товаров той же категории что пользователь только что купил. Не хватает акцента на том что статья именно о том чтобы решать задачи подходящими инструментами, оставляет впечатление желания решать все через SQL.
НЛО прилетело и опубликовало эту надпись здесь
Практически в каждой ветке комментов в итоге идет три противечащих утверждения:
1. ИТ использует ML везде где нужно и не нужно бездумно
2. ML ОЧЕНЬ дорогой
3. ML может использовать ML-специалист, которых мало и они очень дорогие.

Ни у кого диссонанса это не вызывает?

Это что же за компании такие, у которых есть возможность бесконтрольно и без анализа тратить огромные деньги на то, что не нужно + делают люди, которые это делать не должны? :)

Прям чувствую, что заминусуют, но удержаться не смог + может зерно истины в обсуждениях обнаружим
Очевидно, одно из трёх утверждений неверно. Либо ML большинству компаний нафиг не нужно, либо его можно успешно заказать на фрилансе за копейки, либо любому айтишнику хватит мозгов прочитать пару статей по теме и применить какую-нибудь из существующих ML-библиотек.

В магазине на 1000-10000 товаров не нужен SQL, там спредшита достаточно, если уж на то пошло, по крайней мере для описанных задач.
И я не уверен что специалист по SQL сильно дешевле специалиста по ML

Чтобы выявить клиента недели, мы написали SQL-запрос, который находит в таблице заказов запись с самой большой корзиной заказов за неделю. Получив эту информацию, мы отправляем клиенту письмо с благодарностью и прикладываем небольшой купон/ваучер. Угадайте, что происходит дальше? 99% этих людей становятся постоянными клиентами. Мы никогда не нуждались в ML. Просто написали элементарный SQL-запрос — и получили эту информацию.

Ну это, по факту, тоже «L», только не «Machine Learning», а «Human Learning». При применении ML модель будет способна предсказать, какому именно клиенту надо выслать купон, используя массив данных о предыдущих клиентах и купонах. Тут сам человек придумал какую-то фичу и делает работу вместо машины. А вот какая будет эффективность у разных подходов — ещё вопрос. У автора +0.99 постоянного клиента в неделю. Машина может предложить рассылать письма большему числу людей. К примеру, если рассылать письма 10 персонам, а точность модели составляет 70%, то получается +7 постоянных клиентов в неделю.
Что-то аргументы из разряда «нафига попу баян». Пусть автор попробует применить SQL для того, для чего был создан ML — для прогнозирования\предсказаний. Например напишет SQL скрипт, который, например, покажет вероятность увольнения сотрутника в обозначенном будущем, основываясь на всех данных всех сотрудников и\или ситуации в компании\на рынке, календаре событий и еще чем-нибудь. Вот тогда будет шок и сенсация.

Смысл статьи не в этом. Автор пишет про использование ML, там где и без него можно обойтись.


Недавно мне затирали про нейронные сети в анализе ассортимента. Когда сделал им ABC\XYZ анализ в excel за 20 минут — очень удивились.

Я так понимаю, что искусственный интеллект призван автоматизировать труд человека. То, что автор делает руками: пишет запрос, запускает его, анализирует результаты, пишет текст письма, создает рассылку и отправляет ее, то AI должен делать автоматом, на регулярной основе. Кстати, уже есть стартапы, которые делают роботизированный копирайт. Т.е. робот сам определяет, кому и что написать и пишет текст (копирайтеры — скоро ваша профессия исчезнет:)). А в целом, конечно, SQL — мощь, согласна.
Просто часто новомодные технологии используют для обмана инвесторов (т.е. рекламы). Если на всех углах говорят о блокчейне и на это дают деньги, то и юзать его будут многие. Пройдет время и увидим насколько технология живучая.
вспоминаются «нанотехнологии»…
Ну вот, они как бы будут, но будут там где нужно.
Несомненно, чем проще решение, тем лучше. Но, название статьи слишком громкое, ожидал прочесть, что-то более удивительное. Спасибо за перевод.

Так вот откуда берутся эти разработчики интернет-магазинов, которые предлагают мне купить шкаф после того как я купил шкаф. Уж лучше ML чем такой SQL.

Не думаю, что вина на разработчике. Что заказчик попросил, то и запрограммировали. Тут технология вообще не причем.
Технология не причем, но разработчик хвалит такой подход в статье (
Скажем, человек купил пару обуви, солнцезащитные очки и книгу. В рассылке для него мы покажем обувь, солнцезащитные очки и книги.
), а с чего он взял что мне нужна вторая пара обуви, вторые очки и какая-то книга (непонятно как подобранная, та же что я уже купил? или ORDER BY random limit 1?)?
Ну я думаю ML не нужен, чтоб предложить полки после покупки шкафа.

… а что бишь для этого нужно?

Специально обученный человек, который будет перезванивать и предлагать. Очевидно же!

"Нет, вам не нужны компьютеры. Вам нужны люди."

Нам не нужна ракета «земля-воздух»!
Нам нужна ракета «земля-самолет»!
О чем речь вообще.
Для каждой задачи свой инструмент, используй то что удобнее и проще для тебя и твоей команды.

Задача T.
Можно решить технологией X, Y, Z.
X — сложно, дорого, не все знают, быстро работает.
Y — просто, дешево, знает половина, работает долго.
Z — средне, средне, знают все, работает средне.
Оцениваем важность каждого показателя, берем тот который набрал больше баллов. Или рисуем три кружка, подымаем голову вверх, водим ручкой в пределах этих кружков и на любимую считалку тыками на искомый вариант.

*Фишка нейронок — они очень и очень быстро решают задачи на которые обучены. Никакой алгоритм не сделает того же с подобной скоростью.
Фишка нейронок — они очень и очень быстро решают задачи на которые обучены. Никакой алгоритм не сделает того же с подобной скоростью.

Это, очевидно, зависит от задачи, "нейронки" и "алгоритма".

*Фишка нейронок — они очень и очень быстро решают задачи на которые обучены. Никакой алгоритм не сделает того же с подобной скоростью.
а можете какую-то ссылку дать или как-то пояснить ваше утверждение?

я утрирую конечно, но если я обучаю нейросеть вычислять сумму двух целых чисел, скажем, в диапазоне от 0 до 1000000 то я уверен что обычный алгоритм сложения сработает значительно быстрее (при одинаковом быстродействии железа, само собой)
Нет линка, есть имхо после прочтения нескольких книг по алгоритмам и просмотра видео докладов на тему нейронок, например — Дмитрий Сошников — Доступный искусственный интеллект на платформе .NET.

Естественно нейронка массив чисел быстрее не отсортирует и т.п. (сходу не могу представить даже как), а вот картинку распознает значительно быстрее поиска ближайших соседей. Это впрос к задаче «Т», что лучше использовать.

И да, я имею неосторожность не учитывать все возможные варинаты вопросов на свои комменты. Продумать ответ так что бы их даже не возникало, ошибаюсь как и все.

И нейронка это такой же алгоритм, как и любой другой, как и поход в магазин, если уж на то пошло. Выше видел что в кавычки взяли.

*Фишка нейронок — они очень и очень быстро решают задачи на которые обучены. Никакой алгоритм не сделает того же с подобной скоростью.


Очень громкое утверждение. Да, работают они гораздо быстрее, чем обучаются, но при этом само решение может быть слишком медленным.

Несколько лет назад делал рекомендательную систему с помощью одного средней тяжести sql-запроса. Если вдруг понадобится сделать рекомендательную систему на текущем проекте, то поступлю также.
Но такое можно делать только на маленьком проекте. На среднем-большом проекте уже идёт битва за каждую десятую и сотую часть процента (в рамках амазона это миллионы и миллиарды долларов).

Почему мы постоянно видим в описании стартапов строку с машинным обучением? Потому что инвесторы планируют вкладывать в создание нового «единорога» (цена компании от миллиарда), а не очередной магазин на тысячу пользователей. Если не добавить, то инвестор будет вас воспринимать как проект на 1000-10000 пользователей.

Статья какая-то слишком маркетинговая (собственно свой маркетинговый опыт автор и описывает в ней), много круглых цифр 25-30% с потолка, много нестыковок и много воды.

Все нестыковки и маркетинговый булшит спрятал под спойлер:
1) «Эффективность отклика всегда была больше 50%». Именно 50%, а не 49.7% или 52.3%. Знакомая история? Когда кто-то хочет придать своим словам вес, то стараются избегать фраз типа «больше половины пользователей», потому что это легко выдаёт незнание реальных цифр, а они в результате неожиданно могут оказаться, не «больше половины», а всего 17%

2) Автор предлагает поверить ему на слово, что его подходы эффективнее, чем машинное обучение, при этом он не делает сравнения с цифрами полученными в результате машинного обучения, а сравнивает с «отраслевым стандартом». На мой взгляд сравнивать со средними показателями по отрасли не очень дальновидно. За несколько лет целая отрасль может схлопнуться может схлопнуться почти целиком за счёт использования новых подходов и технологий.

3) «99% этих людей становятся постоянными клиентами». Аналогично предыдущему пункту, он явно хотел написать «все пользователи», но такого не бывает и легко быть пойманным, поэтому опять берётся цифра с потолка.

4) «Это оказалось более эффективно, чем тратить деньги на рекламу.» Опять же сравнение выглядит как «Tide стирает лучше чем обычный порошёк», но как это доказывает неэффективность машинного обучения?

5) 99% пользователей, которым они отправляли письмо становятся постоянными клиентами, при этом лучший опенрейт, который они достигали 25−30%:
Получив эту информацию, мы отправляем клиенту письмо с благодарностью и прикладываем небольшой купон/ваучер. Угадайте, что происходит дальше? 99% этих людей становятся постоянными клиентами.
Типичный уровень просмотра (open rate) большинства маркетинговых писем составляет от 7 до 10%. Но когда мы хорошо справлялись с работой, то видели показатель в районе 25−30%.

6) много воды, сейчас даже спам приходит персонализированный.
Ещё одна приятная особенность этих писем — то, что мы обращались к людям по именам. Никаких «уважаемый клиент». Только «дорогой Селестин», «дорогой Омин» и так далее. Это придаёт всему оттенок человечности.

Машинное обучение — это наука (не спроста должность называется data scientist), а человек из статьи не использует научного подхода и постоянно оперирует цифрами взятыми с потолка, так не принято не только в научном мере, но и в айтишном.
Можно использовать грамотные sql запросы с эффективностью выше машинного обучения, но тогда нужно сравнивать реальные цифры, а не «общее впечатление».
Но если у вас маленький интернет-магазин с 1000−10000 клиентов, то можно обойтись SQL. Кроме того, специалисты по ML/AI стоят недёшево.

В этой фразе и кроется основная ошибка автора. Он считает, что интернет магазин на 1000 клиентов должен самостоятельно решать все задачи преобразования данных, и, соответственно, миру нужны миллионы забагованных скриптов по поиску клиентов недели/месяца, брошенных корзин, и так далее. Но суть в том, что, при текущей глобальности рынка эфективнее выходит стратегия «бросить все силы на ключевую компетенцию, а остальное купить», и кроме вариантов
1) держать специалиста сомнительного уровня по ML, который пилит модели (сомнительного уровня — потому, что сложно привлечь специалиста хорошего уровня в компанию, где он единственный специалист в своем роде, даже при значительном бюджете)
2) держать специалиста сомнительного уровня по PHP/SQL, который делать запросы, основываясь на здравом смысле,
есть еще
3) использовать для всех перечисленных задач коробочные продукты, авторы которых могут позволить себе хороших специалистов за счет масштаба
К сожалению, третий вариант тоже не без недостатков, ведь когда нет своих специалистов, то коробочный продукт нельзя оценить. Если бы все коробочные продукты были так хороши — в мире не было бы столько случаев когда купившему холодильник реклама предлагает холодильник…
купившему холодильник реклама предлагает холодильник

Хороший пример. Люди привыкли думать, что этот случай — пример забагованности и несовершенства алгоритмов. А по факту — это результат решения задачи с неполными данными. Данные об интересе к холодильнику есть, а данных о факте покупки нет, поэтому, модель работает так, что меньшинство, которое еще не купило холодильник, и кликнет на баннер, должно отбить затраты на большинство, которое уже купило.
Вот как раз неполнота данных — это и есть баг. В архитектуре.
В архитектуре устройства мира? Если интернет магазин не готов продавать/отдавать данные о своих клиентах рекламной сети, или требует необоснованную цену, то как это исправит архитектура?
Никак. Иногда бывает что поставленную задачу решить невозможно в рамках существующих ограничений.
Не усложнять. Это должно быть вбито в подкорку каждого программиста, потому-что программист_строит_дом.jpg — это суровая реальность, и чаще все еще хуже.
За двадцать лет так и не увидел ни одной годной рекомендательной системы — либо эти рекомендации просто бред, либо они не попадают в мои предпочтения ну никак, на чем бы она там не работала, хоть sql или скрипт на перле, или там гигантская нейросеть.
Для себя решил, что нужно бить себя по рукам, как только появляется мысль догнать и причинить добро юзеру. Мечтаю, что когда-нибудь до этого додумаются и маркетологи.
Ребятки, если внимательно почитать статью, то автор не пытается вдаваться в подробности ML, в возможности аналитика, насколько он хорош или плох… Идея в том, что все пытаются следовать моде, и без употребления ML\AI у тебя просто ничего не купят (в плане услуг, продукта), и не потому, что на SQL нельзя сделать быстрее и проще, а потому, что это продается легче и быстрее… Потому, что люди, которые принимают решение по закупке того или иного продукта недостаточно понимают, что они собираются покупать… Автор предлагает не носить круглое и перекатывать квадратное и не более.
Согласен, для каждой цели свой инструмент. Но порой из-за моды, желания двигаться вперед, любопытства или еще по каким то причинам мы начинаем использовать что то совсем не нужное в данный момент.
Хотя рискну предположить, что появление многих новых инструментов связано с желанием как то отличаться от всех. Ведь программирование — это очень просто, как и математика и очень сильно ограничено правилами.
Простая задача, вывести на экран слово «ПРИВЕТ».
1. Можно отобразить нужный набор пикселей.
2. Можно создать шрифт, и с его помощью написать слово.
3. Можно создать объект, который будет уметь отображать строго заданное слово.
4. Можно создать объект, который будет уметь отображать любое слово.
5. Можно создать объект, который будет уметь отображать любое слово и любым цветом.
и т.д.
вариативность решений будет зависеть только от желания выделиться, но результатом будет всего лишь слово «ПРИВЕТ».

P.S. Для любителей машинного обучения хочется напомнить, что машинное обучение тоже описано кем-то, с какой то логикой и развивается в строго описанных программистом рамках.
НЛО прилетело и опубликовало эту надпись здесь
У меня коллега на одной из прошлых работ докладные директору в фотошопе писал.
— Да ну его, — говорит, — этот Ворд. Непривычно, непонятно, мне в фотошопе быстрее и удобнее.
Дизайнер, да.
Эта идея вполне справедлива и для больших проектов, у которых сотни терабайт данных. Особенно если SQL хорошо масштабируется, позволяет сделать десяток произвольных JOIN'ов и отдаёт ответы за секунды или, максимум, минуты.

Статья неплохо показывает, что классика эффективна и сейчас.
Но всё равно остается вопрос «не было бы лучше с AI/ML».
Ведь в этом
написал SQL-запрос, который выбирал всех клиентов с датой последней покупки 3 месяца или более.

Автор поставил задачу — надо сделать рассылку старым клиентам. Ок, не вопрос, задачи должен ставить человек и человек их обычно и ставит.
Потом автор нашел ответ — те кто делал покупки с датой больше 3 месяцев. И вот тут уже вопрос — а не нашел бы AI/ML более оптимальную выборку? Например «клиент больше 2 месяцев покупавший шаверму» и «клиент больше 4 месяцев покупавший беляш»? Совсем не факт.
AI/ML не так что бы сильно нужны в постановке задач, но будучи правильно применены они нередко могут найти более оптимальное решение.
А как бы он нашёл более оптимальную выборку, из каких дополнительных данных, если у автора статьи не нашлось других критериев?
Это ведь такая же глубоко семиотическая и творческая задача, как упомянутый мною выше алгоритм вычисления «к этому товару впридачу обычно ЗАБЫВАЮТ купить»… даже не факт, что вообще имеющая решение, потому что в чём вообще измеряется прогнозируемый показатель? Как Вы определяете «психологическое устройство»/«маркетинговый профиль» человека, которому Ваша рассылка пофигу, а как — того, который вернётся сразу, а как — того, который решил было вернуться через неделю, но не вернётся, а того, который через неделю вернулся бы, если бы Вы в этот период не продублировали рассылку (а теперь прорычит: «задолбали спамеры» и отпишется навсегда)? Призраки театра, комплексные образные модели…
Из объёма данных самого по себе может рациональным научным путём получиться «сделай, как было, только побольше», но Вы предлагаете задачу «сделай, как не было» (покупатель не заходил, не покупал, а тут вдруг купит).

Хороша фантазия у одного из комментаторов выше: «AI способен однажды научиться через сорок недель порекомендовать подгузники тому, кто сегодня покупает вино и шоколад, но не покупает презерватив». Может помочь в планировании рассылки «спящим». Но, во-первых, низкий КПД: большинство не вернувшихся целый за повторной покупкой, которую большинство делает через три недели, уже всё купили — у конкурентов. Плюс, подозрение: чего это интернет-магазин такой заботливый, небось, у них дороже или залежалось? (не в Нигерии, может быть).
Во-вторых, это ведь тоже задачка из разряда «сделай, как не было»…

И для таких задач лучше более очевидные оператору инструменты без «собственного мнения».
Хороша фантазия у одного из комментаторов выше: «AI способен однажды научиться через сорок недель порекомендовать подгузники тому, кто сегодня покупает вино и шоколад, но не покупает презерватив»

так то реал стори типа
www.nytimes.com/2012/02/19/magazine/shopping-habits.html?pagewanted=1&_r=1&hp
About a year after Pole created his pregnancy-prediction model, a man walked into a Target outside Minneapolis and demanded to see the manager. He was clutching coupons that had been sent to his daughter, and he was angry, according to an employee who participated in the conversation.

“My daughter got this in the mail!” he said. “She’s still in high school, and you’re sending her coupons for baby clothes and cribs? Are you trying to encourage her to get pregnant?”

The manager didn’t have any idea what the man was talking about. He looked at the mailer. Sure enough, it was addressed to the man’s daughter and contained advertisements for maternity clothing, nursery furniture and pictures of smiling infants. The manager apologized and then called a few days later to apologize again.

On the phone, though, the father was somewhat abashed. “I had a talk with my daughter,” he said. “It turns out there’s been some activities in my house I haven’t been completely aware of. She’s due in August. I owe you an apology.”


А как бы он нашёл более оптимальную выборку, из каких дополнительных данных, если у автора статьи не нашлось других критериев?
Наличие AI не означает что надо забить на все остальное. AI имея полные данные вполне мог сделать вывод, что «Васи не приходившие 3 месяца уже никогда не вернутся, Пети не приходившие 3 месяца и так вернутся на 4, Димы не приходившие 3 месяца посчитают приглашение спамом» и это позволило бы сделать рассылку более эффективной. Первым прислать что-то повкуснее, со вторыми подождать до 4 месяца, третьим вообще не писать.
AI не надо воспринимать как «42», это не более чем инструмент, который помогает оптимизации задач за счет возможности анализа бОльшего объема данных, чем может человек. Творчеством (пока) безусловно должен заниматься человек, но оптимизация уже выбранного подхода — AI это помощник.
простите, явамниверю.
впрочем…
AI имея полные данные вполне мог сделать вывод

С этим не поспоришь. Полные данные об устройстве Вась и Петь и Дим… о, вряд ли стоили бы не больше маржи за проданный холодильник!
Простите, что домысливаю за Вас — поправьте меня — но Вы, кажется, неявно подразумевали, что Целестин Омин (автор исходной статьи) не сделает точных математически выводов из результатов своей рассылки, и НА СЛЕДУЮЩИЙ РАЗ, если и скорректирует свой подход к выборке адресатов — то не учтёт все критерии категоризации людишек, а вот ML однажды обучится отличать агнцев от Вась.
Ну, тут тоже такое… «призрак театра», в общем. Омин даже не уйдёт и не умрёт на десятой рассылке, допустим, но станет писать ДРУГИЕ тексты рассылки, у которых будет иной диапазон покрытия… Обучившуюся машинку придётся выкинуть.

Несмотря на то, что я тоже не согласен с конкретным случаем замены AI на SQL, в большинстве случаев ML действительно не нужен. Однако не SQL-ом единым. Есть примеры более подходящих технологий, например ProbLog https://dtai.cs.kuleuven.be/problog/

Центр проблемы здесь и правда не SQL или ML, а сам аналитик, его опыт, знание о том, когда уместен тот или иной инструмент. Погоня за хайпом и стадный эффект против критического мышления и развитых компетенций)

Но ведь никто не отменяет и обратной тенденции. Если люди не кричат на каждом шагу, что они постоянно используют SQL, это еще не значит, что они с ним не работают.
Автор совершенно прав, и это крах его жизни. Да, он умеет многое намного лучше AI/ML — но именно потому он дорого стоит (если нет — сам виноват).
Ровно как спецы писать коммерс на ассемблере невероятно круты, но исчезли как класс, так и мастера SQL-изысков — натура уходящая. И дело даже не столько в том, что они дорого стоят, сколько в том, что вполне технические руководители чем дальше, тем больше не будут уметь давать им задания и уметь их использовать.

Зачем нужен высокопрофессиональный фрезеровщик на заводе, где все станрки — с ЧПУ?
Чтобы не ломать зазря станки с ЧПУ неправильными программами.
И-и-и? Кто сделает фрезеровщику чертёж, по которому он работать будет? Если проектировщик сидит за 100500км и делает 3д-модель, из которой в автомате генерируются программы для ЧПУ (включая 3д-принтеры, где положено). Я, конечно, утрирую — ради прояснения ситуации. В самой производственной структуре для фрезеровщика не найдётся место. Где-то на опытном производстве — другое дело.
Так и здесь, мастерство в SQL перестаёт быть массовой потребностью. Скажем, в наших продуктах SQL-сервер используется только для кластеризации и надёжности, как низкоуровневое хранилище. Никаких изысков в запросах не требуется, так как программы работают объектно, а модель данных работает по принципу, очень близкому к all-in-memory. SQL уходит в нечто вроде части аппаратной платформы, и спецов по нему ждёт та же судьба, что большинство гуру операционных систем превратившихся в эникейщиков.
Эти самые фрезировщики и будут делать модели по которым будут генерироваться программы для ЧПУ.
И это время уже ушло… модели, модели, везде 3d-модели…
Вот нам нужен специалист по SQL как серверу. И практически не нужен специалист по tSQL. И мы — не одиноки. У сына в его конторе целый отдел программеров распустили, после того, как отдали одно направление нейросетям. Стало не нужно подрабатывать отчёты, оптимизировать работу и т.п.
Результат: работать стало несколько даже медленнее (но в допустимых пределах), зато отдел крутых спецов по SQL стал не нужен. Нет, сервер SQL там есть, но тоже — как низкоуровневое хранилище.
Откуда-то ушло, куда-то только пришло.
Понятно, что пишет представитель хотя и интернет-магазина (не совсем отстающая от SOTA (здесь — state-of-the-art), насколько я понимаю, отрасль) — но нигерийского. Но у нас, например, масса магазинов думает, что «нет, нам не нужен SQL, нам нужно облако с „интегратором“, набором отчётов и CMS, а ничего своего придумывать не надо, умный Запад всё уже придумал». Моё мнение глубоко специфично, многим в этом треде оно совком отдаёт, понимаю. И всё-таки рискну сделать ещё одно радикальное замечание: это не технологический прогресс, а технологическая ДЕГРАДАЦИЯ в сегменте. Там, где «придумывать ничего не надо», обязательно пойдёт время вспять, какая бы крутая, на сегодняшний день, технология и идеология за ней ни вызвала само по себе это массовое убеждение «придумывать ничего не надо». И, да, умные, крутые, понимающие чуваки «вымываются». А кто приходит на смену? Спецы другого профиля, да, но их руководство… Просто загляните в эти незамутнённые лица, послушайте их общие и суждения про «Рашку», «особые пути» и «совковую смекалочку» — ответьте, они поддержат темп гонки за SOTA или скорее законсервируют всё нафиг?
Всё тот же плач Ярославны. В 50-е годы экзамен на водителя-профессионала второго, по-моему, класса, (тогда были не нынешние АВС, а «профессионал», «любитель»...) включал в том числе определение марки стали по цвету искры на наждачном круге. А сейчас даже слово «перегазовка» весьма малая часть водителей понимает. Безусловно, деграданс.

«Вот так и бабочки.»
Уважаемый коллега, я, безо всякой иронии, весьма уважаю Ваш широкий кругозор. Да иначе бы и не влезал в разговор.
Однако — тут уже пфф! — зачем же Вы меня так жёстко выронили во флэшбэк? Про перспективы отраслей и прогресс-непрогресс ещё очень любят порассуждать таксисты. (это безоценочное суждение. Кто хочет поговорить о том, что я презрительно отзываюсь о таксистах либо, наоборот, проявляю к их суждению слишком большой интерес — сначала сходите сюда: caute.ru/ilyenkov/tra/denkabc.html. Подумайте, почему Гегель, вопреки обыкновению, говорит остроумно, запоминающимся образом и не обидно ни для кого, кто не искал повод обидеться, а знаменитый советский философ, в своём обязательном классово-верном комментарии, несёт какую-то непостижимую толерантную ахинею).
Одного такого я заказывал, чтобы с собеседования о новом трудоустройстве срочно вернуться на текущее место работы. Порассуждали об моей 1Ске и о зарплатах, что не всех в этой отрасли устраивают. И таксист меня спросил: «вот я машину отремонтировал — она просто работает. Что же такого вы постоянно делаете в своей программе, что вам постоянно нужно столько платить?»
Я тогда был бухнувши после собеседования (ибо не думал, что на как бы текущее место работы придётся срочно возвращаться), соображал плавно, но всё-таки нашёлся, что проворчать: «Ваша машина не растёт, не пытается взлететь и не ищет, чего бы нового сожрать. И как бы не сожрали её».
(Идите нафик, кто хочет тут отбаянить, мол, «1С — бухгалтерская программа». Вот слейте минуса мне — и потом нафик. И, кстати, как вам оно там — в девяностых?).

По сути вопроса. Ничего, что Вы сравниваете сертификацию (выдачу водительских прав) с тем, о чём мне приходится рассуждать в категориях «state-of-the-art», «регресс» и, в конце концов, «новые технологии»?!
Ничего, что если эту аналогию проработать до терминологической внятности, получится «нет, Вам не нужна ни автоматическая коробка, ни беспилотное управление. Вам нужны ПДД»?
Придумывать что-то своё — в работе с данными — обязательно надо!

У нас же, в айти… ну, тут диалектика: мы, программеры, постоянно «внедряем» и «отлаживаем», а не придумываем, с другой стороны, именно мы несём новую жизнь.
Нет, дело вовсе не в сертификации. Дело в том, что водителю требовалось это уметь (и подбирать нужную сталь для ремонта, и переключаться вниз с перегазовкой). А сейчас — не требуется, часто даже переключать передачи не требуется. И знать, что это такое — тоже. И, если вдруг появится в таксопарке водитель, который умеет и то, и то — владелец таксопарка просто не сумеет его использовать (разве что переводом в механики с поражением в правах и зарплате).
Очень похожее уже происходит со специалистами по SQL. Всё чаще их норовят отправить за сервером присматривать.

Надеюсь, теперь я высказался яснее. В прошлом комменте погнался за красивым образом и, видимо потому, был не очень внятен. Паrдон.
а, ну, статья тоже как бы не от специалиста по оптимизации запросов и не от SQL-гуру, и даже, полагаю, не от большого умельца «присматривать за сервером».
Но у нас, например, масса магазинов думает, что «нет, нам не нужен SQL, нам нужно облако с „интегратором“, набором отчётов и CMS, а ничего своего придумывать не надо, умный Запад всё уже придумал».

Логично, они же магазин, а не разработческая компания.

нелогично.
разработческая компания ничего не придумает в продажах. Весь её опыт (если она специализируется на отрасли интернет-продаж) — это исполнение заказов магазинов. А придумывать надо.
Я не навязываю магазинам SQL, я вообще бешеный прозелит 1С, но видите — «Вам нужен SQL», называется статья.
А придумывать надо.

Ну вот пусть магазин придумывает в продажах, а разработческая компания использует подходящий инструмент для реализации этих придумок.

нейросеть?!

Если задача того требует.

Гм
Статья о том, что отрасль того не требует. Соответственно, разумно ставить задачи, которые тоже не требуют. Допустим, сомнительное утверждение — про отрасль. Из Нигерии не всё человечество видно, хотя там всё и начиналось, по одной из версий.
Но Вы-то сомневаетесь, скорее, в том, что автору статьи нужна НЕКАЯ НЕПОНЯТНАЯ ХРЕНЬ (tm), к которой специалистам нужно ПРИСПОСАБЛИВАТЬСЯ. Потому что, например, если специалисты слишком много кушают, то уже этим подставляют свою родную компанию (такие вот, дескать, условия рынка в безупречном Двадцать первом веке), и совесть, видимо, должна их подтолкнуть к тому, чтобы приволочь коробку, благодаря которой их, прожорливых, заменят на «просто дисциплинированных исполнителей». А то продажи не вырастут.
Как в девятнадцатом веке в России стало стыдно всем мыслящим умеющим читать людям — просто по факту, что они умеют читать и мыслить. И от ржаного колоса не отличат пшеничного, при том…
Причём, я подменил альтернативу Скулю с апгрейдинга на даунгрейдинг, вместо ML-AI указал на «облака с пятью главными отчётами» — нет, всё равно — «они же магазин, они деньги зарабатывают и зарабатывать умеют, следовательно, мудрее нас, раздумчивых-айтишных. Значит, пусть будет облако!»
Ну, нравится гендиру заставлять продажников страдать — кто я такой перед ним, действительно, чтобы придумать что-то более эффективное и действительно инновационное?
Статья о том, что отрасль того не требует.

Нет, статья о том, что в отрасли есть задачи, которые этого не требуют. По крайней мере, разумный ее (статьи) остаток.


Но Вы-то сомневаетесь, скорее, в том, что автору статьи нужна НЕКАЯ НЕПОНЯТНАЯ ХРЕНЬ (tm), к которой специалистам нужно ПРИСПОСАБЛИВАТЬСЯ.

Я не делаю никаких предположений о том, что нужно автору статьи.

«разумный остаток» точно не нужен, это не предположение.

В таком случае мне более-менее все равно, о чем статья (если она о том, о чем вы говорите, то она неверна, а если она о том, о чем я говорю, то мой аргумент сохраняется). Меня волнует то, что в индустрии необходимость в алгоритмах машинного обучения есть. Иными словами, "отрасль требует".

перебЕситесь.

Прекрасное, аргументированное мнение.

Просто прогноз.
Сказано же: говорите «полезно», подразумевая полезность магазина, а не потребителя. В этом проблема. Нет, я не совок, ещё раз повторяю. Верю, что капитализм — это взаимовыгодные сделки.
Сказано же: говорите «полезно», подразумевая полезность магазина, а не потребителя.

Я уже приводил примеры пользы для потребителя. Вы их, видимо, игнорируете.

Не игнорирую, даже благодарен Вам за них, но указываю, что это, с Вашей стороны, (похвальное) расширение контекста обсуждения. Вам нечего предложить Целестину Омину.

А как расширить кросс-продажи через робота, который не заморачивается, где комплемент, где субститут, и видит какие-то нечеловеческие связки между товарами и получить от магазина премию за повышение кросс-продаж — это, как бы, эксплойт человеческой импульсивности, дикси.

К тому же, не очень верится в коробку, которую принесли, установили и ушли. Если нет человека, понимающего, как работают рекомендации магазина и какие ошибки возникают, значит, коробочное решение просто выключили через пару недель.
Не игнорирую, даже благодарен Вам за них, но указываю, что это, с Вашей стороны, (похвальное) расширение контекста обсуждения.

Да нет, от темы статьи это никак не отличается.


А как расширить кросс-продажи через робота, который не заморачивается, где комплемент, где субститут, и видит какие-то нечеловеческие связки между товарами и получить от магазина премию за повышение кросс-продаж — это, как бы, эксплойт человеческой импульсивности, дикси.

… или нет. Вы не можете этого сказать без исследований.


И это не говоря о том, что это не единственное применение машинного обучения.


К тому же, не очень верится в коробку, которую принесли, установили и ушли.

В летательные аппараты тяжелее воздуха тоже долго "не верилось".


Если нет человека, понимающего, как работают рекомендации магазина и какие ошибки возникают, значит, коробочное решение просто выключили через пару недель.

Ваше "значит" никак не вытекает из "если".

интересный у Вас опыт…
В летательные аппараты тяжелее воздуха тоже долго «не верилось».

Кстати, позвольте угадать! Эта фраза — от кого-то из Вашего маркетинга?
Потому что мне, призванному в силу специализации сразу думать, КАК ИМЕННО оно будет работать… не смешно.
Система сбора ошибок (в том числе, дурацких) и постепенного, но верного, накопления опыта… да без человечьего надзора… магазин должен быть очень, ОЧЕНЬ живучим, чтобы ему можно было объяснять, после внедрения: «а вспомни первые попытки в авиации!»

Скорее всего, вместе с кроссовками, хотя бы трое из тысячи потребителей купят шнурки для своих старых бутсов, хотя бы один последующий покупатель тех же кроссовок перейдёт не по списку аксессуаров, а вот такой рекомендации, а шнурки для бутсов не пролазят в дырочки на кроссовках… И почему мы потеряли этого клиента, как же нам постичь? Ответ: да потому, что Господь милостив: вы вместо клиента не потеряли репутацию, к чёртовой транс-дедушке. Попался клиент, который просто забил на стоимость шнурков и скрылся в закат, ничего не объясняя. Ожидались (потребителем, магазину-то и так норм) — релевантные подсказки, а получены — «корреляции из прошлого», без башки — в буквальном смысле слова.

Я и даунгрейдинг, приведённый выше (облако с пятью отчётами, зато рассылками по одной кнопке), знаю, как и в какие сроки только ВНЕДРЯЕТСЯ в магазинах, мне хватает, чтобы увидеть причинно-следственную связь наличия опыта реального использования системы с наличием белковой башки, причём, обязательно живой.
Без аналитика вообще ничего не будет. Нет, будет: уроните существующие системы.
Кстати, позвольте угадать! Эта фраза — от кого-то из Вашего маркетинга?

Нет.


Скорее всего, вместе с кроссовками, хотя бы трое из тысячи потребителей купят шнурки для своих старых бутсов, хотя бы один последующий покупатель тех же кроссовок перейдёт не по списку аксессуаров, а вот такой рекомендации, а шнурки для бутсов не пролазят в дырочки на кроссовках…

Из ошибочных предположений можно построить любые выводы. Вы делаете ошибочные предположения, а потом рассказываете мне, как все будет плохо, если они верны.


Без аналитика вообще ничего не будет.

А откуда вы взяли "без аналитика"? Или, иначе говоря: без какого аналитика? На каком этапе?

А откуда вы взяли «без аналитика»? Или, иначе говоря: без какого аналитика? На каком этапе?

«Коробку принесли, установили и ушли.»
Это формулировка, с которой Вы согласились?
То есть то, что у магазина может просто не быть аналитика, вы не учитываете?

это Ваша цитата. Когда я пытался объяснить, почему инструменты без собственного мнения удобнее для маркетолога — Вы заявили: «коробка достаточный наблюдатель». Ещё одна цитата.
Что я должен был думать, кроме как, что Вы в проектах внедрения софта ничего не понимаете?
А теперь, оказывается, я неправ потому, что к ML-коробке на каком-то этапе присоединится аналитик. Ну-ну. Значит, коробка сама по себе без человеческого контроля даст начальные финансы для найма аналитика, которого магазин раньше не мог себе позволить? Или как?
Это формулировка, с которой Вы согласились?

Аналитик работал при создании коробки. И при ее первых k внедрениях.


(это верно для любого коробочного продукта, не только ML)

Это просто НЕверно. Если рассматривать это как ответ на вопрос о сопровождении внедрения, хотя бы даже на k+1 итерации.
Ну, не понимаете во внедрениях — может, Вам и не надо.

Ну да, ну да, я мало коробочных внедрений видел, чего уж.

А теперь, оказывается, я неправ потому

Нет, вы неправы потому, что делаете ошибочные предположения о работе системы и последствиях этой работы.

Интересны подробности.
Вы пока не назвали никакой конкретики.
Опытом внедрений нам с Вами меряться — это где-то в области троллинга. И потом, я действительно не занимался внедрением ML-систем. Но совершенно не понимаю, отчего они не дают ещё больше мест, в которых всё может пойти не так, чем те внедрения, про которые я сказал с уверенностью: «если Вы считаете, что это просто установить, запустить и уйти — значит, не понимаете, как это делается».
Интересны подробности.

Какие, например?


Вы пока не назвали никакой конкретики.

Я приводил примеры предсказаний, которые строят рекомендательные системы, и они отличаются от приведенных вами.

Интересны подробности.

Какие, например?

Прежде всего, разумеется, бренды коробок, способные заработать в режиме «принёс-запустил-закачал данные (или даже просто подцепил к существующей базе по ODBC) — ушёл — (...) — PROFIT!».
(я даже смиренно умолчу, что «закачал данные» — даже для менее хитроумной системы — это месяца полтора миниморум)
Совсем бы здорово было, если бы Вы оказались случайно осведомлены, о том, какие начальные данные закачаны в такую коробочку, чтобы она не подсовывала покупателю кроссовок шнурки под берцы… Но не настаиваю абсолютно, это «если повезёт».

Затем, было бы интересно узнать, есть ли Вам, что предложить Целестину Омину. Ну, точнее, его руководству, поскольку коллективный разум в треде пришёл к тому, что автора статьи на его текущем месте гораздо дешевле и эффективнее было бы заменить на «коробку-наблюдателя». Какие невообразимые для Омина, но полезные задачи мог бы выполнять такой роботизированный магазин? Автор статьи рассказал, чем приходится заниматься ему. Причём, судя по заголовку, этот список претендует на ИСЧЕРПАННОСТЬ, с точки зрения МАКСИМИЗАЦИИ ПРИБЫЛИ на кросс-продажах в данной рыночной нише, а не подразумевает, что «вот в отрасли бывают в том числе и такие задачи». Попробуйте опровергнуть.
Хотя бы, привести какой-нибудь Ваш же пример к понятной Целестину форме: например, кейс «возможно, это всё-таки кроссовки». «Вы, как только захотите расширяться, столкнётесь с тем, что белковый мозг путается в категориях и не способен выявить ошибки категоризации из статистики заходов, а вот есть алгоритм XXX в программном продукте YYY, который решает такую задачу» — как-то так, получается?

Я приводил примеры предсказаний, которые строят рекомендательные системы, и они отличаются от приведенных вами.

Потому что игнорируют предметную область… А я показываю риски такого игнорирования.
Прежде всего, разумеется, бренды коробок, способные заработать в режиме «принёс-запустил-закачал данные (или даже просто подцепил к существующей базе по ODBC) — ушёл — (...) — PROFIT!».

Извините, вот это — коммерческая тайна.


Затем, было бы интересно узнать, есть ли Вам, что предложить Целестину Омину.

Не, нечего. Он настолько уверен в своей правоте, что я не собираюсь его переубеждать.


коллективный разум в треде пришёл к тому, что автора статьи на его текущем месте гораздо дешевле и эффективнее было бы заменить на «коробку-наблюдателя».

Я не отвечаю за коллективный разум.


Какие невообразимые для Омина, но полезные задачи мог бы выполнять такой роботизированный магазин?

Очень простые: сделайте все то же самое, не используя SQL-запросы, написанные каждый раз руками под конкретную задачу. Потому что в магазине нет людей, которые умеют писать SQL.


Причём, судя по заголовку, этот список претендует на ИСЧЕРПАННОСТЬ, с точки зрения МАКСИМИЗАЦИИ ПРИБЫЛИ на кросс-продажах в данной рыночной нише, а не подразумевает, что «вот в отрасли бывают в том числе и такие задачи».

Эта претензия ничем не обоснована.


«Вы, как только захотите расширяться, столкнётесь с тем, что белковый мозг путается в категориях и не способен выявить ошибки категоризации из статистики заходов, а вот есть алгоритм XXX в программном продукте YYY, который решает такую задачу» — как-то так, получается?

Предположим, вам надо показать "товары, похожие на текущий". Когда у вас есть каталог на ~900 тысяч позиций (это не артикулы, а артикулы с вариациями), в нем есть ошибки в заполнении атрибутов. Мягкий поиск умеет игнорировать такие ошибки, а любая вариация LTR умеет отбирать важные и неважные для "похожести" атрибуты на основании кликов пользователя в рекомендации.


Ну да, а теперь попробуйте сделать это на SQL так, чтобы это перенеслось из магазина, торгующего футболками, в магазин, торгующий сырами, без изменения хотя бы одной строчки кода.


Потому что игнорируют предметную область…

Покажите, где.

Брэнд — коммерческая тайна?!
Извините, но это слив. Извините, поздравляю.
Видит Бог, я не хотел и не старался.
Это Вы в комментариях меня подкалывали, даже преследовали — так, как будто что-то знаете. Про новую жизнь с ML-системами и про их внедрение.
Брэнд — коммерческая тайна?!

Ну да.


Извините, но это слив. Извините, поздравляю.

Нет, не извиню.


Видит Бог, я не хотел и не старался.

Что не старался — да, видно. По отсутствию аргументов.

Так и мне нужны не аргументы. мне нужны объективные экономические ценности. Хотя бы на таком, весьма сомнительном, уровне, как — happy customer.
У Вас есть опыт, как решать проблемы потребителя, а не проблемы хабровского тролля, ползающего по комментам и отмечающего, как ему представляется, пробелы в формальной логике?
Так и мне нужны не аргументы. мне нужны объективные экономические ценности. Хотя бы на таком, весьма сомнительном, уровне, как — happy customer.

Вот именно, что сомнительном. Покажите мне объективный способ измерения счастья покупателя.


У Вас есть опыт, как решать проблемы потребителя

У меня есть опыт, как решать проблемы пользователя.

Предположим, вам надо показать «товары, похожие на текущий». Когда у вас есть каталог на ~900 тысяч позиций (это не артикулы, а артикулы с вариациями), в нем есть ошибки в заполнении атрибутов. Мягкий поиск умеет игнорировать такие ошибки, а любая вариация LTR умеет отбирать важные и неважные для «похожести» атрибуты на основании кликов пользователя в рекомендации.

Ну да, а теперь попробуйте сделать это на SQL так, чтобы это перенеслось из магазина, торгующего футболками, в магазин, торгующий сырами, без изменения хотя бы одной строчки кода.

И сделаю. Спорим?
Кстати, зачем?
И при чём тут превосходство ML над белковыми мозгами? И при чём тут Ваша вымышленная коробка, которая учит магазин торговать правильно?
И сделаю. Спорим?

Да нет, чего спорить, понятно, что можно сделать. Вы просто алгоритм покажите, а дальше поговорим.


И при чём тут превосходство ML над белковыми мозгами?

При том, что ML "просмотрит" 900 тысяч позиций немножко быстрее, чем человек.

вопрос «кстати, зачем?» — разумеется, пропущен.
не надо Вам 900 тысяч позиций. Вам нужен SQL.
вопрос «кстати, зачем?» — разумеется, пропущен.

"Зачем" что?


не надо Вам 900 тысяч позиций.

Ну как не надо, если вот он, реальный каталог?


Вам нужен SQL.

Который что? SQL — это, если очень сильно упрощать, средство выборки данных. Какой такой запрос позволит вам показать товары, отсортированные по близости, и с учетом пользовательского понимания близости?

не надо Вам 900 тысяч позиций.


Ну как не надо, если вот он, реальный каталог?

А Вам туда — похоже, не надо.

Вам нужен SQL.

Который что? SQL — это, если очень сильно упрощать, средство выборки данных.

Который, внезапно, выбирает интересующие грамотного аналитика данные. (грамотного — в том, что не составит запрос так, чтобы в качестве дополнения к кроссовкам выкинуло бы канцелярскую замазку).
Какой такой запрос позволит вам показать товары, отсортированные по близости, и с учетом пользовательского понимания близости?

Отсортированные по какой близости, статистической, корреляционной? Без различения, где комплемент, а где субститут?
Предлагаю повторно прекратить троллить, для этого Вам придётся изложить пользовательское (!)понимание(!) близости товаров друг к другу. Тогда можно будет сформулировать задачу. И даже вообразить себе магазин, который охватил 900 000 артикулов, но до сих пор не ступала нога белкового аналитика.
А Вам туда — похоже, не надо.

Мне кажется, моему заказчику виднее, куда мне надо, а куда — нет.


Который, внезапно, выбирает интересующие грамотного аналитика данные.

То есть мне нужен не только SQL, но и аналитик?


Предлагаю повторно прекратить троллить, для этого Вам придётся изложить пользовательское (!)понимание(!) близости товаров друг к другу.

В том-то и дело, что нет. Я просто сделаю базовое предположение, что близость — она по атрибутам (иными словами, чем больше атрибутов совпадает, тем товары ближе), а вот степень важности разных атрибутов отдам на откуп пользователю.

бедный заказчик…

атрибуты откуда взялись?
я сейчас даже не про заполнение БД.
атрибуты откуда взялись?

Заказчик и навводил.

И при чём тут Ваша вымышленная коробка, которая учит магазин торговать правильно?

Я нигде не говорил, что коробка чему-то учит магазин.

я тоже так и сказал: коробку, разумеется, выключили давно, поэтому она ни учит, ни заставляет, ни даже «неназойливо предлагает».
А то бы уже напредлагала! Без человеческого грамотного надзора-то. Шнурки не от той модели обуви — это я ещё очень пощадил воображение читателей.
А то бы уже напредлагала! Без человеческого грамотного надзора-то.

А откуда бы она взяла свои несусветные предложения?

оттуда же, откуда берутся все ошибки в обучении методом «проб и ошибок».
Или как она учится?
Вот если расскажете, какие есть другие механизмы оптимизации рекомендаций… то, значит, Вы не просто тролль, который докапывается до (неизбежных в обсуждении) обобщений. Вас и почитать будет интересно и полезно.
Или как она учится?

На пользовательском вводе. И это значит, что если коробка сделала рекомендацию, то была (статистически значимая) доля пользователей, которые выбирали продукты таким образом.

Но не значит, что эта информация не окажется мне не то что лишней, а прямо misleading (не выпендриваюсь, просто не знаю, как это вкратце по-русски).
«На пользовательском вводе» — прошу заметить, я, как гуманист, нарочно обхожу напрашивающийся тут аргумент про миллионы мух. Дело не в том, дураки ли люди, а в том, что «функция квалифицированного информирования» у магазинов когда-то была, и есть основания предполагать, что её исполнения ждут и дальше. Машинка и корреляция на месте мудрого консультанта, у которого ограниченные процессинговые возможности, зато открытый и структурированный и связный список критериев выбора подходящих предложений — это подмена и обман. Пока что он работает, люди верят и переплачивают на марже магазина за «сопутствующие» товары. Надеюсь, покупатели поумнеют, а вы перебЕситесь.
Но не значит, что эта информация не окажется мне не то что лишней, а прямо misleading

Это с равным успехом относится и к информации, предоставляемой людьми.


Дело не в том, дураки ли люди, а в том, что «функция квалифицированного информирования» у магазинов когда-то была, и есть основания предполагать, что её исполнения ждут и дальше.

Я вот про "квалифицированное информирование" первый раз услышал от вас в этой дискуссии. "Я-покупатель", в смысле. Всё, чего я ожидаю от магазина (не от продавца, с которым я пришел поговорить) — это честное (и, в меру возможностей, полное) описание характеристик товара. Всё.


Машинка и корреляция на месте мудрого консультанта, у которого ограниченные процессинговые возможности, зато открытый и структурированный и связный список критериев выбора подходящих предложений — это подмена и обман.

Нет, подмена и обман — это сравнивать "машинку" с "консультантом", когда сравнивать надо "машинку" с "программистом с SQL", или, равновероятно, "машинку" с "ничем". Нету в мире столько консультантов, сколько в мире есть покупателей.


Пока что он работает, люди верят и переплачивают на марже магазина за «сопутствующие» товары.

Да, забыл спросить: а "мудрый консультант" — он бесплатный, да? За него покупатель не переплачивает?

Это с равным успехом относится и к информации, предоставляемой людьми.

только техногику может казаться, что — с равным.

Нет, подмена и обман — это сравнивать «машинку» с «консультантом», когда сравнивать надо «машинку» с «программистом с SQL», или, равновероятно, «машинку» с «ничем».

программист с SQL — это ещё и консультант, по крайней мере, у него есть здравый смысл.

Да, забыл спросить: а «мудрый консультант» — он бесплатный, да? За него покупатель не переплачивает?

Нет. Нет.
Услуги консультанта стОят маржи магазина и являются конкурентным преимуществом магазина как корпорации. В отличие от готовых сервисов всяких, имена которых Вы скрываете, как коммерческую тайну. Потому что их нет, между прочим. Гугл — это команда «своих» дизайнеров, в том числе.
Не переплачивает, потому что платит за РЕЛЕВАНТНУЮ информацию, за опыт и некоторую (высокую!) вероятность, что не возникнет ситуация «ну, хреновый из меня кудесник».
только техногику может казаться, что — с равным.

Да нет, с равным. Вы думаете, я не хожу в магазины? Не встречаюсь с консультантами, которые знают о товаре меньше меня? Или теми, которые знают больше, но все равно дают мне неподходящую мне рекомендацию?


программист с SQL — это ещё и консультант

Совершенно не обязательно. Программист с SQL — это программист SQL, не меньше и не больше. Бывают еще консультанты с SQL, это отдельные звери.


по крайней мере, у него есть здравый смысл.

Который совершенно не обязательно соотносится с тем, что в реальности надо предлагать.


Не переплачивает, потому что платит за РЕЛЕВАНТНУЮ информацию, за опыт

Подождите, но консультант в магазине есть безотносительно того, пользуюсь я его услугами, или нет. И значит даже если они мне не нужны, я за него плачу. По-моему, это типичный случай переплаты.

ну, мы же онлайн-магазины обсуждали…
давайте придерживаться русла, это важно.

И что это меняет?


Ну, кроме того, что в онлайн-магазинах я услугами консультантов никогда не пользовался, и каждый раз, когда я там вижу окошечко "поговорить с консультантом", я его немедленно игнорирую.

Хотя бы, привести какой-нибудь Ваш же пример к понятной Целестину форме: например, кейс «возможно, это всё-таки кроссовки».

Или вот, кстати, еще один свеженький пример. Как бы вы на SQL без использования машинного обучения сделали бы рекомендательную систему "покажи мне все платья, визуально похожие на то, которое я сейчас смотрю". Проще говоря, image similarity search.


Руками размечать? Моделей в каталоге несколько тысяч, если не десятков тысяч.

Такое кто-то делает на машинном обучении?! Подбор платьев?
Ох…
повторяю
… интересный у Вас опыт.
Такое кто-то делает на машинном обучении?! Подбор платьев?

https://cloud.google.com/vision/product-search/docs/


А на AI Conference показывали примеры, как ML подбирает товары, подходящие человеку, стоящему перед камерой.

Ну, наконец-то началась конкретика.
Теперь давайте о том, как бы решал подобные задачи Целестин Омин, который умеет в SQL. И почему это хуже. И коробка ли это, способная обойтись вообще без человеческого контроля на некоем k+1-м внедрении. В мелком магазине (слишком мелком, чтобы нанять фэшн-специалиста), у которого есть сведения только о «своих» брэндах и моделях.
Я же не утверждаю, что корпорации Гугл нужен SQL, а не ML. Они могут себе позволить нанять достаточное количество грамотных людей и аккумулировать достаточное количество информации, чтобы будущая коробка оказалась не глупее среды, в которой крутится. Правда, это после закачки коммерческой инфо и настройки в течение пары лет.
Теперь давайте о том, как бы решал подобные задачи Целестин Омин, который умеет в SQL.

Давайте. Расскажите мне, как это решать на SQL.


И коробка ли это

Это — не коробка. Это — сервис, на основании которого разработчик сделает коробку (или SaaS, не суть).


Я же не утверждаю, что корпорации Гугл нужен SQL, а не ML.

Вы, видимо, не обратили внимания, что это сервис, который корпорация Гугл поставляет другим компаниям, чтобы те могли делать поиск по своим каталогам.

Давайте. Расскажите мне, как это решать на SQL.

По ключевым словам, только Целестину ещё и придётся научиться в РегЭксп, скорее всего. Получится лучше, только ключевые слова должен заполнить кто-то квалифицированный. Ну, и Гугла чисто к картинкам всё равно всё не сводится.

Вы, видимо, не обратили внимания, что это сервис, который корпорация Гугл поставляет другим компаниям, чтобы те могли делать поиск по своим каталогам.

В мирке софткодинга, как он есть.
То есть, Вы формулируете контраргумент утверждению автора статьи так, что «а вот если бы вы начали торговать модными платьями, то могли бы не нанимать персонал со вкусом, а подключить Гугл»?
на основании которого разработчик сделает коробку (или SaaS, не суть

суть в том, что у Вас вместо какого бы то ни было опыта — «формальная логика». В лучшем случае — хотя бы корректная, а то ещё…
Да и у всех в этом сегменте, похоже, тоже.
По ключевым словам, только Целестину ещё и придётся научиться в РегЭксп, скорее всего. Получится лучше, только ключевые слова должен заполнить кто-то квалифицированный.

Ну то есть вы выкинули задачу "подбор по картинке" и заменили ее задачей "подбор по ключевым словам". Спасибо, но нет. Нужно решить именно по картинке, без ключевых слов.


То есть, Вы формулируете контраргумент утверждению автора статьи

Начнем с вопроса "какому именно утверждению?"

Ну то есть вы выкинули задачу «подбор по картинке» и заменили ее задачей «подбор по ключевым словам».

Такое бывает. Жизнь отбрасывает те задачи, которые сам себе поставил программист. Даже если он их почти решил.
Подбор по картинке в чистом виде, без ключевых слов — это я ищу футболочку с магендавидами, а получаю «издевательское» предложение того же цветового решения, но с прямыми свастиками.

Начнем с вопроса «какому именно утверждению?»

вынесенному в заголовок статьи.
Жизнь отбрасывает те задачи, которые сам себе поставил программист.

Вот только здесь задачу выбросила не жизнь, а программист, который хочет обязательно обойтись SQL.


Подбор по картинке в чистом виде, без ключевых слов — это я ищу футболочку с магендавидами, а получаю «издевательское» предложение того же цветового решения, но с прямыми свастиками.

… и как вам здесь помогут ключевые слова без явного аннотирования "не предлагать вот это"?


вынесенному в заголовок статьи.

Нет, утверждению, вынесенному в заголовок статьи, я противопоставляю аргумент "не для всех задач хватает SQL".

Вот только здесь задачу выбросила не жизнь, а программист, который хочет обязательно обойтись SQL.

я противопоставляю аргумент «не для всех задач хватает SQL».

А он парирует: для всех наших и тех, которые возникнут на обозримом горизонте, задач — хватает. (повторяем заголовок статьи).
Потому что это Вы в нём видите программиста SQL, и только — как будто освоенный навык составления запросов это главное в никчёмной жизни Омина. А он, на самом деле, в данном случае и есть жизнь.
А он парирует: для всех наших и тех, которые возникнут на обозримом горизонте, задач — хватает.

На его обозримом горизонте — да, возможно. Но он говорит: "вам не нужно", хотя он ничего не знает о наших задачах и нашем обозримом горизонте.


Поэтому нет, он не жизнь. И нет, вы так и не показали, как решать задачу поиска по картинке средствами SQL.

Но он говорит: «вам не нужно», хотя он ничего не знает о наших задачах

То есть, магазин Амазон это бы прочёл и обиделся, да?
По-моему, все поняли, о каком сегменте рынка идёт речь. И даже те, кто не принадлежат к этому «мелкому» сегменту, сделали полезные для себя выводы.
Вы, напоминаю, в начале дискуссии именно для этого сегмента и случаев, возникающих только там — «допустим, у вас нет аналитика» — продвигали какие-то волшебные коробочные решения. Теперь оказывается, что грамотного аналитика и маркетолога нет, но сверхсложные Задачи — есть…

В принципе, конечно, интересно (без сарказма и иронии), как бы взлетело предприятие такого типа. Откуда бы у него взялся в распоряжении каталог модных платьев в миллион штук, которые надо подбирать непременно визуальным подобием, потому что ни один белковый мозг не справится, а нужное количество белковых мозгов стоит дороже, чем подключение к сервису Гугля и закачка туда информации aaS. Может, такое придумает кто-то и озолотится.

нет, вы так и не показали, как решать задачу поиска по картинке средствами SQL.

пока — никак не решать.
всё равно на Маньке будет сидеть иначе, чем на модели.
Я в бизнесе дизайнерской одежды немного покрутился.
То есть, магазин Амазон это бы прочёл и обиделся, да?

Ничего не знаю про амазон.


По-моему, все поняли, о каком сегменте рынка идёт речь.

Не знаю, что там "все" поняли. Я понял только то, что он говорит о "магазинах мельче Амазон" (при этом речь идет о десятке тысяч покупателей, да).


Теперь оказывается, что грамотного аналитика и маркетолога нет, но сверхсложные Задачи — есть…

Не, до сверхсложных задач мы пока не добрались, обсуждаем простые.


Откуда бы у него взялся в распоряжении каталог модных платьев в миллион штук

Вот я и говорю: фантазии. Я говорил о тысячах (может быть, десятках тысяч).


пока — никак не решать

А вот ML ее уже решает. О чем и речь.


всё равно на Маньке будет сидеть иначе, чем на модели.

… а эту задачу на данный момент ни один автоматический алгоритм (включая SQL) не решает. Но мы-то решаем не ее, а другую.

Не, до сверхсложных задач мы пока не добрались, обсуждаем простые.

Простые задачи — те, которые перечислил автор статьи.
Чтобы без человеческого вмешательства определять визуально похожие платья — это пока сложная задача. Это дебри-дебри. Хотя Гугл претендует на то, что решил её, но… магазин бы попросил цифры, финансовый прогноз, для начала. До тех пор, как будут цифры отдачи (и то, у меня возникнут сомнения, что это не временный морок) — решённая программисткая задача, не решённая технологическая проблема.
… а эту задачу на данный момент ни один автоматический алгоритм (включая SQL) не решает. Но мы-то решаем не ее, а другую.

Для выставок сойдёт.
Остальным не нужно.
Остальным нужно подсказывать, как на покупательнице будет сидеть. (если они уж полезли в фэшн-индустрию...)
Хотя, вроде как, белковые мозги обрабатывают меньше вариантов; если чисто формально — так гугл и мощнее, и полезнее для покупательниц платьев.
Простые задачи — те, которые перечислил автор статьи.

У каждого свое мерило простых задач.


Остальным не нужно.

Вам, конечно, виднее, что нужно остальным. Правда, странно, что эти самые остальные продолжают приходить с запросами, которые, по вашему мнению, не нужны, но это, наверное, просто ошибка мироздания, их не существует.

Правда, странно, что эти самые остальные продолжают приходить с запросами, которые, по вашему мнению, не нужны

Куда приходить?
Сюда, в комменты, помимо соглашающихся с Омином, приходят пока только посетители «американских выставок американской компании», видимо, убеждённые, что «новые американские разработки» со временем будут необходимы всем. ВСЕМ.
Не только тем, кто числит себя в пионерах инноваций и… тоже согласится с Омином: «тем, другим — не нужно, они зарабатывают по-другому». со всем осознанием собственных рисков (и выгод) первопроходства, со всей грамотностью в предметной области, без малейшей возможности опозориться в обсуждении технологии и её перспектив такой безграмотной и фантазийной постановкой задачи, как «а предположим, что в нашей фирме нет аналитика, есть ведь коробки, где всё придумано до нас».
Куда приходить?

К разработчикам.


Сюда, в комменты,

Я "здесь в комментах" не видел пока ни одного владельца магазина, онлайн- или оффлайн-, не говоря уже о, скажем, целевой аудитории описанных мной демонстраций.

Так ищите, приводИте.
А то у Вас пока (из доступного к нашему ознакомлению) только опыт уровня «попался живой продавец-осёл, слава роботам!»
Так ищите, приводИте.

А зачем мне это?


А то у Вас пока (из доступного к нашему ознакомлению) только опыт уровня «попался живой продавец-осёл, слава роботам!»

Да нет, просто весь остальной вы успешно игнорируете.

суть в том, что у Вас вместо какого бы то ни было опыта — «формальная логика».

Вы, прямо скажем, слишком мало знаете про мой опыт, чтобы делать о нем такие суждения. И уж тем более обобщать их на индустрию.

Был бы опыт — Вы бы знали, как не триггернуть у меня, представившего себя на месте ЛПР магазина, инстинкт самосохранения.
«ну, всё уже изобретено гуглом»
«такие системы уже есть. Правда, брэнд — коммерческая тайна.» (ах, стесняшки!)
«да с чего вы взяли, что они такие зловредные, что непременно ошибутся?»

Если вы считаете себя и свои фантазии единственным мерилом моего опыта, так это как раз и есть "слишком мало знаете".

в этом субтреде они мерило. Кстати, не только фантазии, а ещё реальный МОЙ опыт. Не все, знаете ли, любезнейший, спорят-чисто-чтобы-спорить, по темам, по которым у них одни только «фантазии».

а кого Вы смогли успокоить и убедить и разрешить сомнения практикой — в студию, если надо — сможете без имён. «Зачем нам коробка»?

Пока что Вы не можете оценить, насколько я не готов к восприятию новых ЗНАНИЙ. Только знания — это не просто то, что наизобретали программисты, а ещё и как они справляются с жизнью.
Кстати, не только фантазии, а ещё реальный МОЙ опыт.

К сожалению, именно фантазии. "Я представил себя на месте магазина, в котором произошло то-то и то-то". Реальный опыт — это "мы внедрили, у нас произошло то-то и то-то, в магазине произошло то-то и то-то". А пока вы даже не можете объяснить, откуда в простой рекомендательной системе берется рекомендация с таким весом и эффектом, что она немедленно рушит репутацию магазина.


«Зачем нам коробка»?

Вам — явно низачем. А на практике одна американская компания, внедряющая е-коммерс, этой зимой показывала на одном американском мероприятии решение по продуктовым рекомендациям, построенное на соответствующем готовом решении, поставляемом Azure. Я там в зале сидел, мне даже никого убеждать не надо было.

Вы как-нибудь отличаете фантазии от моделирования?
Вы как-нибудь отличаете фантазии от моделирования?

Угу, модель построена на фактах и наблюдениях.

Ожидались (потребителем, магазину-то и так норм) — релевантные подсказки, а получены — «корреляции из прошлого»

Но корреляции из прошлого — это и есть релевантные подсказки, разве не так?

не-а.
подсказки — это семантическое.
вот у меня, потребителя, есть потребность в рыбалке, но нет — даже начального — опыта в рыбалке.
Я жду, что куплю удочку — продавец подскажет наживку… Удочку я пришёл выбирать, где дешевле всего, а продавец немножечко озолотится на марже с наживки, но тут уж — заслужил! Вот так я представлял себе.
А там, где ты покупаешь кроссовки, а тебе подсовывают банку огурчиков… или вообще, как в худшем совке, шнурочки от берцов, которые в дырочки в купленных кроссовках не пролазят…
ребят, ну, можно ещё по схеме take the money and run работать, чо.

Мне, конечно, ужасно интересно, почему вы считаете, что система, обучающаяся на прошлых покупках (которые, в общем-то, делают люди) не способна дать полезную рекомендацию (хотя рекомендации дают тоже люди). Вас как не послушай, у вас рекомендации исключительно зловредные и ничем не обоснованные.

не исключительно, прошу понять.
Одной зловредной рекомендации на 100 случаев хватит, чтобы испортить репутацию магазина. И, соответственно, загубить бизнес.
Лучше вообще ничего не рекомендовать.
Но тогда, внезапно, выходит, что не нужно занимать слишком широкий сегмент рынка. Если нет понимания (человеческого, а не статистического), как башмаки, купленные в Ноунейм, Инк., сочетаются с огурцами, купленными в Ноунейм, Инк. же — значит, даже если «так продаётся лучше» — это обречённая модель. Сокращайте ассортимент, сэкономьте на диверсификации логистики, умерьте гордыньку, отрекитесь от синергиебесия.
Ну, точнее, сегодня ещё что-то может получиться ухватить на импульсивности и оптимизме покупателей, даже коробка успеет окупиться…
Одной зловредной рекомендации на 100 случаев хватит, чтобы испортить репутацию магазина.

Правда? Я вижу неинтересующие меня рекомендации раз в неделю, и продолжаю пользоваться магазином.


Лучше вообще ничего не рекомендовать.

У вас, конечно, есть статистика, которая подтверждает этот вывод?

не-а.
подсказки — это семантическое.

А как вы определяете семантическое, если не по подсказкам из прошлого?


Я жду, что куплю удочку — продавец подскажет наживку… Удочку я пришёл выбирать, где дешевле всего, а продавец немножечко озолотится на марже с наживки, но тут уж — заслужил! Вот так я представлял себе.

Ну это как раз пример подсказок на основе истории.


А там, где ты покупаешь кроссовки, а тебе подсовывают банку огурчиков… или вообще, как в худшем совке, шнурочки от берцов

Смотрите, если люди статистически значимо покупают огурцы с кроссовками, то это значит, что есть какая-то причина тому. И если вы ее не знаете — то это говорит лишь о том, что вы ее не знаете. А не о том, что причины нет. В этом случае советовать огурцы тому, кто берет кроссовки — правильно, так как это помогает покупателю.


Одной зловредной рекомендации на 100 случаев хватит, чтобы испортить репутацию магазина.

Тогда ваша точка зрения тем более странная. Ведь вероятность того, что зловредную рекомендацию даст продавец-человек, значительно выше, чем таковую даст автоматическая система.
Каким вообще образом "зловредную" рекомендацию можно сформировать автоматически? Это же нереально.

А как вы определяете семантическое, если не по подсказкам из прошлого?

пока так (список критериев отбора товара прилагается). а если вижу, что выходит фигня, то — иначе (список критериев расширяется до того, как покупателю покажут идиотскую рекомендацию).

Тогда ваша точка зрения тем более странная. Ведь вероятность того, что зловредную рекомендацию даст продавец-человек, значительно выше, чем таковую даст автоматическая система.
Каким вообще образом «зловредную» рекомендацию можно сформировать автоматически? Это же нереально.

Пример я привёл. Несколько человек после покупки кроссовок купили ещё и шнурки к своим берцам, а потом по такой вот рекомендации магазин потерял хорошего покупателя. Живой продавец такого не посоветует, да. Ну, сейчас двадцать первый век, впрочем — читай, Новое Средневековье, — принято верить в зомби… и много во что ещё… как-то высокое звание человека утеряно.

Смотрите, если люди статистически значимо покупают огурцы с кроссовками, то это значит, что есть какая-то причина тому. И если вы ее не знаете — то это говорит лишь о том, что вы ее не знаете. А не о том, что причины нет. В этом случае советовать огурцы тому, кто берет кроссовки — правильно, так как это помогает покупателю.

Нет. Если это работает, значит, удалась разводка на импульсивности и очарованности покупателей новыми технологиями. Самоподдерживающееся ожидание — это ведь разновидность ловушки. А к верёвке не надо советовать мыло каждый раз. Хотя да, хорошо идут вместе.
Причины нет, пока я её не понял и не ужаснулся.
Вы вообще понимаете, что такое случайность, по своей природе?
Несколько человек после покупки кроссовок купили ещё и шнурки к своим берцам, а потом по такой вот рекомендации магазин потерял хорошего покупателя.

То есть у вас
(а) "несколько человек" купили шнурки
(б) при этом никто больше ничего не покупал (иначе бы рекомендация не была сформирована)
(ц) "хороший покупатель" не прочитал описание товара
(д) "хороший покупатель" после покупки счел это виной магазина, а не своей ошибкой


Скажите, какова вероятность такого сочетания событий?


Живой продавец такого не посоветует, да.

Мне вот "живой продавец", в ответ на мой прямой запрос (то есть даже не "что-нибудь подходящее" к, а поиск под задачу), посоветовал товар, который эту задачу не решил в итоге. При этом у него опыт есть, причем не только в продажах, но и в предметной области.


Живой продавец не посоветует, ага.

(ц) — близко к 100%
(д) — математически-предельно близко к 100%.
ну, пункт (б) — это очередной Ваш слив.
если новомодные системы работают на формирование рекомендации только с теми, кто «больше ничего не купил», а в более сложном окружении не умеют выявлять (статистически значимые) паттерны потребительского поведения — нахрен вообще они нужны? Я, впрочем, не возвожу на всякие там нейросети, да на самообучающихся роботов, ещё и такое обвинение, это Вы от себя ляпнули лишнее в пылу спора.

«Нет, Вам не нужно ML» — говорит автор статьи, но он совершенно не имеет в виду «нет, ML на самом деле не умеют решать те задачи, которые решаю я». Умеют.

Мне вот «живой продавец», в ответ на мой прямой запрос (то есть даже не «что-нибудь подходящее» к, а поиск под задачу), посоветовал товар, который эту задачу не решил в итоге.

Да, роботы — одинаковые, а живые продавцы — разные…

как и разные — категоризаторы и контент-менеджеры для ML-алгоритмов, которые проставляют значения в ключевые поля. Самокоррекция системы по «статистике заходов и последующих покупок» же кривизну категоризации может миллион лет не выправить, если без человеческого надзора. Опровергните формально, если Вам не заходят «фантазии».

Но Вы назовите задачу (хоть это — не коммерческая тайна??) — и подумаем вместе, лучше бы справился робот? Может, задача некорректна? Может, робот бы просто поправил Ваше «сделай в виде котёнка» — на «сделай, как у всех», и только за счёт этого решение бы больше Вас устроило? А кого-то — нет.
ну, пункт (б) — это очередной Ваш слив.

Нет, это демонстрация того, что вы не понимаете, как работает рекомендательная система. Если бы в моделируемой ситуации были более релевантные покупки, они были бы выше по рангу, и показались бы раньше, чем ваши шнурки от берцев.


живые продавцы — разные

Тем не менее вы делает утверждения за всех живых продавцов.


Самокоррекция системы по «статистике заходов и последующих покупок» же кривизну категоризации может миллион лет не выправить,

Ха. Тривиальный наколеночный LTR "понимает", что страна происхождения вина не важна, приблизительно на третьем-четвертом клике на вине из страны, отличающейся от исходной.


Соответственно, если у нас есть продукт, который неверно категоризован, но по остальным признакам близок к стартовому, и люди его регулярно просматривают, в какой-то момент алгоритм перестанет обращать внимание на эту категоризацию.


Но Вы назовите задачу (хоть это — не коммерческая информация) — и подумаем вместе, лучше бы справился робот?

Я не утверждал, что робот справился бы лучше (робот бы просто не делал никакой рекомендации, за отсутствием у него соответствующей информации), я утверждаю, что люди совершают ошибки, и достаточно часто.


А задача-то была тривиальная — мне нужна была обувь для четырехдневной пешки по Исландии в июне.

Склонность людей ошибаться есть оборотная сторона их способности находить интересные решения. Но, возможно, это не про того конкретного чувака… Так чем плоха оказалась та обувь, которую он Вам впарил?
Склонность людей ошибаться есть оборотная сторона их способности находить интересные решения.

Занятно, что для машинных рекомендаций вы такой же аргумент не признаете.


Так чем плоха оказалась та обувь, которую он Вам впарил?

Не подошла под задачу.

> пока так (список критериев отбора товара прилагается)

А критерии отбора взяты из подсказок прошлого, верно?

> а если вижу, что выходит фигня

То есть делаете ровно то же самое, что делает автоматизированная система, только плохо, разве не так?

> Живой продавец такого не посоветует, да.

Так это же плохо, что не посоветует, ведь это хороший совет. Такие советы будут привлекать покупателей. Мне непонятно, почему в считаете это плохим примером, если это как раз удачный пример — вы вот со своей «семантикой» советовать шнурки бы не стали, а система посоветовала. В результате больше довольных клиентов и выше прибыль.

> Нет. Если это работает, значит, удалась разводка на импульсивности и очарованности покупателей новыми технологиями.

В смысле нет? Еще раз, есть наблюдаемый статистически значимый факт — люди покупают огурцы с кроссовками. По вашему это может происходить _само по себе_, без каких либо причин?

> Вы вообще понимаете, что такое случайность, по своей природе?

Конечно, понимаю. Но, видите ли в чем дело, наука это тоже понимает, по-этому были выработаны специальные статистические методы, которые позволяют оценивать стат. гипотезы и гарантировать, что огурцы с кроссовками — это не случайность, а тенденция, с достоверностью такой же как то, что завтра взойдет Солнце.
А критерии отбора взяты из подсказок прошлого, верно?

Нет, не из таких подсказок, которые имеете в виду Вы.
Из знания природы товара — это тоже в каком-то смысле «из прошлого», но смысл совсем другой.
Если я маркетолог, это не значит, что я годами сидел на берегу бесконечной реки, следил и запоминал, какие башмаки с какими шнурками покупаются и только замутнил это статистическое наблюдение своими человечьими понятиями «смысл»-«бессмысленно».
Лучше всего мне вообще не знать, что с чем статистически покупается, так больше шансов дать вкусную и полезную рекомендацию в стиле «к этому товару ОБЫЧНО ЗАБЫВАЮТ КУПИТЬ».
Мало ли, какие у кого заблуждения. Вы настаиваете, что нужно на них зарабатывать, а не влиять и не устранять заблуждения своими подсказками? Ну, во взрослом мире так и делают, видимо, но это не единственная возможная модель продаж, знаете ли.

В смысле нет? Еще раз, есть наблюдаемый статистически значимый факт — люди покупают огурцы с кроссовками. По вашему это может происходить _само по себе_, без каких либо причин?

Да, за счёт самоподдерживающегося ожидания (Вы старательно сооружаете эту ловушку закрепления дегенеративных практик, если проводить аналогию с теорией эволюции: бессмысленные рекомендации повышают показатель совместной продажи и начинают показываться чаще) и большего игнорирования обратной связи после покупки.
В моём примере со шнурочками от берцев, не факт, что мы этого покупателя потеряем, конечно же, это моё преувеличение. Но по крайней мере, напоровшись, он будет знать, что про ботинки у вас лучше не спрашивать.

Мне непонятно, почему в считаете это плохим примером, если это как раз удачный пример — вы вот со своей «семантикой» советовать шнурки бы не стали, а система посоветовала. В результате больше довольных клиентов и выше прибыль.

Угу, только в моей формулировке примера куплены шнурки, которые не пролазят в дырочки в новых кроссовках. Просто у всех, кто покупал такой комплект, стояли в шкафу ещё и берцы, а у этого бедолаги — нет, он решил, что это к новым кроссовкам. Ну да, есть раздел «аксессуаров», какой-то разумный, а не стихийный, подход к категоризации. Но см. выше: мой оппонент радостно предвкушает, что «статистика» быстро выучится «человеческий фактор» нам игнорировать.

Конечно, понимаю. Но, видите ли в чем дело, наука это тоже понимает

Это была подколка. На самом деле, этого никто не понимает. :)
Разве что, разработчики квантовых симуляторов случайных чисел что-то такое постигли, но далеко не всё.
Монетизировать можно, конечно, и то, что Вы не можете понять, но позвольте ещё один пессимистический вздох здесь…
Наука статистика научилась как-то отгораживаться от случайности, выявлять разного рода biases и автокорреляцию, и то, Вы её наработки оборачиваете вспять, старательно сооружая ловушку самоподдерживающихся ожиданий.
Мне было бы интересно услышать от lair'а или от Вас или от кого-то ещё, как решают эти ваши премудрые системы такого рода проблемы, но пока слышу только «фантазии прочь», «проблема Вами надумана». У меня суеверие, угу.
специальные статистические методы, которые позволяют оценивать стат. гипотезы и гарантировать, что огурцы с кроссовками — это не случайность, а тенденция, с достоверностью такой же как то, что завтра взойдет Солнце.

Пфф, вообще-то это не методы гарантируют, а Закон Больших Чисел: на бесконечной выборке можно подтвердить любую гипотезу.
Но, наверное, «хорошо, Абраша, будешь у меня счетоводом». О случайности не надо рефлексировать и фантазировать, ею торговать пора! Куй железо, пока горячо.
Мне было бы интересно услышать от lair'а или от Вас или от кого-то ещё, как решают эти ваши премудрые системы такого рода проблемы,

Какие именно проблемы?

Проблемы разного рода устойчивых вырождений системы.

— Вредных самоподдерживающихся рекомендаций, например. Да, это теоретическая проблема (пока что), но репутационный риск явный. Система обучается методом проб и ошибок, правильно?
— Рекомендаций, невыгодных (сравнительно) магазину: низкомаржинальных аналогов, прежде всего. Ещё напрашивается вариант со «шведским фильтром для кондея вместо китайского»; надо полагать, магазину выгоднее продать Вам за год 10 китайских, чем один шведский, но это, как бы, благо для потребителя.
— А не подскажет ли Вам система китайское барахло? (причём, китайский товар теоретически-то может быть и не барахлом, так что не Вы, так кто-то другой поддержит такую рекомендацию, а шведское качество «вымоется» напрочь из подборок). Вы тут выше уповаете на потребительские рейтинги, «пятизвёздную систему голосования», но, во-первых, будет ли отдельный магазин с этим заморачиваться, тратить деньги на внедрение ещё и рейтингов, если не может такое голосование скомпрометировать в свою пользу? Во-вторых, а покупатели по каким критериям голосуют, точно ли это качество? А репрезентативна ли выборка проголосовавших?
Глобальный вопрос: если купить самообучающуюся систему, может ли пользователь произвольно вмешиваться в её работу, вручную «рубить» конкретные рекомендации, а также выставлять какие-то дополнительные коэффициенты к корреляциям, по тем показателям, которые важны ему — или его туда «не пустят внутрь»? «Расслабься, рынок мудрее»?
Тогда давайте ROI и прочую финансовую статистику, прежде чем начинать любые споры о нужности-ненужности.
С другой стороны, если туда можно лазить, то это уже и нерд в штате, и почти автоматически сильная компрометация рекомендаций, не согласны?
Вредных самоподдерживающихся рекомендаций, например.

Давайте сразу причем на конкретном примере, чтобы apples to apples. Вот нам надо сделать "с этим товаром так же покупают", то есть мы стоим в корзине, в корзине есть какой-то набор товаров, нам надо порекомендовать товары на основании того, что еще раньше было в корзинах с таким же товаром. Пока даже без категорий, чтобы проще было.


  1. Покажите, пожалуйста, сценарий, в котором возникнет вредная рекомендация.
  2. Покажите, пожалуйста, как такая задача решается на SQL.

Рекомендаций, невыгодных (сравнительно) магазину: низкомаржинальных аналогов, прежде всего.

Решается назначением марже как признаку более высокого веса в ранжировании (причем этот признак исключается из LTR).


Вы тут выше уповаете на потребительские рейтинги, «пятизвёздную систему голосования», но, во-первых, будет ли отдельный магазин с этим заморачиваться, тратить деньги на внедрение ещё и рейтингов, если не может такое голосование скомпрометировать в свою пользу?

Нет, я уповаю в первую очередь на просмотры и покупки. Рейтинги — это приятная, но необязательная дополнительная информация.


Глобальный вопрос: если купить самообучающуюся систему, может ли пользователь произвольно вмешиваться в её работу, вручную «рубить» конкретные рекомендации, а также выставлять какие-то дополнительные коэффициенты к корреляциям, по тем показателям, которые важны ему — или его туда «не пустят внутрь»?

Зависит, очевидно, от конкретной системы и ее реализации. Технически такое возможно.


С другой стороны, если туда можно лазить, то это уже и нерд в штате, и почти автоматически сильная компрометация рекомендаций, не согласны?

Не согласен ни с тем, ни с другим.

Если я маркетолог, это не значит, что я годами сидел на берегу бесконечной реки, следил и запоминал, какие башмаки с какими шнурками покупаются и только замутнил это статистическое наблюдение своими человечьими понятиями «смысл»-«бессмысленно».

Ну вообще-то именно на таких наблюдениях и основан весь маркетинг. Почему, когда согласно этим наблюдениям принимает решение маркетолог — все хорошо, а когда то же самое решение исходя из тех же самых предпосылок принимает автоматическая система — это плохо?


Лучше всего мне вообще не знать, что с чем статистически покупается, так больше шансов дать вкусную и полезную рекомендацию в стиле «к этому товару ОБЫЧНО ЗАБЫВАЮТ КУПИТЬ».

А каким образом вы эту рекомендацию дадите? Наугад? Вы серьезно полагаете, что выбирая товары наугад у вас получите давать "вкусные и полезные" рекомендации?


Да, за счёт самоподдерживающегося ожидания

За счет какого еще ожидания?


Вы настаиваете, что нужно на них зарабатывать, а не влиять и не устранять заблуждения своими подсказками?

О каких вообще заблуждениях речь? Вы о чем сейчас?


Но по крайней мере, напоровшись, он будет знать, что про ботинки у вас лучше не спрашивать.

Почему? Мы же ему помогли, дав хороший совет. После этого он опять к нам обратится.


Угу, только в моей формулировке примера куплены шнурки, которые не пролазят в дырочки в новых кроссовках. Просто у всех, кто покупал такой комплект, стояли в шкафу ещё и берцы, а у этого бедолаги — нет, он решил, что это к новым кроссовкам.

Такого быть не может. Если у всех до этого берцы были — значит, и у этого они есть.


старательно сооружая ловушку самоподдерживающихся ожиданий.

Опять ваши самоподдерживюащие ожидания. Какое они вообще отношение к делу имеют? Зачем вы их выдумали тут?


Пфф, вообще-то это не методы гарантируют, а Закон Больших Чисел: на бесконечной выборке можно подтвердить любую гипотезу.

Нет, нельзя.

Закон Больших Чисел: на бесконечной выборке можно подтвердить любую гипотезу.

Вообще-то, все, что говорит закон больших чисел, это "среднее значение конечной выборки из фиксированного распределения близко к математическому ожиданию этого распределения".


Что вы понимаете под "подтвердить гипотезу"? Какой именно статистический (или математический) аппарат вы используете для "подтверждения" гипотез? Как вы формулируете гипотезы?

А если есть деградация — кто-то, весьма вероятно, рано или поздно вернётся из Прежних Людей, кому-то удастся заработать для компании денег за счёт того, что «Вам нужен SQL». Вы же не думаете, что они вымрут с голоду, ожидаючи?
НЛО прилетело и опубликовало эту надпись здесь
Как-то много комментариев не по теме статьи получается. Кислое с мягким начинают сравнивать.

Это как посмотреть. Если на тему статьи смотреть как на проблему отставания практики применения новых технологий от их количества, то все по теме. Сторонники прогресса любой ценой спорят с консервторами.
Другое дело, что, например, адепты ML не всегда осознают, что использование обучаемых алгоритмов не освобождает от знания предметной области. То, что некоторые задачи решены, и оформлены в виде готового к применению инструмента, например, распознавание лиц, или речи, принципиально ни чего не меняет.

НЛО прилетело и опубликовало эту надпись здесь
перцептрон, т.е. то что сейчас называют AI был реализован в 60х годах

если только в качестве теории. практические мощности тогда были совсем не те, чтобы гонять такие задачи :)

НЛО прилетело и опубликовало эту надпись здесь
Вопрос ведь не в технической реализации как таковой, а в возможности архитектуры выполнять необходимые функции в разумное время (производтельность). Технически все, что угодно можно и на ассемблере реализовать…
Сколько лет матрично-векторные вычисления будут процеситься на SQL-движке, по сравнению с ML-архитектурами?
С одной стороны автору хочется сказать «Вам не нужен робот пылесос, вам нужен веник!».
С другой стороны статья как глоток свежего воздуха в этом сошедшем с ума мире IT.
Я один в комменты пришёл поговорить не об мл/аи, а о переводе?

Не дай бог запустить проект без упоминания AI. Серьёзно, ты правда в бизнесе?


Рунглиш наоборот какой-то.
бабло рулит, придумываются новые названия за которыми даже не всегда стоят новые технологии и все это с умным видом предлагается мало что понимающему заказчику, и заказчику даже редко кто шепнет, что нейронная сеть это не готовый продукт, а только лишь полуфабрикат, для которого надо найти или подготовить соответствующую выборку для обучения и обучить, а иначе просто ничего не будет — деньги на ветер

Тон статьи несколько странный. Видал я таких адептов SQL, которые пытались написать на SQL всё, включая HTTP-запросы и разбор JSON.

Всё обсуждение не дочитал: загрустил как-то. Антиутопичненько получилось. Ashes of the gloomy, по Пелевину.
Автор статьи недоумевает, зачем может быть нужно что-то сложнее ручного человеческого управления рекомендациями товаров покупателю…
(Коллеги, кто асилил всю бороду — скажите, а обсуждение так и не сходит с заданной автором области применения? При таком заголовке — «ВАМ не нужны» — шанс уже невелик, но всё же. )
Я вот понимаю, что пишут хабровчане… но тоже так и не понял, зачем может быть нужен ML/AI в рекоммендациях онлайн-сервисов. Потому что хочется автоматически развидеть юзкейсы торговли воздухом, тупого кидалова и разводилова покупателя на импульсивности. Любая «неочевидная» корреляция между кросс-сейловыми товарами, которую живой человек не способен ни заметить, ни объяснить, которая «выстреливает» при введении её в рекомендации — это же именно оно вот. РАЗВОДИЛОВО. «Купи ещё банку огурчиков к новым тапочкам, раз уж кошелёк достал! Почему так? А чтобы прям как у пацанов, а не одни только тапочки...»
Ну, да, уже слышу: «мы только предлагаем, а не навязываем», «что за ретроградство»… э, пофиг ваше возмущение, всё равно уже после амнистии обратно и так карму заминусовали…
Кто-то ещё скажет: «люди сами отдают роботам свою учётную информацию, им нравится и удобно»… Что ж, бывают шопоголики и просто несчастные люди с мощным кризисом самоидентификации, а бывают ещё пользователи, которые верят, что там сидит живой человек или знают, но забывают, что это не так. На них и НАЖИВАЕТЕСЬ.
Вот тут выше дядя написал: СКЛ задолбаетесь масштабировать, вот будет у вас 10000 категорий… Его поправили: ну, не категорий, а товаров, хотя категорий бывает сходное количество…
А почему, спрашивается, вы (магазин) начали торговать всем подряд, в чём синергия? За счёт чего отбиваете издержки и получаете прибыль на тысяче категорий: логистика или «умение торговать»? Умение торговать — это довольно зловещие стороны покупательской психологии.
Надеюсь, предел AI и ML в области «робот советует раньше, чем ты успел обдумать» не за горами — не технологический, а рыночный. Надеюсь, человечество переболеет упоротыми рекомендациями и все кросс-сейлы будут у живых продавцов. Те тоже пудрят мозги — будь здоров — и впаривают нередко то, что человеку не нужно — но в любой книжке по началам маркетинга вы узнаете (хотя и спорные) доводы в пользу ценности торговой услуги. Все эти доводы не имеют отношения, однако, к рекомендациям робота, как он представляется мне в наше время — то есть, не работающего с семантикой, а только с корреляциями. Вот это в чистом виде эксплойт человеческих слабостей и никакой добавленной ценности.

Я бы, однако, не стал писать такой длинный и скандальный комментарий, если бы не интересный мне вопрос.
Хабровчане, вы не в курсе, а есть, по аналогии с cross-sales, нечто вроде cross-procurement? И success story для ML и II в этой области?
Из статистики по совместным покупкам можно ведь выстроить эффективную систему планирования запасов, вот что я бы назвал прогрессом!
Тогда бы я не ворчал, что интернет-магазины охватывают тыщу категорий. Это за счёт именно эффективности.
Насколько я понимаю, всякие JIT-ы и прочие ERP до широкого внедрения компьютеров в принципе никому и в голову не приходили нигде кроме Японии, так? Вот для чего компьютер реально необходим человечеству: человек способен в голове обсчитывать бюджеты материальных запасов только двух первых ступенек сложности, а их, по-моему, уже четыре.

Я знаю, что в фармацевтике есть такая практика, когда продажники оптовика заходят в учётную систему ПОКУПАТЕЛЯ (в b2b) и сами ему формируют заказ, тот только утверждает… если успеет. Но не уверен, достаточны ли размеры фирмы в этой отрасли, чтобы потянуть ИИ.
Вы предлагаете любому бизнесу перейти на pro-bono? Любой бизнес должен зарабатывать деньги наиболее эффективным образом. Любой человек должен получать максимальное вознаграждение за свой труд. Все должны жить хорошо и богато. Это зравая экономика.

А «нажива», «разводилово», «богатые наживаются на бедных», «нас используют для того, чтобы впихнуть ненужное» и т.д. и т.п. — это филосифия совка, сорри.

Зачем нужен ML в онлайн-продажах объясню с точки зрения покупателя. При чем себя лично. Например, если я покупаю кондиционер, я хочу сразу же купить к нему фильтры. И у меня нет желания просматривать тысячи китайских подделок, читать отзывы, анализировать цены и т.д. Я хочу, чтобы мне предложили те фильтры, которые уже прошли все эти этапы проб и ощибок до меня тысячами людей. И я благодарен ML движкам, которые за меня отработали тонны этой информации и показывают мне 3-4 нормальных результата, с хорошей репутацией, из нормальных магазинов, поставщиков и которые подходят под мою модель кондиционера.
Это просто философия. Совковую философию минусовали бы более вяло. )
Есть объективные экономические ценности, есть на свете паразиты (хотя негодования их образ жизни у меня не вызывает), существует обман, симулякры в формировании потребностей и недобросовестные манипуляции и эксплойты людской невнимательности и импульсивности. Иногда государство — вовсе не советское — даже ограничивает «рыночные практики»: не упоминать в договоре важные пункты, там, заключать кабальные кредитные сделки… С чего бы это, выгодно же, все будут жить богато?!

Философия совка — это «ну, любая торговля по цене выше стоимости+логистики вообще разводилово». А я оговорился, что так не считаю. Информация о потребности и о продукции стоит денег.

Рейтинги от покупателей — возможно, Вы правы, отличная штука. Получается, ML в потребительских рекомендациях — не разводилово на импульсивности, а удобный информационный хаб, но… только для онлайн-маркетов, а тут всё обсуждение идёт — по CMSкам, программам лояльности внутри одного онлайн-магазина, построении паутинок «с этим товаром вместе почему-то покупают» — в интересах увеличения продаж. Или я не прав и кто-то ещё затрагивает Яндекс-маркет?
Какой-нибудь амазон тоже позволяет рейтинговать эти самые фильтры для кондея; наверное, они включают эту информацию объективным образом в рекомендательный сервис, но это пионеры технологии, и они не обязательно что-то зарабатывают конкретно с «хаба оценок и отзывов». Здесь же обсуждается максимизация продаж, в основном. Можно и хаб отзывов, впрочем, направить на максимизацию продаж вместо информирования… подсказать, как, или сами догадаетесь? Так что на уровне отдельных магазинов — другие эффекты.
тут всё обсуждение идёт — по CMSкам, программам лояльности внутри одного онлайн-магазина, построении паутинок «с этим товаром вместе почему-то покупают» — в интересах увеличения продаж.

Вы так говорите, как будто использование ML для "вам могут понравиться вон те кроссовки кроме тех, которые вы сейчас смотрите" — это что-то невыносимо порочное.

То, для чего ML необходимо, то, с чем не справится живой опытный аналитик + SQL, что лишено внятного смысла — предполагаю, что да, весьма небезупречная практика.

То есть то, что у магазина может просто не быть аналитика, вы не учитываете? А им как раз необходим ML, если они хотят решать такие задачи.


Собственно, большая часть рекомендательных алгоритмов как раз имеют внятный смысл — это тот самый смысл, который они вычленяют из пользовательских предпочтений.

Не понял, простите, запутался.
Аналитика нет — значит, необходима система с ML? Или как раз-таки аналитик есть — значит, потребует такую систему? И то, и другое представляется неверным, вопреки закону исключённого третьего, так сказать. )
Если нет аналитика — то как заработает ML? установил, запустил и ушёл, серьёзно?
Анализом корреляций вычленяется смысл — только для магазина, но не для потребителя. Для потребителя есть предложение и, так сказать, пример большинства собратьев, но НЕТ СМЫСЛА. Аналитика нет, а маркетолог, какие-нибудь онлайн-консультанты, наконец, есть? Если нету вообще никого, кто понимает, в чём удобство для покупателя той или иной «взаимовыгодной» совместной покупки — значит, прочь из кросс-сэйлов! такой онлайн-магазин неправомерно расширился на 100, 1000, 10000 категорий. Волна популярности, не более, она схлынет, когда все поймут (и станут держать в голове), что за «неочевидными советами» банки огурчиков к тапочкам не стоИт мудрость, опыт и забота о потребителе, а просто рандом. Ну, сейчас пока «приносит деньги»… впрочем, и тогда, когда суперуспешной станет считаться рекомендация робота с 0.01% отбивкой — продажникам айти-отделов удастся и дальше позиционировать упомянутые системы как супер-эффективные… тем предпринимателям, кто не читает подобных статей и не требует конкретных цифр.
Аналитика нет — значит, необходима система с ML?

Нет, значит, автоматическая рекомендательная система принесет какую-то пользу (потому что иначе рекомендации брать неоткуда).


Или как раз-таки аналитик есть — значит, потребует такую систему?

Если аналитик есть, это уже его дело, чем пользоваться.


Если нет аналитика — то как заработает ML? установил, запустил и ушёл, серьёзно?

Совершенно.


Анализом корреляций вычленяется смысл — только для магазина, но не для потребителя.

Ну так мы на позиции магазина и стоим, вроде как. Потребитель может вообще не видеть корреляций.


Для потребителя есть предложение и, так сказать, пример большинства собратьев, но НЕТ СМЫСЛА.

Предложение либо подходит покупателю, либо нет. Какое ему дело до смысла?


Аналитика нет, а маркетолог, какие-нибудь онлайн-консультанты, наконец, есть?

Есть. Но они не умеют программирование и запросы к БД.


Если нету вообще никого, кто понимает, в чём удобство для покупателя той или иной «взаимовыгодной» совместной покупки — значит, прочь из кросс-сэйлов!

Но почему?


такой онлайн-магазин неправомерно расширился на 100, 1000, 10000 категорий.

А кто вообще сказал, что он расширился?


Волна популярности, не более, она схлынет, когда все поймут (и станут держать в голове), что за «неочевидными советами» банки огурчиков к тапочкам не стоИт мудрость, опыт и забота о потребителе, а просто рандом.

Я пока говорю об очевидных советах.

Ну так мы на позиции магазина и стоим, вроде как. Потребитель может вообще не видеть корреляций.

Вооот. На что и направлен весь мой — то ли социальный пафос, то ли интуиция экономического прогнозирования для отрасли.
Будет долго не видеть — свалит от таких роботов-советчиков в живые продажи, и слава Богу.
А кто вообще сказал, что он расширился?

Само и сразу появилось 1000 категорий? Или всё-таки начинали с чего-то одного, потом заключили контракты с поставщиками, наладили логистику, стали торговать не только тапочками, но и огурцами?
Будет долго не видеть — свалит от таких роботов-советчиков в живые продажи,

Но зачем, если он пришел за конкретной покупкой, и она была совершена успешно? Если рекомендации его не интересуют, он их просто проигнорирует.


Само и сразу появилось 1000 категорий

А я и про тысячу категорий не говорил. Я тут, знаете ли, в рамках одной категории строю рекомендации, а тысяча мне только усложняет задачу.

Продажи — это про то, как человек не знает, чего хочет на самом деле, а мы ему помогаем определиться. Помогаем, а не пудрим мозги.
Кросс-продажи — тем более.
Если рекомендации его не интересуют, он их просто проигнорирует.

Скорее, заинтересуется, импульсивно купит, а потом ощутит «похмелье».
Или прочтёт что-то научно-популярное про то, как устроена рекомендательная система и отрефлексирует своё поведение (если умеет, а не является тем, что подразумевают под «жертвой ЕГЭ», ггг) (независимо от доходов).

С другой стороны… если магазины снимают с себя функцию квалифицированного информирования, но надеются и дальше получать некоторую сверхприбыль за эту услугу… вполне возможно, ход «народного голосования» разочарует и их. Ниже, про канцелярскую замазку вместо дорогих новых кроссовок — у меня вышла не совсем даже шутка. Тут как-то почти не обсуждается проблема более дешёвых (точнее, менее выгодных магазину с т.з. маржи) продуктов-заменителей, только взаимодополняемость.
Информацию по себестоимости в самообучающегося робота можно, конечно, вкорячить… Но она не статична тоже. От объёмов зависит у всех. И как робот вообще разберёт, где ошибка категоризации, где комплемент, а где субститут, если его поставили, включили и ушли — год назад?

Неее, только cross-procurement, только хардкор!
Скорее, заинтересуется, импульсивно купит, а потом ощутит «похмелье».

Эээ… откуда это "скорее"? Я не знаю (лично) никого, кто бы так делал.


если магазины снимают с себя функцию квалифицированного информирования

А она на них есть?


надеются и дальше получать некоторую сверхприбыль за эту услугу

А они ее получают?


Тут как-то почти не обсуждается проблема более дешёвых (точнее, менее выгодных магазину с т.з. маржи) продуктов-заменителей, только взаимодополняемость.

Кем не обсуждается? Я выше уже озвучивал сценарий с рекомендацией альтернативного продукта, а не продажи комплектов.


И как робот вообще разберёт, где ошибка категоризации, где комплемент, а где субститут,

А зачем ему это разбирать?

Короче говоря, не обязательно быть совком, чтобы рассуждать о судьбе человечества (так, будто для того приглашён к круглому столику), знаете ли. И чтобы различать ценности, символы и симулякры.
Можно быть просто умным.

Ethical coding isn't about communism either!
но тоже так и не понял, зачем может быть нужен ML/AI в рекоммендациях онлайн-сервисов.

Потому что это удобный инструмент выявления неявных связей (например, схожих фильмов). Или просто компенсации неполноты информации о продаваемых товарах и услугах.


Я вот последнее время активно пользуюсь рекомендательной системой Google Music — и она успешно работает.

Или просто компенсации неполноты информации о продаваемых товарах и услугах.

Это как??
Гугл-музыка — да, хорошо. (я, правда, проплатил за год Яндекс-музыки и доволен. Ну там сопоставимый по сложности механизм подбора похожих, тоже, видимо). И тоже не зациклено на увеличении продаж. Вряд ли автор обсуждаемой статьи имел что-либо подобное в виду.

Как-как… если люди регулярно покупают два товара вместе, значит эти два товара — хороший комплект, даже если это нигде в их характеристиках не записано. Или если люди регулярно покупают что-то, просмотрев 18 пар кроссовок, хотя у этого чего-то и не написано «кроссовки», то, возможно, это все-таки кроссовки.

люди регулярно покупают два товара вместе, значит эти два товара — хороший комплект
требует доказательства.

люди регулярно покупают что-то, просмотрев 18 пар кроссовок

Канцелярскую замазку — взглянув на цены тех 18 пар, ггг)
а если серьёзно —
возможно, это все-таки кроссовки.

отлов ошибок категоризации… и вообще механизм самокоррекции CMS-ки… гм, тоже как-то не пришло в голову. А такое есть или только в теории?

Но конкретно с категоризацией — вряд ли взлетит. 18 пар кроссовок — это явно не под лупу сайта с клавиатуры вбивали 18 раз… это наверняка по категории шли. (с какими-нибудь другими допфильтрами, м.б.)
ну, или по бренду…
требует доказательства.

Ключевое слово — "регулярно". Наблюдать за покупательскими предпочтениями — полезно.


отлов ошибок категоризации… и вообще механизм самокоррекции CMS-ки… гм, тоже как-то не пришло в голову. А такое есть или только в теории?

Есть.


Но конкретно с категоризацией — вряд ли взлетит.

Почему нет-то?


это наверняка по категории шли. [...] ну, или по бренду…

Ну да, по категории "обувь". Или по бренду Абибас. Не важно, как они это нашли, важно, что между "я искал" и "я купил" есть связь, которая не вытекает из существующей информации о товаре — и это (а) способ улучшить поиск и (б) повод улучшить информацию о товаре.

Ключевое слово — «регулярно». Наблюдать за покупательскими предпочтениями — полезно.

(!) Наблюдать (!). Вы как раз (выше) придерживаетесь того подхода, что нафиг наблюдателей, в современном мире лучше коробка.

Нет, я придерживаюсь того подхода, что для ряда задач "коробка" является достаточным наблюдателем.

Кажется, что большинство спорящих не совсем верно уловили суть статьи. Как это прочитал я: «Есть задачи, которые пытаются решить ML, хотя там вполне можно справиться обычным SQL». Правда ли это? Ну, очень похоже на правду. При этом нет упоминания того, что ML не нужно и ВСЕ решается через SQL.

Приведу пример из личной практики – сейчас очень много людей и компаний хотят блокчейном (как уже наверное всех достало это слово) решить проблемы того, что они данными обмениваются в экселях. Абсолютно та же ситуация – в погоне за хайпом люди ищут себеряную пулю, которая придет и спасет их бизнес, при этом игнорируя проверенные инструменты, которые уже долгие годы решают их боль.
На самом деле, ценность, и ML и SQL, как средства прогнозирования моего интереса автором преувеличены.
Например:
— я купил кроссовки. предложить сопутствующие аксессуары — это логичный и простой в реализации ход.
— понять, почему я это сделал, когда мне можно еще раз предложить этот товар, не рискуя показаться навязчивым, и что еще может меня заинтересовать — это задача другого порядка. (я действительно могу заниматься спортом, и тогда мне можно предложить спортивную одежду и инвентарь. я просто перемещаюсь по городу пешком, и мне важно не испытывать дискомфорта. тогда мне интересны: верхняя одежда, различные аксесуары, вроде зонтов, солнцезащитных очков, перчаток, и еще массы чего. у меня есть дети, и тогда ассортимент предложений тоже должен быть скорректирован)
— внесет ли ясность повторная покупка кроссовок, скажем через 6 месяцев? не особо. (я могу следить за модой, и поэтому мне захотелось обновить свой гардероб. я все таки спортсмен, и кроссовки просто не выдержали нагрузки, тогда мне нужно предложить что либо понадежнее, пусть и дороже. кроссовки просто оказались низкого качества, и тогда мне нужно предлагать все что угодно, кроме того, что я уже брал. мой ребенок подрос, и они ему стали просто малы, здесь предлагаем все тоже самое, что и было раньше).
— если первые 2 покупки состоялись, означает ли, что я готов совершить третью и последующие? не обязательно!!!
К чему я все это: в рамках предложенных автором условий применения, и ML, и SQL — это все равно гадание на кофейной гуще (даже если вам время от времени будет везти). Досканальное изучение человека может улучшить результат, но это, скорее всего, экономически нецелесообразно.
В том-то и дело, что когда нет датасета (трафика и конверсий, достаточных для обучения алгоритма) конкретного посетителя, применяется item-based подход: смотрим что покупали с этим товаром, ранжируем по цене, CTR или любой другой метрике, кидаем в рекомендации.

Когда есть датасет, мы обучаем алгоритм (ML) или усложняем текущую рекомендательную систему (SQL) с учетом новых данных, зависит от желаний и возможностей бизнеса. Есть ли разработчик для внедрения ML или ресурсы для его найма. Это user-based подход.

Ну и, собственно как всегда, истина посередине. Хабр
Коллеги! Мира всем!
Я, кажется, понял, отчего ещё столько копий сломано.
Безо всякой претензии на «последнее слово», на финализацию обсуждения, там, заявляю.
И не пытаясь примазаться к опытному менеджеру и бизнесмену, автору статьи… Там, где я против роботов-советчиков утверждаю своё «совковое» предубеждение — «повышает продажи, но нужно ли оно обществу, или это разводка?» — то на моей совести по-прежнему. Я неоднократно в этом обсуждении уточнял и аргументировал этот свой общественный пафос и не думаю, что меня и дальше будут хейтить так же активно за него — даже те, кто на повышении продаж такого вот рода сам зарабатывает.

Но сегодня днём меня осенило, что есть ещё расхождение в понимании «нужно/нужен». Я и Целестин Омин правы по-своему, почтенный lair — по-своему. И опыт друг друга во взаимодействии с (интернет-торговой) индустрией оттого и так легко и весело обесценивать, что мы как две лягушки из японской сказки.
Я как сопоставил указанную в профайле lair — а специализацию с тем, что он, столь раздражающим способом (подколки в комментах) пытается донести до общественности — понял. Действительно, ему, должно быть, знакомы работающие решения, брэнд которых составляет коммерческую тайну. Скорее всего, это его собственные текущие разработки, востребованность которых ему очевидна: раз заказывают и каждый месяц платят lair -у за реализацию, рассказывают на гугл-конференциях… Нужны ли вам новые возможности, если вы хотите открыть/возглавить интернет-магазин? Вопрос кажется риторическим. Не будешь что-то внедрять — сдохнешь.
А я вот не архитектор, а, большую часть айтишной карьеры, внедренец. Мне часто в неформальном внерабочем общении задают вопросы вроде — «сколько стоить мне будет — внедрить 1С?»
И в этом вопросе нет ничего башорговского, это тоже сконцентрированный опыт отрасли.
Сколько баксов нужно отложить на айти, чтобы открыть свой интернет-магазин?
Если под «нужно» понимать некий технологический порог вхождения в отрасль, современный стандарт — то утверждение Целестина правильно. Экселя вам не хватит, НУЖЕН SQL. А вот AI и ML — нет, заживёте и без него, сможете соответствовать требованиям современного покупателя (по крайней мере, в Нигерии). Грубо говоря, и без этих систем ваш бизнес не будет «истекать кровью», терять деньги. Те задачи, которые предлагает lair — либо иррелевантны задаче сохранить деньги продавца, либо не являются стандартом на сегодня. Но могут составить его конкурентное преимущество. Если кто-то хочет ПЕРВЫМ НА РЫНКЕ предложить реальный выбор из 900 белых платьев — а не из того количества, которое способен удержать в голове белковый мозг консультанта (предположим, более добросовестного), то можно разработать под это самообучающийся алгоритм, а все мои сомнения, будет ли она работать и не подкосит ли бизнес нахрен, выглядят умозрительными придирками, теперь понимаю.

Есть best practice, а есть state-of-the-art.
Так вот, магазин без живого консультанта и без живого товароведа — это пока даже не уверен, что state-of-the-art.

Является ли «первенство на рынке» необходимостью, которую надо закладывать в бюджет нового интернет-магазина? Возможно, да: «если быть, то быть лучшим, иначе незачем браться: всё уже поделено». Но конкурентное преимущество нового бизнеса может состоять вовсе не в рекомендательной системе, а, например, в логистике. Или вообще в чёткости исполнения заказов, которая у многих страдает. Инновации — всё ещё вовсе не только IT.

Уважаемый Bedal не прав, ИМКО, когда утверждает, что маркетолог — отжившая профессия. Пока ничего не свидетельствует об этом, кроме истеричной пропаганды гуглов и амазонов.
Если под «нужно» понимать некий технологический порог вхождения в отрасль, современный стандарт — то утверждение Целестина правильно. Экселя вам не хватит, НУЖЕН SQL.

Не, неправильно. Вам (как магазину) не нужен ни эксель, ни SQL, вам нужно работающее решение, и вам пофиг на чем оно построено.


Повторюсь, когда кто-то открывает интернет-магазин, у него совершенно не обязательно есть SQL-специалист. У него есть (хочется верить) специалисты в той области, в которой он торгует.

Да ничего не пофиг, на чём оно! Не надо доводить до абсурда нежелание бизнесменов вникать в «тонкости реализации». От того, на чём оно построено, зависит ценник. И вообще, ответ на тот вопрос, который задают мне (возможно, не Вам). И даже штат. (Ваше «живого консультанта нет» прозвучало, как будто вы из моей отрасли «приведения к стандартам» (best practices compliance), а не создания конкуретного преимущества (state-of-the-art), и для определения ценности внедрения решаете задачу типа «кого можно будет уволить»)
Я же сформулировал вопрос предельно чётко:
Братух, сколько мне баксов нужно отложить на айти, чтобы открыть свой интернет-магазин?

У него есть (хочется верить) специалисты в той области, в которой он торгует.

Да. И Целестин утверждает, что их хотелки можно реализовать в SQL. А такая коробка, чтобы их можно было разогнать после установки — это пока Ваша проекция, перспектива. У неё даже рыночного названия пока нет.
Братух, сколько мне баксов нужно отложить на айти, чтобы открыть свой интернет-магазин?

Зависит от того, что магазин должен делать, очевидно же. Потому что в минимуме — нисколько, если использовать готовые торговые площадки.


То же самое и с Экселем, и с SQL, и с ML. Есть задачи, есть их способы решения. Очерчиваем круг задач, выбираем набор инструментов.


И Целестин утверждает, что их хотелки можно реализовать в SQL.

А соседний программист утверждает, что можно реализовать без SQL, на какой-нибудь другой технологии из трех букв, за те же деньги. Так почему именно SQL — нужен?

Да прав я, прав. Если это мелкий магазин — ему сто лет не нужен SQL или что ещё. Ему нужно готовое искаропки, движок, на котором студент (дороже не нужно) сделает их супермагазин.
Если же это серьёзная контора, торгующая или нет — не так даже важно, ей тем более требуется большое централизованное решение, а не самописка, которая перестанет работать через месяц после того, как крутой спец уволится.
То, что Вы пишете — вообще применимо к очень узкой нише. Уверен, на Ваш век её хватит и она Вас и многих ещё покормит — но это всё равно ниша, и ниша постоянно сужающаяся.
Ниша есть. Специалисты есть. Маркетинговая наука есть, предназначенная для белковых мозгов. Дипломы выдают, вакансий столько, что на поступление конкурс.
Вымирать вся эта микросреда — разумеется, может, но пока не собирается. Студенты-говнокодеры её не убьют, потому что говнокодеры. Вы сравниваете с техобслуживанием автомобиля, но автомобили-то реально стали качественнее и сложнее в обслуживании (в том числе, автопроизводители искусственно осложнили). А тут что? Поветрие, описанное Омином как «как, вы ещё не купили ML?! Вы серьёзно в бизнесе?»
Так это секта… она же ниша… только не с той стороны, на которую Вы указываете.
Мне весьма по сердцу готишный флёр и предсказания грядущей идиотократии, но давайте всё-таки будем опираться на многоступенчатую логику и комплексный анализ.
Всё, сдаюсь! :-) Я же исходно писал о тенденции, а суровый реальный аргумент «в Задрищенском провинциальном университете программирования и туризма студентов этому учат, и всё идёт хорошо» не перебиваем в принципе.
Чистой логикой вообще ничто до конца не опровержимо, это с тех самых 50-х годов известно.
Но я думал, мы обмениваемся опытом и наблюдениями, а не «перебиваем».
я думал, мы обмениваемся опытом
Больше того — мы просто дружелюбно болтаем :-)
Ай, косякнул я, довольно позорно, прошу прощения! По тому, как фраза соотносится с контекстом дискуссии, видно даже.
С помощью наблюдений и статистики ничто до конца не опровержимо. Чёрного лебедя как философскую конструкцию придумал не Насим Талеб, а Карл Поппер, как нечто, подлежащее попыткам окончательного опровержения.
Логика как раз позволяет опровергнуть всё на свете. Если я не ошибаюсь, некто Куайн показал. Подтвердить до конца не может ничего.
не люблю философию, глубоко не уважаю. А Поппер, при всём к нему уважении — это уже на грани.
Кто владеет философией — всегда будет платить зарплатку нам с вами, да и lair'у, а не мы ему.
Не согласен. Во-первых, те, кто «платят зарплату» частенько (даже чаще всего, если верить этологам) в интеллектуальном плане — на уровне «так себе». Во-вторых, даже те из них, кто как-то владеет философией, пришёл к этому в силу образовавшегося свободного времени, отсутствия необходимости активно зарабатывать деньги. А вовсе не наоборот.

Скажите, у Вас нет в планах пункта «заехать на КавМинВоды»? Можно было бы пообсуждать за бутылочкой, ммм, минералки. А на письме опять словоблудие философия получится, ну её.
Есть задачи, есть их способы решения.

И ещё, есть некоторое понятие о том (список признаков), что такое самостоятельный «свой» интернет-магазин. Вам, видимо, этого никому не приходилось объяснять. И задумываться, что свой интернет-магазин — это не только рекомендательный сервис, но и логистика, и независимый ото всех контроль за исполнением заказов, и куча всего. В том числе, неайтишного.
в минимуме — нисколько, если использовать готовые торговые площадки.

Ну, Вы опять троллите, что ли?
И ещё, есть некоторое понятие о том (список признаков), что такое самостоятельный «свой» интернет-магазин.

Которое, естественно, всегда можно подогнать так, чтобы в него обязательно входил SQL. Очень удобно, да.


И задумываться, что свой интернет-магазин — это [...] независимый ото всех контроль за исполнением заказов

Знаете, вот когда ко мне приходят с требованием "независимый ото всех контроль", я немедленно спрашиваю, сколько именно люди готовы вложить в постройку собственной инфраструктуры. Обычно выясняется, что у "независимых ото всех" людей почта на публичном (а то и бесплатном) почтовом сервисе.

Вот мне «нравится» это Ваше — «подогнать».
Человек всю жизнь в айти «подогнал» под своё понимание — чтобы с Вами поспорить, что его бизнес не истечёт кровью без Ваших умопомрачительных передовых требующих ОБЧР задач (которые ещё не известно, удастся ли Вам решить — или жизнь вмешается. Инвестиции во всё такое недаром называются «венчурными»). Но Ваша победа — в том, что… Вы с ним не будете спорить. «Он слишком хорошо знает, что делает».

Итак, что по-Вашему значит «свой интернет-магазин»?
Вы ссылались на десятки тысяч покупателей у Конги, в которой рулит Омин. Могу понять так, что для Вас это валидный показатель перехода на некоторый новый уровень. От решения каких неизбежных проблем, по-Вашему, заслоняется автор статьи?
Человек всю жизнь в айти «подогнал» под своё понимание — чтобы с Вами поспорить

Эм. А зачем? У него свое понимание, пусть радуется. Это просто не повод мне рассказывать, что мое понимание неверно.


Итак, что по-Вашему значит «свой интернет-магазин»?

"ну, братуха, это когда люди приходят в интернет на сайтец, выбирают там мой товар, гонят мне бабло, а потом этот товар как-нибудь получают".


Вы ссылались на десятки тысяч покупателей у Конги, в которой рулит Омин.

Разве? Я ссылался на идею, что десять тысяч покупателей — это маленький магазин. По нынешним меркам, может, и маленький, но куда тогда записывать магазины с сотней покупателей? В микроскопические? Опять-таки ж, десять тысяч — это за когда? За все время жизни? За год? За день?

Итак, что по-Вашему значит «свой интернет-магазин»?

«ну, братуха, это когда люди приходят в интернет на сайтец, выбирают там мой товар, гонят мне бабло, а потом этот товар как-нибудь получают».

Это ПО-ВАШЕМУ?
Или Вы пародируете (перенимаете) мою стилистику? Напрасно. У нас с Вами разные ниши.

Это просто не повод мне рассказывать, что мое понимание неверно.

Ай-яй-яй, Целестин Омин!

Я ссылался на идею, что десять тысяч покупателей — это маленький магазин.

не думаю, что автор статьи стал бы настаивать на этой идее. Что он своей некомпетентностью, зашоренностью, ретроградством и неправотой-в-интернете мучает не такое уж количество людей, которое можно было бы назвать большим.

В общем. Не представляю, что Вы пытаетесь донести до комментаторов в комментариях. Что их построения — стеклянный домик, который рухнет от Вашего камня, что ли?
То, что можно придумать задачи, которые решаются с помощью ML-алгоритмов, но не решаются (точнее, не решаются оптимально, а не то, чтобы обнаруживали Тьюринг-неполноту языка программирования) с помощью SQL — всем, вроде как, очевидно.
То, что всем внушают, что интернет-магазин обязан решать именно такие задачи — с этим автор лично столкнулся. И не понимает, почему разорится, если не поставит ML… Вам не надо переубеждать его, переубедите хотя бы сочувствующих в комментариях.
Это ПО-ВАШЕМУ?

Нет, это один из вариантов формулировки.


Что их построения — стеклянный домик, который рухнет от Вашего камня, что ли?

Нет, что формулировка "вам не нужно машинное обучение" слишком громкая, чтобы быть верной.


И не понимает, почему разорится, если не поставит ML…

Он лично — не разорится, я подозреваю. Но это не значит, что этот опыт можно обобщать на все остальные магазины.

Ну, Вы хоть понимаете, что Ваша позиция сводится, получается, к «в интернете кто-то неправ»?
А рассказать, почему — Вам мешает коммерческая тайна.
Надеюсь, когда-нибудь… (это не сарказм).

А что, статьи на Хабре из какой-то другой позиции обсуждают?

(обиженным голосом)
минусы в карму ставят — точно «есть варианты»! Я вот комментировать могу теперь только раз в пять минут, а то ли ещё будет!
(ща заминусуют дополнительно за попрошайничество! ахахах, чудаки, у меня ещё обнулялка нетронутая)

а если серьёзно — да, ещё делятся опытом. Многие умеют в абстракции, так что не нарушают коммерческой тайны. Когда опыта достаточно на статью, то пишут статью, а не каммент в обсуждении, это выгоднее (мне так представляется).
Но вот с Вами я пообщался бы поподробнее, насчёт Вашего опыта, но в самых абстрактных и безликих категориях. Понял это одновременно с тем фактом, что Вы не просто тролль, который из любви к бросанию камушков в комментах пишет «а докажи-и...», а Архитектор, по всей видимости, с большой буквы. Пришёл повозмущаться, что их тут не уважили. Давайте уважим, я не против!
да, ещё делятся опытом

А одно другому не мешает. Просто если заранее относиться к чужому опыту как к нерелевантному — можно так ничего для себя нового и не узнать. Старый конь борозды не испортит, да; но и глубоко не вспашет.

если заранее относиться к чужому опыту как к нерелевантному

Если.
Хорошо, что я умею прерывать эту взаимную предубеждённость.
Надо бы ещё принести извинения, что я там напредполагал, что Вы к живым продажам не имеете отношения. Подотвык от среды, где тролли не водятся (при том, не исключены, гипотетически). Приношу. Хотел бы, чтобы Вы меня извинили.

можно так ничего для себя нового и не узнать

Итак, я не издеваюсь, расскажите пожалуйста! Что хорошего рождалось из «ботинки с огурцами покупают вместе, значит — неплохая пара», Вы знаете? Или — за это просто хорошо платят, значит, это всё имеет какой-то нечеловеческий смысл?
Что хорошего рождалось из «ботинки с огурцами покупают вместе, значит — неплохая пара», Вы знаете?

А это придуманный вами пример, почему я должен знать, что хорошего из него рождается?

Речь идёт о статистически значимых, но не очевидных и непостижимых какому-нибудь Целестину Омину корреляциях. То, с чем не справится SQL (в разумные сроки, по запросу, который можно сохранить в файле с разумным названием), зато найдёт и ухватится некий AI.

Эм. Если есть статистически значимая (после всех необходимых поправок) корреляция между покупками А и Б, значит, можно предлагать человеку, покупающему А, купить еще и Б — на уровне значимости из корреляции выше эта покупка ему будет полезна.


(другое дело, что поиск неочевидных корреляций — это далеко не единственное, с чем ML справляется, а SQL-без-ML — нет)

И? Опыт — в студию!

Опыт изложен выше. Или вам все применения ML в екоммерце перечислять надо? Так я всех не знаю, я сварщик ненастоящий.

Опыт — это (в нашем случае, коммерческая) отдача.
Где у Вас выше изложен такой опыт? Можно прямую ссылочку?

Коммерческая отдача — это не ко мне, я не маркетинг-специалист. Ко мне приходят уже со словами "нам надо вот такое".

Зато в интернете где-то не прав — некто, кто и маркетинг специалист, и исполнитель «нам надо вот такое», и полномочный представитель тех самых «нам».
Уважаемый lair, если Вы думаете, что что-то нам рассказали за всё это обсуждение — то проговорите про себя пожалуйста, что именно. Расскажите нам: получилось проговорить?
Зато в интернете где-то не прав — некто, кто и маркетинг специалист, и исполнитель «нам надо вот такое», и полномочный представитель тех самых «нам».

И все в одном лице, и с конкретными цифрами ROI.

Эм… это Вы сейчас на меня или на Целестина Омина?
Советую лучше на меня. А ещё больше советую — последовать моим предыдущим советам. У меня тут, чтобы так посоветовать — личный интерес… чужой опыт — правда интересный, честно!
Эм… это Вы сейчас на меня или на Целестина Омина?

На "некто" из вашего предыдущего комментария.

до завтра!
думаю, что завтра что-то интересное нам, гикам, расскажете.
и надо же до такого исступления дойти, чтобы заминусовать даже вот такое рассуждение!
«Нет, ни за что я не расскажу интересное гикам, пусть все видят, насколько позорно предположить, что я расскажу что-то интересное гикам, после сотен иронических комментариев на хабре!»
Спокойной ночи, Сергей! Утро вечера мудренее.
Нет, это один из вариантов формулировки.

Хреновый вариант формулировки, так-то. Никак не объясняет, с какими сложностями предстоит столкнуться:
«ну, братуха, это когда люди приходят в интернет на сайтец, выбирают там мой товар, гонят мне бабло, а потом этот товар как-нибудь получают».

Действительно, так можно торговать и на чужой платформе. И основную долю прибыли отдавать за то, что о логистике и хранении уже за Вас подумали.
Хреновый вариант формулировки, так-то.

С каким пришли.


Никак не объясняет, с какими сложностями предстоит столкнуться:

Ну так люди обычно и не знают, с какими сложностями им предстоит столкнуться, когда приходят и говорят "а сколько будет стоить".


Действительно, так можно торговать и на чужой платформе. И основную долю прибыли отдавать за то, что о логистике и хранении уже за Вас подумали.

Разделение труда, вот это всё. Какждый сам выбирает, чем он хочет заниматься.

Каждый сам выбирает, чем он хочет заниматься.

Но не выбирает технологический порог вступления.
«Вообще-то, он нулевой» — просто неправда. Это тогда будет не интернет-магазин. И не ответ на вопрос.
«Вообще-то, все-все юзают ML, а нерды в штате не нужны, потому что от них слишком большая зависимость» — тоже не ответ. Нерды в штате — это конкурентное преимущество, у любого конкурентного преимущества есть что-то вроде brick-фактора, а коробка, даже если вы её там когда-либо разработаете — не конкурентное преимущество. Разработка по индивидуальному заказу — да, конкурентное преимущество, но требует нердов в штате магазина. Но странно, что несколько комментаторов так упирают не на кирпич на голову, а на «а вот Омин уволится»… да с чего ему увольняться-то, если он нерд и самореализуется на текущем месте? Обычные продажники — да, утекают только так, да ещё прихватив с собой клиентскую базу… но тут мотивация допущенных к тайнам и возможности прихватить с собой ценнейшие нематериальные активы (здесь это будет не только клиентская база, но многолетняя репутация магазина) меньше, чем… слить базу из коробки, когда вы её изобретёте и навнедряете.
Но не выбирает технологический порог вступления.

Который, вновь, вы назначаете из удобного вам понимания задачи.


«Вообще-то, он нулевой» — просто неправда. Это тогда будет не интернет-магазин. И не ответ на вопрос.
«Вообще-то, все-все юзают ML, а нерды в штате не нужны, потому что от них слишком большая зависимость» — тоже не ответ.

Вы выбрали два ответа, ни один из которых я не давал. Удобно воевать с пугалом?


а коробка, даже если вы её там когда-либо разработаете — не конкурентное преимущество

Это очень странное утверждение. Конкурентное преимущество (потенциальное, конечно же) — это функциональность, которой нет у других магазинов, не важно, взята эта функциональность из коробки или же ее написали нерды в штате.

Вы выбрали два ответа, ни один из которых я не давал.

Я знаю. Про это нам с Вами можно с моим большим облегчением забыть:
в минимуме — нисколько, если использовать готовые торговые площадки.

И какой же Ваш настоящий ответ?
Удобно воевать с пугалом?

Ужасно неудобно, особенно, если не собирался воевать.

Конкурентное преимущество (потенциальное, конечно же) — это функциональность, которой нет у других магазинов

«Коробка» непременно будет, по определению будет у других магазинов. На том же языке страны обитания, в той же рыночной нише. Хотя, возможно, и не у всех. Но когда транзакционные издержки покупателя составляют пару кликов, представляется, что смотреть в Вашем магазине будут совсем на другие вещи. Коробка может стать технологическим стандартом, но не заметным отличием.
Я знаю. И какой же Ваш ответ?

"Зависит от задачи".


«Коробка» непременно будет у других магазинов.

Вот когда будет, тогда и перестанет быть конкурентным преимуществом.


(другое дело, что ровно та же логика применима и к "нердам в штате")


Коробка может стать технологическим стандартом, но не заметным отличием.

Чтобы она стала стандартом, сначала надо, чтобы она стала отличием, которое другие начнут нагонять.


(что характерно, это та самая ситуация "у тебя нет X — что ты делаешь в бизнесе", которая так всех веселит в посте и обсуждении)

другое дело, что ровно та же логика применима и к «нердам в штате»

Только в компьютерной игре.
В жизни умные люди уникальны.
Чтобы она стала стандартом, сначала надо, чтобы она стала отличием, которое другие начнут нагонять.

Это «коробка», она сразу сама по себе — копия. И у неё есть тираж, оправдывающий помещение в коробку, даже если модель допечатки физического носителя с софтом — P-O-D.

«Зависит от задачи».

ответ истинного разработчика )
Про отраслевые стандарты я спрашивал. К чему рынок привык. Ну да ладно, фиг с ним, с порогом.
В жизни умные люди уникальны.

Угу, осталось теперь надеяться что именно ваш "нерд в штате" — "умный", а не как все.


И у неё есть тираж, оправдывающий помещение в коробку

У современного софта нет тиража, у него есть количество установок, от которого его разработка окупается. Но это не важно, в общем-то.


Важно, что чтобы коробка стала "стандартом", нужно, чтобы она была востребована (ну или навязать административно, как некоторые стандарты безопасности). А этого не будет до тех пор, пока она не продемонстрирует своей выгоды; и в интервале между "она приносит выгоду избранным" и "она приносит выгоду всем" она и будет конкурентным преимуществом (с понятными оговорками).


ответ истинного разработчика

Ну да. Это же вы (вместе с автором статьи) против подхода "ML должен быть у всех", я просто этот же подход применяю ко всем остальным технологиям.


Про отраслевые стандарты я спрашивал.

А кто их, бишь, вводит и утверждает?


К чему рынок привык.

Рынок двигается со временем. Очень вот поучительно смотреть на оплату в интернет-магазинах с точки зрения "к чему рынок привык" (и отраслевых стандартов).

Публикации

Истории