Pull to refresh

Comments 441

Да, досадное недоразумение, в котором никто не виноват. Очевидно, мы начали готовить этот материал намного раньше, чем в час дня и параллельно с Артемом, так как за час написать такую статью невозможно физически. Нам кажется, материалы принципиально разные как по формату, так и по содержанию.

Тут больше подробностей по ограничениям

Астрологи объявили неделю OpenAI…
Да просто в преддверии International'а начинается небольшой шум в СМИ
UFO just landed and posted this here
UFO just landed and posted this here
Когда ж вы переведетесь. Вечно найдется какой-то нигилист, которому и так нечестно, и сяк. И то не прорыв, и это.
Любой прорыв начинается с маленьких побед. И OpenAI сделал несколько семимильных, на мой взгляд, шагов за год.

Атомную бомбу тоже начали с банальных «предположений о ядерных реакциях» в 30-х годах. В 38-39 году увидели, что когда облучали уран нейтронами образовывался вроде бы барий с массой в 2 раза меньше первоначальной. А через 7 лет Хиросимы и Нагасаки остались только угольки.

Если проводить аналогию, то само открытие ядерного расщепление не является прорывом до тех пор, пока не был построен ядерный реактор.
Да и компьютерное зрение по выделению объектов на изображении не сильно связано с мыслительным процессом. И механический удар по кнопкам тоже.
В исследовательских задач так точно.
Ох блин, надеюсь боты не оставят от нас угольки, следуя примеру, который вы привели :)

хотите чтобы угольков не осталось даже? экий Вы кровожадный.


по теме статьи, это не может не радовать. всегда начинается с малого, возможно уже при нашей жизни можно будет наблюдать сюжеты из книг Азимова.

В которых ИИ робот...
… успешно решил медленно поджарить Землю радиацией чтоб насильно разогнать человечество по галактике.
Внезапно, это решил не ИИ. Это решили люди, из первой волны расселения (космониты). И не для того, чтобы разогнать, увы. Недавно перечитывал всю серию «Foundation».
И тут же посыпаю голову пеплом… Все-таки KIVan прав, в итоге ИИ «передумал» в пользу будущего человечества.

Но в последний момент робот решил, что это подтолкнет человечество к расселению по галактике, прекратит долгую стагнацию. И принял решение, руководствуясь 0м законом.


Это разве не в конце "Стальных пещер"? А Foundation много-много лет спустя.

Всё так. Это было в «Основание и Империя». После «Стальных пещер».
UFO just landed and posted this here
Любой прорыв начинается с маленьких побед. И OpenAI сделал несколько семимильных, на мой взгляд, шагов за год.

Надо только учитывать не сам факт наличия шагов, но и их направление, т.к. часть сделана совсем не вперед. Год назад бот играл на миде на уровне одного из топ-мидеров мира, сейчас — не способен соперничать со средним игроком. Что будет, когда бот научится играть без ограничений и с расширенным пулом? Личный скилл на уровне 500-ммр помойки?

Вы говорите о другой метрике качества. Качество игры отдельного бота не равно качеству игры команды ботов. Вполне может даже оказаться, что попытка максимизировать качество на отдельном персонаже давала просадку метрики по команде в целом.
Тут надо понимать, что мы считаем важной доя нас метрикой и заниматься именно ей, проверяя в действительности, улучшается ли результат, в виде победы.

Вы говорите о другой метрике качества. Качество игры отдельного бота не равно качеству игры команды ботов.

Я говорю о том, что чем шире пул проблем, которые умеет решать бот, тем хуже он решает каждую из проблем пула. простая проблема специализации. В данном случае — мы непосредственно наблюдаем, как бот, который год назад выносил вперед ногами лучших мидеров мира, сливает теперь мид средним игрокам.
Совершенно очевидно, если бы теперешний бот умел бы играть на миде как тот, старый, то и в целом это бы повысило эффективность бота. Но он не умеет. Почему? Видимо, ограничение размера сети и выч. мощностей. Это важный момент. Если предел, при котором дальнейшее наращивание сложности сети не доступно, уже достигнут, то дальнейшее наращивание пула задач (а наращивать надо, ведь еще более 80 героев, причем среди них всякие "грязные" герои, которые ломают модель игры своим присутствием) не приведет ли к тому, что от бота, который идеально играл на миде на одном персонаже, мы получим бота, который вроде как может играть в доту в общем, в команде, на чем угодно — но делает это предельно плохо?

Не очевидно, что стало бы лучше. Это надо проверять с конкретными метриками.
"чем шире пул проблем, которые умеет решать бот, тем хуже он решает каждую из проблем пула."
Где-то есть статья из ML на эту тему?

Не очевидно, что стало бы лучше.

Совершенно очевидно.


Где-то есть статья из ML на эту тему?

Да любую книжку по нейросетям откройте, там вам напишут про соотношение между размером сети и количеством стимулов.

Открывал, открываю и не одну, поэтому и говорю, что это не очевидно. Это гипотеза, которую надо проверять.
А в мире DL вообще вредно пичкать модель своими априорными знаниями, которые могут оказаться ложными.
Открывал, открываю и не одну, поэтому и говорю, что это не очевидно. Это гипотеза, которую надо проверять.

Это не гипотеза, а доказанный факт. При прочих равных с лучшим мидером вы будете иметь преимущество в золоте. Вы можете проигнорировать это преимущество, сведя игру к варианту "с худшим мидером", по-этому не может возникнуть такой ситуации, что наличие лучшего мидера не скажется в плюс.
Другое дело, если проблема в том, о чем я и говорил выше с самого начала — не получается обеспечить "при прочих равных". Можно обучить бота идеальному стоянию на миде невермором, а можно — среднего качества игроком на пуле из 16 героев. Одновременно — сети уже не хватает, вот и приходится выбирать.

Вы говорите про человеческий опыт, а не про обучение модели.
Почему-то для вас тут стоит знак равенства. Хотя сами по себе утверждение сомнительно.
Вы говорите про человеческий опыт, а не про обучение модели.

Именно про обучение модели я и говорю. С чего вы взяли, что не про него?
У нас ситуация, в которой приходится жертвовать качеством модели ради того, чтобы она стала более универсальной.
Была модель на десяточку для одного персонажа, стала модель на 8, но для любого из 16. Понимаете?

Если про обучение модели, то можете подсказать где именно про озвученный вами вопрос почитать?

Про какой именно?

В этом и заключается технологическая сингулярность. Машина совершает действия, неочевидные или даже глупые с точки зрения человека, которые он сам бы никогда не совершил, но при этом достигает цели эффективнее, чем человек.

Машина совершает действия, неочевидные или даже глупые с точки зрения человека, которые он сам бы никогда не совершил, но при этом достигает цели эффективнее, чем человек.

У нас случай другой — в данном случае машина совершает действия, которые совершенно точно снижают эффективность достижения цели.

Извините, но вырву вашу фразу из контекста.
TAS для марио показал, что для того, чтобы развить максимально быстро большую скорость бега нужно сначала развернуться в противоположном направлении. Мне кажется, что это и есть то самое — совершенно точно снижение эффективности — зачем разворачиваться влево, если я бегу вправо? Тем не менее, это быстрее.

Мне кажется, что это и есть то самое — совершенно точно снижение эффективности

Нет, это не то же самое, т.к. в вашем случае механика игры предполагает, что можно бежать быстрее, развернувшись влево.
В рассматриваемом случае подобные ситуации логически невозможны.

Я вам тоже напомню, что выиграть матч — это не выиграть мид, не сделать больше убийств и не заработать больше золота. Выиграть — это снести тот самый ancient.
Не стоит из «я не могу связать» делать «логически невозможно». Я не вижу ни одного именно логического обоснования, кроме вашего субъективного взгляда.
Я вам тоже напомню, что выиграть матч — это не выиграть мид, не сделать больше убийств и не заработать больше золота. Выиграть — это снести тот самый ancient.

Так вот, если бы вы играли в доту, то знали бы, что про*б мида никак и ни в каком случае не может вам помочь снести тот самый ancient. Может помешать. А помочь — нет, не может.
С другой стороны, выигрыш мида — может помочь. Но никак не может помешать.
Потому что выиграв мид, вы можете делать все ровно те же самые действия, что и в том случае, если его проиграли. Но не наоборот.
Вы рассуждаете с той точки зрения, что это какой-то хитрый гамбит — пожертвовали пешкой (мидом), чтобы получить ферзя! Но если вы просто берете и на скиле тащите мид — вы ничем не жертвуете. Вы просто забираете ферзя.

Так вот, если бы вы играли в доту, то знали бы, что про*б мида никак и ни в каком случае не может вам помочь снести тот самый ancient. Может помешать. А помочь — нет, не может.

Расскажите это командам, которые играют по стратегии «задавить две линии» и в конкретной игре предпочитают взять более слабый мид, который отстоит кое-как, чтобы загнобить вражеского кора в хардлайне и одновременно выфармить своего керри в изи лайне. Это, конечно, не совсем кейс, когда мид, проигранный из-за скилла, ведёт к победе, но в этом случае мид, проигранный тактически, ведёт к победе.
> Расскажите это командам, которые играют по стратегии «задавить две линии» и в конкретной игре предпочитают взять более слабый мид

Вы вообще читаете, что вам пишут? В нашем случае никто не брал слабый мид, чтобы давить что-то другое. Никто не уходил с мида на ганг, оставляя вражеского мидера на фрифарме. Никто не жертвовал слабым мидером ради того, чтобы саппорты более активно помогали своему керри/давили вражеского керри/хардлайнера.

Мы говорим о том, что один и тот же герой стоит на миде n минут и либо играет хорошо (много добивает и денаит, хорошо давит оппонента), либо играет плохо (добивает/денаит меньше, дает оппоненту чувствовать себя свободнее).
Так вот, нет и не может быть никакой пользы в том, чтобы стоять на миде намеренно плохо вместо того, чтобы стоять там хорошо.
Может быть польза в том, чтобы уйти на ганг, может быть польза в том, чтобы пойти в лес, может быть польза в том, чтобы играть сейфово, может быть польза в том, что будет слабый мид в плане пика, но не может быть пользы в том, чтобы просто _играть хуже_.

У вас, похоже, проблемы с логикой.


Так вот, если бы вы играли в марио, то знали бы, что поворот влево никак и ни в каком случае не может вам помочь добраться до финала справа. Может помешать. А помочь — нет, не может.
С другой стороны, движение вправо — может помочь. Но никак не может помешать.

Но ведь мы выяснили, что в марио, поворот влево может помочь добраться быстрее. Ваша аналогия неуместна.


Еще раз — выиграв мид вы можете сделать все те же самые действия в тот же момент, что и не выиграв его. По-этому ситуация в принципе не может быть хуже. С другой стороны, если вы не развернулись сразу влево в марио, то вы уже не можете повторить те же действия, как с разворотом в тот же момент.

выиграв мид вы можете сделать все те же самые действия в тот же момент, что и не выиграв его

Нет аргументов, значит повторяйте это, пока все вокруг не поверят.

Нет аргументов

Нет аргументов в пользу чего? Вам что в этом тезисе непонятно? Какие действия вы не сможете повторить, выиграв мид?

5 борзых саппортов встанут на мид и влегкую выиграют против соломида. А вот дальше могут делать что хотят — скорее всего на этом их достижения на этой карте и закончатся, не будет ни опыта, ни денег, ни удобных позиций. Зато мид выиграли!
Вам же уже десяток раз объяснили что речь тут про индивидуальный перформанс игрока на миде. Речь не про помощь саппортов миду, не про ганги мидера на линии (и наоборот линий на мид), а про индивидуальную игру конкретного персонажа. Она стала хуже.
1. Ни одного объяснения не вижу. В лучшем случае я вижу только субъективное мнение.
2. Если вы обратите внимание на начало ветки с моим сообщением, то узнаете, что я указывал комментатору, что он приводит оценочное суждение, которое может оказаться и неверным. В ответ я только и слышу «выиграть мид АБСОЛЮТНО ВСЕГДА!!!111АДИНАДИН лучше, чем проиграть». Выиграть мид приятно, полезно и удобно, но это не гарантия победы.
но это не гарантия победы.
так такого никто и не заявлял.
Выиграть мид приятно, полезно и удобно
да, и ни в одной ситуации не хуже чем проиграть мид (при прочих равных), что вам и повторили десяток раз.
  1. Ни одного объяснения не вижу. В лучшем случае я вижу только субъективное мнение.

Для оценки действий мидера есть вполне конкретный объективный фактор — это соотношение кс мидеров к n минуте. В том случае, если в эти n минут мидеры не ходили на ганг/в лес и к мидерам не ходили на ганг/сейв — это оценка конкретно действий мидеров, изолировано от остальной карты.


Если вы в таких условиях к 10 минуте имеет кс, например, 50 против 30 противника, то вы как мидер лучше, чем если вы имеете кс 30вс50 (наоборот).


И нет никакого смысла просто взять и отдать противнику кс, не добивая крипов. Это ровно то же самое, что крипов эти 10 минут добивать, а потом передать ему эту часть голды/опыта, например, нафидев под вышкой.


Мне искренне непонятно, что может быть непонятно в такой простой ситуации. Мне кажется, что вы просто троллируете, пытаясь показать себя сильно глупее, чем вы есть на самом деле.

простая проблема специализации

Простая проблема более долгого и качественного обучения. Предполагать, что научить играть в доту НЕ получится — это крайне странно после всех примеров. Вопрос только, насколько быстро. Успеют за месяц или за год? Или придется пять лет ждать новых идей в обучении?

Простая проблема более долгого и качественного обучения.

Еще раз — в результате долгого и качественного обучения мы наблюдаем не прогресс, а деградацию бота. Бот, который близко к идеальному играл в одних конкретных условиях, превратился в бота, который играет просто хорошо во многих.


Вопрос только, насколько быстро. Успеют за месяц или за год?

Вопрос не в том, насколько быстро, вопрос в том, хватит ли выч. мощностей.


Или придется пять лет ждать новых идей в обучении?

Новых идей в обучении нейросетей не было уже 50 лет, со времен появления персептрона Розенблатта. Ждать надо будет революции в производстве выч. техники, чтобы закон Мура снова стартовал и лет хотя бы 20-30 проработал.

мы наблюдаем не прогресс, а деградацию бота.

Вы — видимо да. Мы наблюдаем прогресс. Очевидно, что пространство возможностей кардинально расширилось и боты с ним вполне прилично справляются.


Просто прошлый раз они заточили бота на одну операцию (в некотором роде overfitting), а сейчас обучают на большом пространстве. Ваши доводы выше я прочитал, но они не подходят именно из-за того, что пространство расширилось (например, на миду может появиться второй враг, именно поэтому точно та стратегия, которой бот пользовался в 1v1 не подходит, стратегия изменилась. Для вас она выглядит хуже, зато его не будут внезапно забирать с фланга).


Новых идей в обучении нейросетей не было уже 50 лет

Не знаю, в какой заморозке вы были, но Proximal Policy Optimization, разумеется, новая идея.

Вы — видимо да. Мы наблюдаем прогресс.

Значит, вы плохо смотрите. Бот совершенно объективно хуже справляется с задачей стояния на миде.


Просто прошлый раз они заточили бота на одну операцию (в некотором роде overfitting), а сейчас обучают на большом пространстве.

Так я же об этом и говорю. Расширить пространство без падения качества не вышло — а тогда нет причин полагать, что качество и дальше не будет падать. В итоге у нас будет цепь "бот почти идеально играющий в миде на неверморе" -> "бот хорошо играющий одним из 16 героев в доту почти без ограничений" -> "бот плохо играющий любым героем без ограничений".


Не знаю, в какой заморозке вы были, но Proximal Policy Optimization, разумеется, новая идея.

Что в ней нового? Обычный стохастический градиетный спуск, напичканный эвристиками, привет началу 60х. Это не то что шаг вперед — это шаг назад от персептрона Розенблатта (на пол десятка лет), алгоритм которого гарантированно сходится за конечное время с верным результатом.

Если это шаг назад — зачем используют? Логично предположить, что вы просто не видите, в чем тут шаг вперёд, потому вам кажется, что его нет.


Обычный стохастический градиетный спуск

Не обычный. Вообще, ваше высокомерие вряд ли уместно. Если это всё такое тривиальное — аргументируйте. Покажите что-то менее "обычное", если разбираетесь (на самом деле ясно, что нет).


гарантированно сходится за конечное время

Условно конечное. На таких задачах большая плоская сеть конечно гарантированно может дать то же результат, что и глубокая, но не на реальной практике. Добиться сходимости за разумное время (например, месяцы, как в данном случае, а не сотни лет) — это реально достижение и это реально новое. То, что вам проблема скорости обучения не знакома (и вы наивно полагаете, что дело только в железе) — это исключительно ваш просчёт.

Если это шаг назад — зачем используют?

А почему нет, если работает?


Не обычный.

Чем необычный?


Покажите что-то менее "обычное", если разбираетесь (на самом деле ясно, что нет).

Менее обычного пока не придумали.


Добиться сходимости за разумное время (например, месяцы, как в данном случае, а не сотни лет) — это реально достижение и это реально новое.

"Добиться сходимости за разумное время" — это когда доказано, что выч. требования для сходимости в некотором классе задач не превышают некоторое Х (которое в каком-то смысле полагается "разумным").
А этого никто не добился, так что не врите. Есть некий набор эвристик, который, как предполагается, иногда может помочь в некоторых (неизвестно каких) случаях. Но при этом никто не гарантирует что сходимость в принципе будет, не говоря уж о том, что она будет за разумное время (или с разумной вероятностью).
В отрасли банально с повторяемостью результатов фундаментальная проблема, а вы про то, кто чего добился рассуждаете.


То, что вам проблема скорости обучения не знакома (и вы наивно полагаете, что дело только в железе)

Именно в железе и дело в первую очередь. Да, когда железо (и размер выборок для обучения) сделало возможным обучение сетей в принципе — то этим занялись, и, что логично, появились некие оптимизированный под задачу версии стандартных и давно известных алгоритмов (того же градиентного спуска). Но именно железо дало возможность. Без скачка производительности никакие оптимизации бы не помогли.

Менее обычного пока не придумали.

А вы в другой области покажите. В любой, за последние 50 лет. А я скажу, "нет, это банальный Х". Поиграем разок в вашу странную игру "ничего нового не придумали". Интересно посмотреть на ваши критерии "нового". Подозреваю, что это ваша особенность мышления "ничего нового не бывает, все похоже на что-то старое".


когда доказано, что выч. требования для сходимости

Не врите (с).
Добиться сходимости за разумное время — это получить результат. Вы можете выставлять какие угодно требования и считать себя самым умным, однако это лично ваше дело. К дискуссии отношения не имеет.


То, что не любой алгоритм даст математическую гарантию сходимости в любой ситуации тоже к дискуссии отношения не имеет. К реальным практическим задачам — тоже.


А почему нет, если работает?

А почему для этой задачи не использовать персептрон? Он лучше, на ваш взгляд, справится?

А вы в другой области покажите. В любой, за последние 50 лет.

Метод опорных векторов с нелинейным фильтром?


Добиться сходимости за разумное время — это получить результат.

Нет, это не так. То, что у кого-то на конкретной задаче что-то один раз сошлось — ничего абсолютно не значит, это не результат. Так же как если кто-то пошел в казино, дважды поставил на зеро и выиграл — это не результат, до тех пор, пока не предоставлен способ выигрывать ставя на зеро с какими-то разумными гарантиями.


То, что не любой алгоритм даст математическую гарантию сходимости в любой ситуации тоже к дискуссии отношения не имеет.

Зачем в любой? Достаточно знать, что он даст сходимость (пусть даже с какой-то вероятностью, но эта вероятность должна быть оценена и желательно выше чем "наугад") в какой-то ситуации, которая четко и явно описана. Иначе — это все становится с точки зрения практики бесполезным.


К реальным практическим задачам — тоже.

Как раз-таки имеет это отношение к практике и самое прямое. Отсутствие соответствующих мат. теорем выводит нейросети за пределы инженерных дисциплин в область живописи или стихосложения, т.к. результат становится принципиально неповторяем. Печально, что вы не видите в этом проблемы.


А почему для этой задачи не использовать персептрон? Он лучше, на ваш взгляд, справится?

Возможно, и лучше. А возможно — и хуже. У нас же нету никаких свидетельств в пользу того, что те сети, которые используются на данный момент в OpenAI, подходят к задаче лучше обычного однослойного персептрона? Нету. Как нету и обратных.

Метод опорных векторов с нелинейным фильтром?

Обычная минимизация функции. Ничего нового со времён работ Крамера двадцатых годов.


К тому же, это просто улучшение обычного SVM, которому уже 55.


У нас же нету никаких свидетельств в пользу того,

Нет свидетельств? Может вы перепутали и хотели сказать "доказательств"? Свидетельств-то сколько угодно. Конечно глубокие сети справляются лучше, чем перцептрон, на большинстве задач. Да и научных работ на эту тему множество. Вы конечно, можете их все обесценить, мол, это не наука, а художества.


у кого-то на конкретной задаче что-то один раз сошлось 

А если у тысячи человек сошлось на определенном классе задач и есть куча информации, в каких условиях не сходится — это уже наблюдение. На него можно опираться и получать практические результаты.


в какой-то ситуации, которая четко и явно описана. Иначе — это все становится с точки зрения практики бесполезным.

Так определенные архитектуры и дают результат в четкой ситуации с какой-то вероятностью (выше рандома). Хочешь получить результат в распознавании изображений — бери сверточную сеть. Если не исследование ведёшь, а именно результат нужен. Конечно было бы классно иметь теорему, которая говорит, что сверточная сеть лучше всего на этом классе задач, но её пока нет. Есть наблюдения, исследования и куча практических результатов. Взять сверточную сеть именно с точки зрения практики — разумно.


Печально, что вы не видите в этом проблемы.

Вот этот абзац я пишу с помощью распознавания голоса. Печально что вы не видите реальных практических результатов и утверждаете что они неповторимы.

Обычная минимизация функции. Ничего нового со времён работ Крамера двадцатых годов.

Метод опорных векторов — это, содержательно, способ приведения задачи классификации к задаче минимизации. То есть — вы привели, SVM на этом по факту закончился. Саму задачу минимизации вы уже можете решать как хотите, вообще говоря. Так что ваше утверждение не совсем верно.


К тому же, это просто улучшение обычного SVM, которому уже 55.

Но он не является его частным случаем. Вы не можете из SVM сделать SVM с нелинейным фильтром, меняя как-либо входные параметры SVM. В случае с PPO — ребята просто предлагает полученную на основе эвристик целевую функцию, которая является входным параметром алгоритма. Замена целевой ф-и не меняет алгоритм.


А если у тысячи человек сошлось на определенном классе задач и есть куча информации, в каких условиях не сходится — это уже наблюдение.

Да, но в данном случае сходится одна конкретная сеть на одной конкретной задаче, при этом она же не сама сходится — процесс обучения постоянно контролируется человеком, постоянно вносятся правки в процесс. Если вы поставите другого человека — он будет вносить другие правки и у вас получится другой результат, даже если будет использоваться тот же алгоритм обучения. А если вы даже в рамках той же задачи используете другую обучающую выборку, или, например, сам алгоритм случайно пойдет немного не так (что возможно, если он стохастический) — то, опять же, будут другие наблюдения и другие правки, при этом все эвристики, которые вы делали в прошлом случае, окажутся хорошо если бесполезными (а на практике с большой вероятностью они могут быть вредны!).


Так определенные архитектуры и дают результат в четкой ситуации с какой-то вероятностью (выше рандома).

В какой ситуации и с какой вероятностью? Вот PPO хорош в какой ситуации и с какой вероятностью?


Есть наблюдения, исследования и куча практических результатов. Взять сверточную сеть именно с точки зрения практики — разумно.

Карго-культ в принципе разумен с точки зрения тех, кто его исповедует, да. При этом он не перестает быть карго-культом.


Печально что вы не видите реальных практических результатов и утверждаете что они неповторимы.

А они повторимы? Укажите мне, пожалуйста, каким конкретно алгоритмом. И, пожалуйста, чтобы не пришлось в процессе чего-то подкручивать: просто запустил, сунул выборку и получил результат.

Так что ваше утверждение не совсем верно.

Согласен. Хотя я мог бы, по вашей схеме, настаивать, что это просто комбинация известных вещей — линейные классификаторы были известны ранее, kernel functions — тоже не новое изобретение. Mercer их описал больше ста лет назад (спасибо Гуглу, да).


В случае с PPO — ребята просто предлагает полученную на основе эвристик целевую функцию

Так вот целевая функция — и есть новое, в данном случае! Именно она позволяет решать задачу такого размера. Никакой реальный прогресс в вычислительных ресурсах не позволит решить задачу на перцептроне, нужен reinforcement. А для reinforcement нужна хорошая целевая функция.


PPO, по утверждениям разработчиков, проще настаивать, проще контролировать. Как будет на практике — посмотрим. Ещё несколько команд возьмутся, начнут использовать — тогда и будет ясно, насколько повторяемы результаты на разных задачах.


Вот PPO хорош в какой ситуации и с какой вероятностью?

Я с PPO не так хорошо знаком. Будем считать, что идёт этап исследований. Когда изучат — будет понятно, в какой ситуации. Для сверточных сетей ответ известен.


Карго-культ в принципе разумен с точки зрения тех, кто его исповедует, да.

Попытка утрировать, возможно, хорошо выглядит в ваших глазах. Но вы прекрасно знаете, что сверточные сети — не карго-культ. И вы знаете, что я это знаю. Так зачем?


А они повторимы? 

Если вы запустите обучение с теми же гиперпараметрами — получите тот же результат. Просто сунете выборку, запустите, получите результат.


В научных работах выбранные гиперпараметры описываются. Методы выбора гиперпараметров — это предмет исследований в настоящий момент.

Так вот целевая функция — и есть новое, в данном случае! Именно она позволяет решать задачу такого размера. Никакой реальный прогресс в вычислительных ресурсах не позволит решить задачу на перцептроне, нужен reinforcement. А для reinforcement нужна хорошая целевая функция.

reinfoircement и перцептрон (давайте лучше сразу оговоримся, хоть и запоздало, что под "просто перцептроном" мы понимаем "просто перцептрон с одним скрытым слоем", потому что на самом деле сети используемые OpenAI — это тоже перцептроны, просто многослойные :) вроде из контекста это ясно, но лучше уточнять, чтобы потом не оказалось что все имели в виду что-то свое) ортогональные вещи, вы можете делать reinforcement и на "просто перцептронах" :)
С-но любой метод, который работает на сети некоторой топологии, будет работать и для любой сети более простой топологии, другое дело, что он может быть не так эффективен (логично, что для более простой сети найдется более специализированный метод, как метод коррекции ошибок в случае "просто перцептрона", который не работает в многослойном случае, но более эффективен с однослойном).


А для reinforcement нужна хорошая целевая функция.

Да, но штука в том, что целевая ф-я — не алгоритм. Другое бы дело если бы был какой-то математический результат в стиле: "целевая ф-я вида Х обладает свойствами вида Y для задач, обладающих свойствами Z", где Y — какие-то полезные свойства, а Z — свойства, котоырми обладает какой-то содержательный класс задач. Но такого-то нет, просто кто-то на какой-то задаче потыкал и у него что-то получилось.
Ну вы всерьез это рассматриваете как сильное свидетельство в пользу того, что метод работает и работает эффективно?


Для сверточных сетей ответ известен.
Но вы прекрасно знаете, что сверточные сети — не карго-культ.

Ответ не известен, у нас просто есть наблюдения (пусть и обширные) того, что сверточные сети хорошо справляются с некоторым классом задач. При этом нет никакого понимания, почему это так. И не факт что это вообще так — вполне может быть, что среди всех топологий сверточные сети далеко не лучший вариант.
Так что это как раз и есть натуральный карго-культ — когда люди используют что-то, работы чего не понимают.


Методы выбора гиперпараметров — это предмет исследований в настоящий момент.

Только это вот ключевой момент, потому что вы же понимаете, что если в методе достаточно параметров, то подгонкой можно сделать так, что любая конкретная задача "решится"?

целевая ф-я — не алгоритм

Целевая функция, конечно, алгоритм. Не алгоритм обучения, это да. Гайка тоже, заметьте, не болт. Значит ли это, что новая гайка не считается новой на этом основании? Не понятна ваша мысль.


Ну вы всерьез это рассматриваете как сильное свидетельство

Когда у тысячи людей что-то получилось? А ещё тысяча описали, в каких случаях не работает? Да, рассматриваю. Иначе пришлось б отказаться, например, от лекарств. Вы уже отказались? Вряд ли хоть для одного есть математическое доказательство его работоспособности. Только модель и наблюдения, что реальность этой модели соответствует.


на самом деле сети используемые OpenAI — это тоже перцептроны

На самом деле нет. Впрочем, эта ваша стандартная особенность — "всё похоже на всё", не знаю почему, но видеть разницу вы отказываетесь, видите только общие черты (которые, несомненно, есть).


Ответ не известен, у нас просто есть наблюдения

Почему тела притягиваются, тоже ответ неизвестен, просто есть модель и наблюдения. Наблюдения — это нормально. Это хороший механизм познания и для сетей он тоже работает.


Где вы взяли определение карго-культа, кстати, не ясно, от общепринятого отличается, но пофиг.


любая конкретная задача "решится"

Если она решится так, как нужно, то кавычки неуместны. Самое банальное — у меня нет математических гарантий, что курьер привезет мне товар (я даже не знаю, как конкретно работает его мозг), но ожидаемая вероятность — высокая.


Можно наладить службу доставки, подкручивая кучу параметров и не имея ни одной теоремы. Назовёте такую службу доставки карго-культом? Не удивлюсь. Но большинство людей назовут её просто службой доставки. И задача доставки будет решаться без кавычек.


То есть, для решения задачи далеко не всегда нужны математические гарантии, что решение оптимально. Субоптимальное решение — тоже хорошо.

Целевая функция, конечно, алгоритм.

Алгоритм чего? Вот есть, например, алгоритм сортировки — он принимает несортированный массив и возвращает сортированный, а тот о котором вы говорите что делает?


Когда у тысячи людей что-то получилось? А ещё тысяча описали, в каких случаях не работает?

Получилось что, подгонка гиперпараметров под конкретную задачу? Так я вам и без наблюдений сразу скажу, что это возможно.


Да, рассматриваю. Иначе пришлось б отказаться, например, от лекарств.

С чего бы это? В случае лекарств мы изучаем, какие в нем активные вещества и каким образом они приводят к конкретному фармакологическому эффекту. То есть мы знаем как и почему работают лекарства, пусть иногда это знание и бывает несколько ограниченным. Мы не пытаемся делать лекарство "наугад", без понимания принципов фармакологии, в надежде на то, что повезет и получится. Но именно так (наугад) делают нейронные сети.


Только модель и наблюдения, что реальность этой модели соответствует.

Ну вот, а в случае нейронных сетей нет никакой модели.


На самом деле нет.

На самом деле, да, перцептроном является любая нейронная сеть, с-но, по определению. А дальше вы уже можете уточнить, какой у вас перцептрон — однослойный, многослойный, с обратными связями, разными типами передаточной функции и т.д.


То есть, для решения задачи далеко не всегда нужны математические гарантии, что решение оптимально. Субоптимальное решение — тоже хорошо.

Ну так у вас есть гарантии субоптимального решения. В случае курьера — вам с высокой долей вероятности гарантируется доставка, пусть и не 100%. В случае нейронных сетей вам никто не гарантирует ничего ни с какой вероятностью, вы играете в угадайку. Любая из эвристик может сработать или не сработать в любой ситуации по неизвестным причинам.

тот о котором вы говорите что делает?

Принимает на вход параметры и выдает расстояние от цели.


Ну так у вас есть гарантии субоптимального решения

На самом деле есть? И какие же это гарантии в случае курьера? Теорему приведёте, может быть? Если нет, то мой довод в силе. Любая ваша эвристика относительно курьера может не сработать по неизвестной причине, но сделать службу доставки всё равно можно (тоже, кстати, без гарантий).


Получилось что, подгонка гиперпараметров под конкретную задачу? Так я вам и без наблюдений сразу скажу, что это возможно.

Ну и о чем тогда разговор? Какую мысль вы пытаетесь донести? То "нет никаких гарантий", то "100% возможно даже без наблюдений". Вы имеете ввиду какую-то гипотетическую возможность, за триллион лет? Если да, то зачем?


Но именно так (наугад) делают нейронные сети.

Ваше частное мнение понятно. Собственно, не вижу причины дискутировать о мнении, вы имеете право иметь любое. Даже бездоказательное.

Принимает на вход параметры и выдает расстояние от цели.

А как узнать, что алгоритм в принципе работает? Вот в случае сортировки я проверяю, что получившийся в результате массив действительно отсортирован. И могу даже проверить какие-то дополнительные свойства, вроде стабильности. А в нашем случае, как можно убедиться в том, что то, что получается в результате — это действительно расстояние до цели?


Любая ваша эвристика относительно курьера может не сработать по неизвестной причине, но сделать службу доставки всё равно можно (тоже, кстати, без гарантий).

Конечно, может! Но строго контролируемым и ожидаемым образом. У меня есть четкое понимание, почему курьеры надежнее, чем просьба случайному человеку. И не только у меня, а у всех людей, кто пользуется курьерскими службами. И это не результат наблюдений, вроде "обычно курьеры доставляют", а именно понимание самого процесса — понимание того, почему курьеры "обычно доставляют".
В случае же использования обсуждаемых эвристик — ни у кого нет понимания, с какой бы стати данная эвристика должна давать полезный эффект чаще, чем вредить.


Какую мысль вы пытаетесь донести?

Ту, что факт возможности подгонки гиперпараметров под задачу — с практической точки зрения полностью бесполезен. Любая задача так решается, если повезет. Ключевой здесь момент именно в этом "если повезет". Наука тем и отличается от не-науки, что используя научный метод вы получаете результат ожидаемым образом, а не "как повезет".


Вы имеете ввиду какую-то гипотетическую возможность, за триллион лет? Если да, то зачем?

Это у вас надо спросить, именно вы ведь выдаете утверждения о гипотетических возможностях получения результата за триллион лет за успех.


Ваше частное мнение понятно. Собственно, не вижу причины дискутировать о мнении, вы имеете право иметь любое.

При чем тут мнение, если речь о фактах? Если честно, всегда обескураживает эта манера в ответ на конкретные доказуемые утверждения говорить: "это только мнение".
Мнение — это что-то вроде "мне нравится музыка Х", а "2*2 = 4" — это факт.

всегда обескураживает эта манера в ответ на конкретные доказуемые утверждения говорить

Утверждения, возможно, доказуемые. Но вы не потрудились их доказать. Если я вас верно понял, вы утверждаете, что выбор эвристик для создания сети происходит по методике мало отличимой от подбрасывания монетки. Но даже для меня, для кого сети — мелкое хобби, это не так. А вы утверждаете, что это так для исследователей, занимающихся этим серьезно. Потрудитесь доказать. Хотя бы объяснить, откуда вы взяли такое мнение. Тогда и отношение будет другое.


именно вы ведь выдаете утверждения о гипотетических возможностях получения результата за триллион лет за успех.

Не знаю, почему вы так решили, но нет. Если какие-либо мои слова навели вас на эту мысль, то проясню четко. Я не считаю результат за триллион лет, даже если он математически гарантирован — успехом.


факт возможности подгонки гиперпараметров под задачу — с практической точки зрения полностью бесполезен.

Гипотетическая возможность подгонки — бесполезна. Полезны статистически значимые наблюдения, что определенный класс задач можно решить за вменяемое время.


А в нашем случае, как можно убедиться в том, что то, что получается в результате — это действительно расстояние до цели?

Моя теоретическая подготовка недостаточна. Вы можете взять какую-либо признанную работу по целевым функциям и показать, что работа — мусор с научной точки зрения и ничего не даёт для понимания. При желании могу даже дать пример работы. Я сам больше опираюсь на мнение научного сообщества в таких вопросах, моя профессия в другом.

Но даже для меня, для кого сети — мелкое хобби, это не так.

Подтвердить это несложно — достаточно привести контрпример.


Хотя бы объяснить, откуда вы взяли такое мнение. Тогда и отношение будет другое.

Оттуда, что нет никакой информации о наличии методов, отличных от подбрасывания монетки. Отсюда вывод — либо таких методов нет вовсе, либо "власти скрывают".


Гипотетическая возможность подгонки — бесполезна. Полезны статистически значимые наблюдения, что определенный класс задач можно решить за вменяемое время.

Так у вас нет подобных наблюдений.


Смотрите, вот есть литература. Писатели, книжки пишут. Есть "Война и Мир" — если случайно жать кнопки, вы напишите ее примерно никогда, но Толстой написал. И вообще бывают хорошие писатели, которые пишут хорошие книги, вероятность написания которых, случайно жмакая кнопки — крайне мала.
При этом мы знаем, что для написания хорошей книги — надо собирать правильные слова в грамматически корректные (и при том желательно осмысленные) предложения — и на этом, вобщем-то все. Нет никакого способа сесть и написать хорошую книгу, имея какие-то гарантии. При этом люди пишут. Но не знают, как пишут (в том числе сами авторы) и по какой причине у них вообще что-то получается. То есть — результат неповторяем. Не в том смысле, что вы не можете перепечатать "Войну и Мир" — вы можете, но если сказать Толстому: "напиши-ка мне еще что-то того же уровня, похожее, но другое" (ака реши задачу того же класса), то велика вероятность, что ни черта не выйдет. И еще меньше, что выйдет у другого автора. За тысячелетия истории литературы человечеством было написано огромное количество хороших книг, но при этом мы совершенно не продвинулись в сторону того, что требуется сделать, чтобы вот сесть и написать хорошую книгу. По-этому литература — не инженерная дисциплина.


Вот все аналогично с нейросетями. Когда-то в 60-х были сформулированы базовые правила из разряда "выстраиваем слова грамматически верно", вот сейчас у нас есть некоторые люди со своего рода "литературным талантом", которые делают нейросети — при этом никто (даже сами эти люди) не понимает, с какой стати вообще в принципе что-то получается. И за последние полста лет мы в этом понимании не продвинулись ни на сколько, с-но не продвинулись и в разработке методов, которые позволяют "сесть и написать нейросеть". По-этому я и говорю — что прогресса нет. Все эвристики, которые "работают" — это нечто вроде: "писатель Х написал хорошую книгу на тему Y", ну да, типа написал. И это хорошо — чем больше хороших книжек, тем лучше. Только вот это ничего не дает человечеству в плане развития умений писать книжки, учитывая что опыт неповторяем и даже тот же автор в слегка других условиях родит уже что-то другое.


Моя теоретическая подготовка недостаточна. Вы можете взять какую-либо признанную работу по целевым функциям и показать, что работа — мусор с научной точки зрения и ничего не даёт для понимания.

Нет, погодите. Это же вы назвали целевую функцию "алгоритмом", вы и отдувайтесь. Не надо стрелки переводить на бедных ученых, они этого тезиса не озвучивали :)

Это же вы назвали целевую функцию "алгоритмом", вы и отдувайтесь.

Вопрос-то не об этом. Что бы назвать алгоритм алгоритмом, ссылка на учёных не нужна, достаточно ссылки на словарь. Как убедиться, что алгоритм делает то, что нужно, — это другой вопрос. Но даже если бы не делал, вы можете сказать, что алгоритм ошибочен. Но не можете сказать, что это не-алгоритм.


Ваше описание, почему литература — не инженерная специальность, очень хорошее. Но оно не подходит для нейросетей. Например, сверточная сеть вычленяет сначала низкоуровневые признаки. Даже не знаю, что тут может смутить, на этапе выделения линий и углов логика достаточно прозрачна. Переход к более высокоуровневым признакам менее прозрачен, но схема та же.


Впрочем, никто не знает толком, чем кошка отличается от собаки (визуально). Что с нейросетью, что без. Само выделение признаков — не магия. Магия — это какие признаки значимы, но разве это вопрос к нейросетям? Они-то их находят.


Подтвердить это несложно — достаточно привести контрпример.

Нужно распознать изображение — бери сверточную сеть. Простая эвристика, эффективность которой выше подбрасывания монетки. Вы можете выбирать архитектуру монеткой, ваше дело.


Для функции активации возьми для начала ReLu — тоже простая эвристика. Потому что формально нас устроит любая нелинейная функция, а сигмоид вычислительно сложнее.


Так у вас нет подобных наблюдений

Вы понимаете слабость этого утверждения? Хотите усомниться, что мои наблюдения статистически значимы? Но утверждать — "наблюдений нет" — это ж явно топить дискуссию, причем специально. AlphaZero — это наблюдение. Определенный класс задач (игры на доске, написано шахматы, го) можно решить за вменяемое время (они решены, значит решить можно).

Что бы назвать алгоритм алгоритмом, ссылка на учёных не нужна, достаточно ссылки на словарь. Как убедиться, что алгоритм делает то, что нужно, — это другой вопрос.

Нет, это важный вопрос. Точнее, важно то, почему вы на него не можете ответить (или, скорее, почему на него нельзя ответить в принципе). Дело в том, что расстояние до цели — это, по определению, ровно то, что получается в вашей целевой ф-и. Понимаете? Целевая ф-я — это не алгоритм. Это определение. Определение того самого "расстояния до цели". Алгоритмом может быть способ вычисления конкретной целевой ф-и (или некоторого класса). Например, есть у вас целевая ф-я вида Х, все считают ее долго, и вы так оп! Нашли способ считать ее быстро. Или нашли способ считать ее реже. Или как-то хитро пересчитывать на основе предыдущих результатов.
Вот этот ваш способ расчета и будет новым алгоритмом расчета целевой ф-и вида Х, но сама ф-я вида Х — это не алгоритм. Это функция. Для любой функции есть много разных алгоритмов вычисления.


Например, сверточная сеть вычленяет сначала низкоуровневые признаки. Даже не знаю, что тут может смутить, на этапе выделения линий и углов логика достаточно прозрачна.

О, смутить здесь может очень многое. Для начала, то, что следует определить, что такое "низкоуровневые признаки". Мне дано Х, как мне наверняка определить, низкоуровневый это признак (и вообще признак ли) или нет? Где строгое определение? Где доказательство корректности этого определения в принципе или в рамках выполнения каких-то условий? Наконец, после того как мы получим определение — где доказательства того факта, что сверточные нейронные сети действительно "вычленяют сначала низкоуровневые признаки"? Это действительно всегда так? Или нет? Если нет — в каких случаях? Быть может, есть хотя бы вероятностные оценки? Вроде как — сеть данного класса на выборке, удовлетворяющей определенным условиям будет "вычленять сначала низкоуровневые признаки" с вероятностью не большей чем…
Почему она эти низкоуровневые признаки вычленяет, если уж вычленяет? Как?
И, напоминаю, эти все вопросы заданы при условии, что мы не знаем, что такое, формально, "низкоуровневые признаки"! Это просто бессмыслица.


Магия — это какие признаки значимы, но разве это вопрос к нейросетям? Они-то их находят.

Смотрите, вы даже не можете дать определение тому, что такое "признак", но между тем утверждаете, что "уж нейросети то их находят"! То есть они находят то, не знаю, что.
Да даже если бы у вас было определение признака, то вы действительно с уверенностью можете заявить, что нейросети работают именно так? А может все же немного по-другому?


Нужно распознать изображение — бери сверточную сеть. Простая эвристика, эффективность которой выше подбрасывания монетки. Вы можете выбирать архитектуру монеткой, ваше дело.

А чем ваш выбор сверточной сети в данном случае отличается от монетки? Вы можете гарантировать что для моей задачи распознавания изображений, на моих данных, с моей конкретной топологией сети, методом обучения, эффективность будет действительно лучше, чем у монетки?


Хотите усомниться, что мои наблюдения статистически значимы?

Да, именно это я и сказал. Вы же сами прекрасно из контекста все поняли, как видно.

Да, именно это я и сказал. Вы же сами прекрасно из контекста все поняли, как видно.

Я из контекста предположил. Вы так точно проводите различие между самой функцией и способом её вычисления, но при этом утверждаете "у вас нет наблюдений". Разумно предположить, что вы это сказали ради красного словца, а имели ввиду "не показали статистическую значимость".


Но проблема не в этом. Проблема в том, что опираясь на мой невысокий уровень теоретической подготовки вы пытаетесь доказать, что построение сетей — чистый рандом. Это очень слабая позиция, вы так легко сможете доказать, что черных дыр не существует — я вряд ли приведу статистически значимые наблюдения.


То есть, повторюсь, вы не можете сказать "вы не знаете, значит этого нет". Не значит, на самом деле. Я много чего не знаю. Совсем другое дело, когда вы опровергаете мои доводы, показывая, что мое утверждение (предположим), не подтверждено.


утверждение — "я вижу примеры, значит это есть" — тоже не ахти. Но мое утверждение не в этом. Вы тоже видите примеры. Вы знаете (или можете проверить), что есть поиск Гугла по картинкам. Есть поиск по фотке у АлиЭкспресс. То есть это как минимум возможно. Но, более того, если вы возьмётесь за задачу по классификации, вы вполне с ней справитесь. Сможете ли написать популярную книгу — хз. А классифицировать животных — да, если не будете специально косячить.


Есть вполне себе технические мануалы по сверточным. И вопросы, необходимые для достижения цели там рассматриваются. Это не раскрытие чакр, на курсах рассматривают, как решить ту или иную проблему с определенной гарантией. Тяжело только в новых областях, классические задачи решаются надёжно и стабильно.


А чем ваш выбор сверточной сети в данном случае отличается от монетки?

Это попробовано сотнями людей. У вас нет строгой теоремы, украдёт ли курьер товар. И даже нет приличной модели, в математическом смысле, его поведения. И вряд ли есть оформленные надлежащим образом статистически значимые наблюдения. И чем тогда выбор курьера отличается от броска монетки?


Смотрите, вы даже не можете дать определение тому, что такое "признак"

Смотрю, вы настойчиво хотите доказать, что нейросеть не работает, опираясь на то, что я чего-то не знаю. Но уж слишком сильно перегнули. Признак — факт, говорящий о принадлежности к некоторому классу или говорящий о наличии некоего явления. И даже если б я этого не знал, есть же словарь. Просто уводите диалог в сторону такими вещами.


вы действительно с уверенностью можете заявить, что нейросети работают именно так

На низком уровне — конечно. Нейросеть говорит — на этом изображении есть горизонтальная линия в правой части изображения.


А может все же немного по-другому?

Для несверточных — да, немного по-другому.


что такое "низкоуровневые признаки".

Отличить "линия под углом 30 градусов" и "глаз" — не сложно. Первое — низкоуровневый, второе — нет. Я не знаю, есть ли математически строгое определение.


Почему она эти низкоуровневые признаки вычленяет, если уж вычленяет?

Как активируется нейрон? У нейрона коэффициенты на входы, где может быть линия — положительны, где не должна быть — отрицательны. Если линия будет вертикальной вместо горизонтальной — этот нейрон просто не активируется.


Если вопрос, каким образом сеть приходит к такому — так она аппроксимирует функцию котенка. А т.к. она многослойная — нижние слои аппроксимируют более простые признаки. Это вполне прилично изучено. Но я не рекомендую обучаться, задавая вопросы мне — пройдите курс какой-нибудь, ответы будут намного точнее.


Мне дано Х, как мне наверняка определить, целевой это признак или нет?

Целевой? Статистически. Для этого есть тестовый набор данных.


Целевая ф-я — это не алгоритм. 

Самая простая — квадратичная.
F(x) = (t-x)^2


Вы сможете обосновать что это — не алгоритм? Что ж, но алгоритм её вычисления, полагаю, очевиден? t — это цель, x — это результат вычисления сети.


Может быть вы хотели сказать, что не ясен алгоритм минимизации этой функции (т.к. мы не можем напрямую менять х)? Что ж, иногда не ясен. Но сам вопрос, что исследователи предложили новый алгоритм (PPO) — можем закрыть? Даже из самого факта, что они могут эту целевую функцию вычислять, ясно, что "способ вычисления" у них есть (к тому же он описан в их работе). Пока не ясно, действительно ли он так хорош, но он явно новый и явно алгоритм. И они, как минимум, уже на этом этапе решили задачу, которую до них никто не решал. Ваш довод, что это что-то типа написания бестселлера, понятен, но они описали технические преимущества. (для написания бестселлеров нам такие детали пока не известны).


В случае курьера — вам с высокой долей вероятности гарантируется доставка, пусть и не 100%.

И всё-таки, с какой долей вероятности гарантируется доставка? Можно ли оценить эту вероятность надёжно? Есть ли доказательства или статистически значимые наблюдения, что доставка курьером Х действительно будет с вероятностью не ниже У? А нейросети с математической точки зрения изучены намного лучше, чем поведение людей. Так что утверждение, что это "монетка" не состоятельно.

Проблема в том, что опираясь на мой невысокий уровень теоретической подготовки вы пытаетесь доказать, что построение сетей — чистый рандом.

Я пытаюсь доказать, что построение сетей — это рандом в том же смысле, в котором написание книги. Или песни. Или картины.
У кого-то это получается, и получается, очевидно, статистически чаще, чем должно быть при рандоме. Но при этом нет никакого понимания почему получается и как повторить результат.
Мы говорим о разных вещах. Вы говорите, что есть конкретные, обученные сети — они действительно есть, с этим трудно спорить.
Речь же о том, что нету методов, при помощи которых эту сеть можно сделать. Точно так же, как нету методов, при помощи которых можно сесть и написать "Войну и мир". Хотя по факту она написана, понимаете?
И тот факт, что кто-то написал хорошую книгу (обучил хорошую сеть, решающую полезную задачу), конечно, сам по себе полезен, но он не является достижением в области поиска способов написания хороших книг.


Пока не ясно, действительно ли он так хорош, но он явно новый и явно алгоритм. И они, как минимум, уже на этом этапе решили задачу, которую до них никто не решал.

Представьте себе, что есть какой-то писатель. Хороший писатель, хорошие книги пишет. И вот он их пишет, каждые пять минут делая тройное сальто назад. Ну вот такой вот странный человек, не может он иначе.
Надо ли отсюда сделать вывод, что чтобы хорошо писать книги, следует подучиться акробатике и начать в процессе делать сальто назад, так же как и указанный писатель?


И всё-таки, с какой долей вероятности гарантируется доставка? Можно ли оценить эту вероятность надёжно? Есть ли доказательства или статистически значимые наблюдения, что доставка курьером Х действительно будет с вероятностью не ниже У? А нейросети с математической точки зрения изучены намного лучше, чем поведение людей.

Смотрите, вы не в том месте видите проблему. Мы можем как для нейронок так и для доставки просто посчитать и получить статистику и в рамках пары предположений это будет вполне корректная статистика. Но корреляция != казуация.
И вот тут-то и вступает в дело важный факт — мы понимаем почему статистика на стороне курьерских служб (почему они работают), но не понимаем, почему она на стороне нейронных сетей. Т.о. использование любых эвристик превращается в использования сальто для улучшения писательских качеств.

И вот тут-то и вступает в дело важный факт — мы понимаем почему статистика на стороне курьерских служб

А понимаем ли? Вот серьезно, почему статистика на стороне курьерских служб? Я понимаю, что это так, но для меня не очевидно, почему. Почему человек в доставке более надёжный, чем какой-то другой? Ведь им достаточно мало платят, откуда берется надёжность? Почему статистика на стороне нейронок — мне более понятно.


не понимаем, почему она на стороне нейронных сетей

Сверточная напоминает зрительную кору мозга. Да, в ней на самом деле есть нейрон, говорящий — тут есть горизонтальная линия справа. Почему статистика на стороне зрительной коры — понятно. У кого кора неудачная, не оставили потомства. Простой случайный поиск привел к работоспособной архитектуре.


А сверточная успешна потому, что это модель зрительной коры мозга. Да, я понимаю, что это не теорема, а что-то близкое к антропному принципу. Поиск архитектур — это может и искусство. А использование изученной архитектуры — вполне инженерная задача.


Речь же о том, что нету методов, при помощи которых эту сеть можно сделать

Пройдите уже современный курс по ML. Методы построения на основе известных архитектур известны.

Почему человек в доставке более надёжный, чем какой-то другой? Ведь им достаточно мало платят, откуда берется надёжность?

Им платят больше, чем случайному человеку которому не платят, и если они работают — то значит считают, что платят достаточно (иначе бы не работали, очевидно). Если человек работает в доставке — значит полученные деньги для него достаточно важны (иначе бы он не работал), а значит он не будет хотеть их потерять. Человек заинтересован лично в том, чтобы доставку выполнить => выполняет.


Почему статистика на стороне нейронок — мне более понятно.

Видимо, вы единственный в мире человек, которому это понятно :)
Не поделитесь?


Сверточная напоминает зрительную кору мозга.

Вы же понимаете, что это такое себе объяснение? :)
Во-первых — со зрительной корой мозга у нейронных сетей гораздо больше различий, чем общего.
Во-вторых — вообще говоря, нет причин полагать, что "алгоритм зрительной коры" хоть сколько-нибудь оптимален.
И, в-третьих — это же не ответ :)
Смотрите, вы заменили: "делаем сети сверточными, потому что сверточные сети, как показывает практика, хороши", на "делаем сверточные сети, потому что они похожи на зрительную кору, а она, как показывает практика, хороша" :)


Пройдите уже современный курс по ML. Методы построения на основе известных архитектур известны.

Так, понимаете, это же все из разряда "делай тройное сальто назад — и напишешь хорошую книгу!"
Почему-то я уверен, что далеко не все люди, прошедшие "современные курсы по МЛ" становятся хорошими специалистами по нейросетям.

Им платят больше, чем случайному человку которому не платят

Ну блин, вы серьезно? Давайте я спрошу — а если случайному платят? 500 рублей за доставку вместо 300, т.е. больше — значит надёжность будет выше, чем у курьера? С какой вероятностью можно быть в этом уверенным? Есть ли хотя бы способ посчитать эту вероятность?


(иначе бы не работали, очевидно)

Вы не знаете людей, которые работают, но считают, что им платят недостаточно? Можно ли быть уверенным, что "достаточно" по определению (раз не уходит, значит достаточно) — это надёжно? С какой вероятностью?
Может ли курьер поменять свое мнение? Решить, что ему платят недостаточно и он уволится, как только найдет другую работу? Его надёжность после этого падает? Насколько?


значит он не будет хотеть их потерять.

Некоторые за рулём пьют — значит они хотели потерять права? Не хотели бы, не стали бы пить? Почему же это не очень надежно работает?


По вашим строгим критериям доказательности ваш ответ считается хорошей моделью? Предъявите к своему объяснению ваши же требования. Представьте, что такое объяснение дали не вы сами, а кто-то другой. Полагаю, вы легко разобьёте это объяснение в пух и прах.


Не поделитесь?

Есть гипотеза — любую жизненную ситуацию можно аппроксимировать с помощью функции. Ну а функцию может аппроксимировать нейронная сеть. Проблема только в поиске этой аппроксимации. Не помню теоремы на эту тему, полагаю, что такая возможность доказана не для любых классов функций, но общая идея именно такая.


Лучше спросите, как так вышло, что нам удается найти неплохие способы аппроксимации. Как с любыми изобретениями — точного пути нет. Но когда способ найден, его проверка и использование — вполне инженерная задача. Пока нельзя сказать, что сверточная — лучшая архитектура для изображений. Но можно сказать, что она гарантированно справляется.


они похожи на зрительную кору, а она, как показывает практика, хороша

Как зрительная кора выделяет признаки, более-менее изучено. Я не увидел ваших возражений по поводу выделения низкоуровневых признаков. Есть нейрон, он активируется, если справа есть горизонтальная линия, например. Эта схема понятна? Как он это делает — понятно? Возражений, что он это делает надёжно и предсказуемо — нет?


Ведь можно ж реально задавать вопросы по плохоизученным областям, вместо этого вы утверждаете, что изученное — не изучено и вообще рандом.


Так, понимаете, это же все из разряда "делай тройное сальто назад — и напишешь хорошую книгу!"

Почему-то я уверен, что далеко не все люди, прошедшие курсы по Х, становятся хорошими специалистами по Х. К чему вообще приводить такой сверхуниверсальный довод? Предложение-то было не для всех, а для вас.


К тому же это из разряда — отучись в техникуме, возможно станешь нормальным сантехником. Не каждый, кто отучился в техникуме, станет хорошим специалистом. Но утверждать, что ремонт сантехники — это творческая профессия, а результат — рандом — вряд ли кто-то станет.

Ну блин, вы серьезно? Давайте я спрошу — а если случайному платят?

То как вы его тогда отличите от курьера?


Вы не знаете людей, которые работают, но считают, что им платят недостаточно?

Конечно, знаю. Но если бы человеку не было ценно рабочее место он бы, очевидно, просто не работал.


Предъявите к своему объяснению ваши же требования.

Смотрите, даже плохое объяснение примерно раз эдак в бесконечность больше, чем вообще никакое :)
В данном случае у нас есть вполне адекватная модель, которая описывает происходящее и позволяет делать вполне корректные выводы, которые подтверждаются практикой.
В случае сетей — нету такой модели.


Некоторые за рулём пьют — значит они хотели потерять права? Не хотели бы, не стали бы пить?

Обратите внимание, пьют гораздо меньше, чем пьют в принципе :)
С-но вариант с "не хочу потерять права" или "понимаю что опасно" вполне объясняет, почему мы наблюдаем тот факт, что люди редко пьют за рулем.


Лучше спросите, как так вышло, что нам удается найти неплохие способы аппроксимации.

Ну, именно об этом и речь.


Но можно сказать, что она гарантированно справляется.

Так в том и дело, что нельзя, пока вы не объясните механизм работы.


Есть нейрон, он активируется, если справа есть горизонтальная линия, например.

Есть нейроны которые вообще никак с низкоуровневыми признаками не связаны. Например, один нейрон может отвечать за распознавание конкретного лица.


Возражений, что он это делает надёжно и предсказуемо — нет?

Есть. Из самого алгоритма надежность и предсказуемость никак пока не следует :)
Это только наблюдаемый необъяснимый факт (который, в силу отсутствия измерений, может быть неверен)


вместо этого вы утверждаете, что изученное

Утверждать, что работа мозга изучена — это как-то очень поспешно. На самом деле даже в алгоритмическом плане наши знания весьма ограничены. Мы не можем мозг вскрыть и посмотреть "а как оно работает" (то есть вскрыть и посмотреть можем, но не увидим ничего), то что есть — это все больше гипотезы, основанные на косвенных свидетельствах.


Почему-то я уверен, что далеко не все люди, прошедшие курсы по Х, становятся хорошими специалистами по Х.

А я не говорил про курсы. Я говорил про тройное сальто с целью научиться писать. Разница же ощутима, нет? :)

То как вы его тогда отличите от курьера?

Остановили случайного человека, предложили пару тысяч. Не первый, так пятый согласится. Это надёжнее, чем курьер на зарплате? Почему, с какой вероятностью?


В данном случае у нас есть вполне адекватная модель, 

"Платят деньги — значит достаточно надёжно" — это модель? "Нейросеть аппроксимирует функцию, которая отражает реальность" — не модель? Вы предвзяты. Если не согласны — опишите подробнее, почему ваше описание курьеров более "моделистое".


плохое объяснение примерно раз эдак в бесконечность больше

Плохое объяснение, откуда мы взялись — "нас создал бог". Я точно не согласен, что оно в бесконечность более хорошее, чем ответ "не знаю".


Но к главному мы пришли — нет никакой математической модели (ни строгой, ни вероятностной) доставки товара конкретным человеком. Ваше "плохое объяснение" не говорит ни о каких вероятностях вообще. Тезис "можно пользоваться инструментом, оценив вероятности по наблюдениям. Такое использование отличается от броска монетки в лучшую сторону" можно считать подтвержденным? Вы с ним согласны?


С-но вариант с «не хочу потерять права» или «понимаю что опасно» вполне объясняет, 

С какой вероятностью? Вы уверены, что объясняет? Это может быть ложной корреляцией? Если нет, то почему? Заметьте, вопросы не сложнее тех, что вы задаёте про нейросети.


неплохие способы аппроксимации.
Ну, именно об этом и речь.

А как нам удается найти законы природы? Каким образом? Я не знаю, а вы? Насколько я понимаю, ответа на такие вопросы в принципе пока нет, но я хотел бы их знать когда-нибудь.


Так в том и дело, что нельзя, пока вы не объясните механизм работы.

В том-то и дело, что можно и что механизм есть. Пример с курьерами именно для этого — показать вам наглядно, что достаточно механизма работы (я его дал выше), философские вопросы "почему этот механизм работает" полезны, но на вероятность работы не влияют.


Есть нейроны которые вообще никак с низкоуровневыми признаками не связаны. 

Конечно есть, согласен. Если это какой-то далеко идущий тезис, то разверните.


Из самого алгоритма надежность и предсказуемость никак пока не следует :)
Это только наблюдаемый необъяснимый факт (который, в силу отсутствия измерений, может быть неверен)

Конечно. Предсказуемость следует из наблюдений. Из самого алгоритма работы мозга тоже никак не следует, что курьер доставит товар. Мы даже это алгоритма толком не знаем. Учитывая, что измерений достаточно, сам факт можно считать достаточно надёжным.


Почему для вас факт "необъяснимый" мне всё ещё не ясно. Что не так с возможностью аппроксимации реальности? Вы сомневаетесь в такой возможности? Для непрерывных функций даже теорема есть — теорема Цыбенко. Для прочих теоремы пока нет, но в категорию "необъяснимых" этот факт не попадает уж точно. Скорее в категорию недоказанных гипотез.


Утверждать, что работа мозга изучена — это как-то очень поспешно.

Работа мозга? Неуместное обобщение с вашей стороны. Речь шла о зрительной коре.


Мы не можем мозг вскрыть и посмотреть «а как оно работает» 

Зрительная кора так и изучалась. Вскрыли, вставили датчики, измерили. Почему вы утверждаете, что "не можем", опять же не ясно.


это все больше гипотезы, основанные на косвенных свидетельствах.

Не более косвенные, чем изучение кварков. Уж тут-то точно нельзя "вскрыть и посмотреть". К тому же там ещё и вероятностное всё. Но я бы не стал утверждать, что предсказание поведения кварков не отличается от броска монетки.


А я не говорил про курсы. Я говорил про тройное сальто с целью научиться писать. 

Вы сказали, цитирую


Почему-то я уверен, что далеко не все люди, прошедшие "современные курсы по МЛ" становятся хорошими специалистами по нейросетям.

Вот этот довод мы можем считать бесполезным и выкинуть его? Он же вообще ни к чему не ведёт, согласны?


Аналогия с сальто забавна, но не более того. Есть объяснение, зачем его делать? И пример сотни людей, которые его сделали и написали бестселлер? Если да — это вполне причина тоже пробовать. Но ведь нет объяснения.


А зачем использовать ReLu — объяснение есть. Зачем использовать свёртки вместо полносвязанной сети — объяснение есть. Зачем использовать валидационный сет (а не только тестовый) — объяснение есть. На какие правила построения сетей вам не хватает объяснения? Может мы сможем разговор перевести в практическую плоскость. Какой элемент в нейросетях напоминает вам тройное сальто? Желательно конкретно.

> Остановили случайного человека, предложили пару тысяч. Не первый, так пятый согласится. Это надёжнее, чем курьер на зарплате?

Нет, потому что в отличии от курьера этот рандомный человек может спокойно уйти с деньгами и все.

> «Платят деньги — значит достаточно надёжно» — это модель?

Человек заинтересован в выполнении задачи методом «кнута и пряника», по-этому, скорее всего, будет ее выполнять.
Мы можем просто посмотреть на ситуацию и сделать гипотезу (теоретическую). А потом посмотреть на статистику и увидеть, что она подтверждает нашу гипотезу.

> «Нейросеть аппроксимирует функцию, которая отражает реальность»

Вопрос в том, как выходит, что нейросеть начинает апроксимсировать функцию, отражающую реальность. А не какую-то другую. Смотрите, у нас есть очень много классов функций, которые могут отражать реальность, и есть очень много способов, которыми мы можем эти функции строить. Я бы сказал — таких классов и способов бесчисленное множество. Какие есть основания выбирать одно конкретное конечное подмножество?

> Почему для вас факт «необъяснимый» мне всё ещё не ясно. Что не так с возможностью аппроксимации реальности?

Вы куда-то в сторону ушли. Нейронные сети это не про то как функции аппроксимируют реальности, это все очевидно. Нейронные сети — про _методы построения_ некоего класса таких аппроксимирующих функций. И вопрос не про то, почему функции аппроксимируют, тут как раз наблюдений достаточно, потому что само понятие «аппроксимирует реальность» — это и есть «соответствует наблюдаемым величинам». Вопрос именно в том, _почему мы получили_ такую полезную функцию данным конкретным методом. Почему в результате действия этого метода мы не получили фигню?
Вот почему курьер вам посылку доставил — потому что хочет деньги за доставку получить.

> Работа мозга? Неуместное обобщение с вашей стороны. Речь шла о зрительной коре.

А кора — это часть мозга. И то о чем вы говорите — это гипотезу. Пусть весьма достоверные, достаточно достоверные, чтобы ими было разумно пользоваться, — но пока только гипотезы.

> Вскрыли, вставили датчики, измерили. Почему вы утверждаете, что «не можем», опять же не ясно.

Пока что непосредственно на нейроны датчики, по-моему, не ставят. Снимают, например, ЭЭГ.

> Не более косвенные, чем изучение кварков.

Вот это вы очень хорошо вспомнили. Какими практическими достижениями на данный момент может похвастаться квантовая хромодинамика? Где мой кварк-глююнный генератор энергии? :)
Мы очень плохо сейчас понимаем, как взаимодействуют кварки, и вот есть, например, конфайнмент — наблюдаемое явление. Но мы не знаем, как его объяснить, откуда он берется, почему. И это очень плохо, и физики не спорят с тем, что это плохо, это проблема, это надо решать :)

> Аналогия с сальто забавна, но не более того. Есть объяснение, зачем его делать? И пример сотни людей, которые его сделали и написали бестселлер?

Пример с сальто, конечно, намеренно утрирован и сомневаюсь что вы найдете много людей, которые так написали бестселлер, потому что сомневаюсь вообще, что вы хоть одного человека найдете, который так пишет книгу. Но можно взять любые действия, которые люди совершают довольно-таки часто. Ну, например какой-то автор любил абсент. А потом бестселлер написал. Уверен, такие найдутся.

> А зачем использовать ReLu — объяснение есть. Зачем использовать свёртки вместо полносвязанной сети — объяснение есть. Зачем использовать валидационный сет (а не только тестовый) — объяснение есть.

И зачем? Вы сейчас скажете: «потому что лучше работает!», а я спрошу: «а с чего вы взяли что лучше работает?», а вы ответили: «ну вот кто-то делал и у него работало», а я отвечу: «ну если кто-то что-то сделал и у него получилось — это не значит, что это хороший способ, может, кто-то и книги через сальто пишет!» и мы пойдем по кругу :)

> Какой элемент в нейросетях напоминает вам тройное сальто? Желательно конкретно.

Ну вот например — использование многослойных сетей. Математически многослойные сети ничем не лучше однослойных, зачем их использовать? :)
может спокойно уйти с деньгами и все.

А может не уйти. И курьер тоже может уйти. Что вероятнее? Есть ли статистически значимые наблюдения, что случайный человек уйдет с деньгами? Короче, без цифр всё, на какой-то интуиции. Тем не менее как-то работает. И лучше, чем рандом. Почему работает — не знаю. Нейросети понимаю лучше, чем людей.


Гипотеза, говорите? "Скорее всего будет выполнять задачу" — это на гипотезу не тянет.


Какие есть основания выбирать одно конкретное конечное подмножество?

Никаких. Я не утверждал, что сверточная — это лучшая архитектура. Она работает. Но есть шанс, что другая сработает лучше. Тезис "она работает" от этого не становится ошибочным.


Вопрос именно в том, почему мы получили такую полезную функцию данным конкретным методом. 

А "данным конкретным методом" — это вы про какой метод? Градиентный спуск? Тут ответ ясен. Мы катимся к минимуму функции. Вроде ответ очевиден, разве нет? Проблема в том, что ваш вопрос расплывчат. Конкретизируйте.


Если вы спрашиваете, "почему нейросети в принципе работают". Не как они достигают цели (это понятно, как), а почему так вышло, что они работают, то отвечу вопросом.


Почему тела притягиваются? Почему при синтезе гелия выделяется энергия? (Да, это всё тот же вопрос, почему светит солнце).


 > И то о чем вы говорите — это гипотезу. 


Не понимаю суть тезиса. Вы утверждаете, что зрительная кора работает не так? Или что это недостаточно изучено? Недостаточно наблюдений, нужно сомневаться?


Пока что непосредственно на нейроны датчики, по-моему, не ставят. Снимают, например, ЭЭГ.

Если бы. Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем. Протон тоже в микроскоп не разглядишь, но никто ж не назовет его гипотезой.


что это плохо, это проблема, это надо решать :)

Я ж не против матмоделей нейросетей. Наоборот, будет круто. Мой тезис, что построение сети — не рандом. Вполне инженерная задача, как в 17м веке строительство храма — современного сопромата ещё не было, но это не было броском монетки.


Ну, например какой-то автор любил абсент

Абсент наверняка помогает написать бестселлер. :)


И зачем? Вы сейчас скажете: «потому что лучше работает!», 

Вот зачем делать такие предложения? Валидационный сет нужен потому, что для нейросети надо настраивать гиперпараметры. И гиперпараметрами можно случайно заточить сеть под тестовый сет. Потому гиперпараметры проверяют на валидационном сете. А по тестовому смотрят уже в самом конце — сеть построила абстракции или просто заточилась под валидационный. Надеюсь, смог понятно написать.


Математически многослойные сети ничем не лучше однослойных

Сходимость лучше. Т.е. обучать быстрее до такого же качества (но сложнее было изобрести алгоритмы). Почему она лучше, думаю, понятно. Меньше связей у конкретного нейрона, значит меньше шагов до оптимума для этого нейрона. Если вы скажете, что это не строгая теорема, соглашусь. Не знаю, всегда ли это так. Но это достаточно часто так и вполне логично, что чем меньше параметров, тем быстрее нейрон сойдется.

А может не уйти. И курьер тоже может уйти. Что вероятнее?

Может. Но курьер это сделает значительно реже.


Есть ли статистически значимые наблюдения, что случайный человек уйдет с деньгами?

Так в том и суть, что в данном случае наблюдения не нужны, мы можем просто это вывести, логически, как теорему. И именно по-этому мы пользуемся курьерами — потому что понимаем, что они работают. Не потому что такова статистика. Статистика — не причина как раз, не важно, есть она или нет.
Статистикой, вообще говоря, теории опровергают, а не подтверждают.


Она работает.

Неверно. Правильно — она сработала. По факту. Некоторое количество раз, в некоторых конкретных случаях. Но то, что она работает — мы утверждать не можем. То, что курьеры будут доставлять — мы утверждать можем, а то, что нейронка сработает — не можем. Потому что это не вопрос статистики и наблюдений. Это вопрос наличия объяснений.


А "данным конкретным методом" — это вы про какой метод?

Ну начать надо с того, что данная конкретная функция в принципе окажется достаточно сложна, чтобы описать требуемую зависимость. Это понятно, что в классе найдется функция, которая все что надо отобразит с любой точностью, но почему именно вот эта, соответствующая, например, 200 нейронам подходит? Почему не потребовалось 2 миллиона нейронов?


Градиентный спуск? Тут ответ ясен. Мы катимся к минимуму функции. Вроде ответ очевиден, разве нет? Проблема в том, что ваш вопрос расплывчат. Конкретизируйте.

Вы явно на практике никогда градиентный спуск не применяли :)
В реальности обычно возникает множество проблем и, да, обычная ситуация — это когда градиентный спуск не работает нормально, а не наоборот :)


Почему тела притягиваются? Почему при синтезе гелия выделяется энергия?

Это вопрос неинтересный, т.к. относится к физической реальности. В случае же с нейросетями — вопрос чисто математический, о том, что выдумано нами самими.


Вы утверждаете, что зрительная кора работает не так? Или что это недостаточно изучено? Недостаточно наблюдений, нужно сомневаться?

Я говорю о том, что нет никаких достоверных свидетельств, что она работает именно так.
То есть, если завтра внезапно окажется, что она работает не так, то не будет особого удивления, не будет такого, что: "АХ ТЫ Ж БЛИН ДА КАК ЖЕ ЭТО ВОЗМОЖНО ТО??7??".
На самом деле, мы даже не знаем как слух работает, хотя он работает на порядок проще. А вы про зрение.


Вполне инженерная задача, как в 17м веке строительство храма — современного сопромата ещё не было, но это не было броском монетки.

Ну, почему, до сопромата — именно чем-то вроде броска монетки и было.


Сходимость лучше… Почему она лучше, думаю, понятно.

Нет, непонятно. И, представьте себе, никому в мире на данный момент не понятно.


Не знаю, всегда ли это так. Но это достаточно часто так и вполне логично, что чем меньше параметров, тем быстрее нейрон сойдется.

Логично, что Земля — плоская. Достаточно из окна выглянуть, и убедиться в этом логичном предположении. Для меня вот совсем не логично то, что сходимость будет быстрее с "маленьким числом параметров". Мне если честно даже непонятно, по какой логике к такому умозаключению вообще можно прийти.

Для меня вот совсем не логично то, что сходимость будет быстрее с "маленьким числом параметров". 

Вычислительно, поиск в 10-мерном пространстве не сложнее поиска в 1000-мерном. Ну да, совсем не логично.


А польза от снижения размерности данных для вас тоже не логична? Зачем эти странные и нелогичные датасаентисты стараются отбросить несущественные параметры — не ясно?


PCA — вообще мусор, не доказано же, что снижение размерности полезно. Извините за сарказм, но вы ж не спросили логику, вы явно отвергли — нет, не логично и вообще не ясно, как до этого можно было додуматься.


То есть, если завтра внезапно окажется, что она работает не так, то не будет особого удивления, не будет такого, что

Конечно же будет удивление. Ваша убежденность, что мы ничего точно не знаем про зрение и слух, забавна, но не более того. Я же не предлагаю вам тайное знание, альтернативщину или верить мне на слово. Просто отложите учебники 70-х и прочитайте современную позицию по этим вопросам. Сразу скажу — не уверен, что есть что-то приличное на русском. Я не в курсе. А английском материалы подробные.


Почему 70-е? Потому что премия по физиологии 81-го года — за открытие, в частности, нейронов отвечающих за наклон линий, наличие точек и т.п. david hubel and torsten wiesel, если интересны подробности.


Думаю, поймёте, почему я считаю ваши утверждения про зрительную кору — полным п, уж не обижайтесь. Почти 40 лет прошло, перепроверено кучей людей, а вы всё ещё "нет никаких достоверных свидетельств" и "не будет особого удивления". Если у человека вдруг окажется 2 печени, тоже наверное, не будет особого удивления. Нет же достоверных свидетельств, что должна быть одна.


Про курьеров. Дадите ссылку на доказательство теоремы, что случайно взятый курьер надёжнее случайно взятого прохожего — вместе посмотрим, нет ли там каких-то нестрогих утверждений. До тех пор утверждение "мы можем просто это вывести, логически, как теорему" — пустое бахвальство. Ну или такая гипербола. Мол, ну конечно не прям строгую математическую теорему, но можем просто по-рассуждать и будет похоже на неё.


Что в итоге есть — ничего. Никаких цифр и вероятностей. Вы НЕ знаете, какие параметры существенны для надёжности курьера, не знаете, с какой вероятностью он доставит посылку. Даже утверждение, что случайный человек менее надёжен пока не доказано. Он ведь тоже хочет получить деньги, так что довод одинаков. Даже то, что он хочет получить деньги — не доказано. Да, я считаю это очень вероятным (и вы, полагаю, тоже), но почему вы так считаете?


Только честно. Серьезно, задумайтесь. Вы отдаете товар курьеру, он должен доставить покупателю. Его мотивация — это деньги? Почему так считаете? Лично я — потому что проецирую на курьера себя. Но я-то не всегда хочу их получить! Даже когда работаю и делаю дело хорошо. Вы мне, ясное дело не поверите, но это не существенно. Теорема же, просто докажите. Учтите, сомнительные утверждения тоже придется доказать. Или признать, что теоремы пока нет и её возможность под вопросом.

Вычислительно, поиск в 10-мерном пространстве не сложнее поиска в 1000-мерном. Ну да, совсем не логично.

С маленьким параметром сходимости может вообще не быть как раз из-за того, что пространство маленькая. Или функция будет такой формы, что спуск на ней будет очень плох.


Ваша убежденность, что мы ничего точно не знаем про зрение и слух, забавна, но не более того.

Ну вы видимо плохо разбираетесь в в вопросе :)


Потому что премия по физиологии 81-го года — за открытие, в частности, нейронов отвечающих за наклон линий, наличие точек и т.п. david hubel and torsten wiesel, если интересны подробности.

Это все замечательно, но знание о наличии нейронов, реагирующих на линии и точки нас не особо к пониманию общих принципов работы зрительной кары приближает. Ну есть нейроны, которые хорошо откликаются на линии, точки, цвета, есть те, что на прямоугольники или овалы. Есть те, что на более сложные фигуры и образы. И что дальше, с-но?


Про курьеров. Дадите ссылку на доказательство теоремы, что случайно взятый курьер надёжнее случайно взятого прохожего

Так я же говорю — случайно взятый курьер заинтересован в том, чтобы доставлять вашу посылку. По-этому доставляет. Что вам тут непонятно?


Вы НЕ знаете, какие параметры существенны для надёжности курьера, не знаете, с какой вероятностью он доставит посылку.

Так мне это и не надо знать. Я знаю, что есть причины, по которым курьем должен посылку доставить. Я хзнаю эти причины. По-этом я пользуюсь курьерскими службами, и другие люди пользуются и это нормально.
Но никто в мире не знает причин, по которым должна работать конкретная нейронка.

Ну вы видимо плохо разбираетесь в в вопросе :)

Или я плохо разбираюсь в вопросе или вы. Учитывая, что вы считали, что потенциалы нейронов не снимают датчиками и что "нет никаких достоверных свидетельств" о том, как кора работает на низком уровне, что более вероятно?


Или, переформулирую, насколько вероятно, что вы хорошо разбираетесь в вопросе, имея ещё пару дней назад такие заблуждения? Мне можете не отвечать, я явно вижу тут Даннинга-Крюгера. И это не наезд, вы легко можете исправить ситуацию, если захотите.


Есть те, что на более сложные фигуры и образы. И что дальше, с-но?

Это всё, это конец тезиса. Полагаю, что вам не до конца понятно, но это нормально. Я всего лишь показал, что источники информации есть. Теперь вы уже не сможете сказать "нет никаких достоверных свидетельств, что она работает именно так". Теперь у вас есть свидетельства.


Так я же говорю — случайно взятый курьер заинтересован в том, чтобы доставлять вашу посылку. По-этому доставляет. Что вам тут непонятно?

Непонятно, где теорема? Ваше нижеследующее утверждение — ложно.


Так в том и суть, что в данном случае наблюдения не нужны, мы можем просто это вывести, логически, как теорему. 

Но никто в мире не знает причин, по которым должна работать конкретная нейронка.

Ещё одно ложное утверждение. Вы бы как-то более внимательно относились к квантору всеобщности.


Впрочем, плевать. "Никто не знает", значит никто. По всей видимости это ваше мнение, а мнения доказывать не принято. Попробую уважать ваше право такое мнение иметь. Про курьеров, кстати, тоже. Если это ваше мнение, что теорема возможна или что ваши логические построения похожи на теорему — полностью ваше право. Дискуссия о мнениях не несёт смысла, на мой взгляд.

Учитывая, что вы считали, что потенциалы нейронов не снимают датчиками и что "нет никаких достоверных свидетельств" о том, как кора работает на низком уровне, что более вероятно?

Учитывая, что я прав по обоим пунктам? Ответ, думаю, очевиден.


Или, переформулирую, насколько вероятно, что вы хорошо разбираетесь в вопросе, имея ещё пару дней назад такие заблуждения?

Какие заблуждения? Как вы сами же согласились — нейроны датчиками не меряют. Ваша убежденность в том, что "все хорошо, все понятно и все известно" — просто от банального недостатка знаний.


Это всё, это конец тезиса.

Конец какого тезиса? Ну распознают какие-то нейроны какие-то стимулы, это очевидно, нейроны для того и есть. Дальше то что? Как вы из этого выводите принципы работы зрительной коры?


Теперь вы уже не сможете сказать "нет никаких достоверных свидетельств, что она работает именно так".

"так" — это как? Вы же не указали, как. Есть нейроны, которые что-то распознают, да. А дальше-то что? Вы остановились даже не на полпути, а на 10% самого общего описания, пропустив еще 90%. И это ведь общее описание, а если начать вдаваться в подробности?


Непонятно, где теорема? Ваше нижеследующее утверждение — ложно.

Что ложно? Какая из посылок по-вашему ложна — что курьер заинтересован, или что из заинтересованность ведет к повышению вероятности выполнения задачи? Вы же как-то уточняйте.


Впрочем, плевать. "Никто не знает", значит никто. По всей видимости это ваше мнение, а мнения доказывать не принято.

При чем тут мнение, когда речь о фактах? Вы сейчас утверждаете существование чайника Рассела — что есть в мире кто-то, кто знает ответ на соответствующий вопрос, но почему никто кроме вас не знает о существовании этого человека. Почему нет никаких свидетельств в пользу его существования? С чего вы взяли что такой человек в принципе существует?
Мой логика проста — раз нету никаких свидетельств в пользу его существования, значит, считаем, что он не существует.

Учитывая, что я прав по обоим пунктам?

Вы издеваетесь?


Как вы сами же согласились — нейроны датчиками не меряют

Да, похоже издеваетесь. Ради шутки попрошу цитату, где я согласился с этим явно ложным мнением.


Как вы из этого выводите принципы работы зрительной коры?

На сарказм не похоже. Дайте угадаю, троллинг?


И это ведь общее описание, а если начать вдаваться в подробности?

Учебник в помощь. Мне всё равно, будете ли вы считать себя правым. Ваши знания — ваша ответственность, нужны — учитесь. Абсолютно мейнстримовая область, никаких секретных и "сакральных" вещей.


Что ложно? Какая из посылок по-вашему ложна

Посылки? Ложно утверждение, что вы можете собрать из этого теорему. Впрочем, вы это явно понимаете, теорему сформулировать не удастся, просто переводите тему.


почему никто кроме вас не знает о существовании этого человека

Тысячи людей, а не человека.


Почему нет никаких свидетельств в пользу его существования?

Почему нет никаких свидетельств в пользу существования самолётов? Я понимаю, что просто троллите, но ваш вопрос звучит именно так. Нет, блин, свидетельств. Никто не знает людей, кто в курсе, как собирать самолёты. Вывод? Таких людей (знающих, как собирать самолёты) не существует.


Мой логика проста

Логика ваша верна. Просто вы ради развлечения берете очевидно ложные посылки.

Вы издеваетесь?

Совсем нет. Я же озвучил два тезиса:


  1. нейроны не меряют, только косвенно (и это так, вы и сами согласились)
  2. мы на данный момент не знаем, как работает зрительная кора (и даже более простые механизмы — тот же слух) — что тоже верно, т.к. если бы было неверно — были бы какие-то научные статьи, в которых эти вещи бы описывались. А их не существует в природе.

Да, похоже издеваетесь. Ради шутки попрошу цитату, где я согласился с этим явно ложным мнением.

Вот же: "Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем."


Учебник в помощь.

Учебник чего? Подобной информации нету не то что в учебниках — а и в современных научных статьях по теме. Потому что ее вообще нет :)


Посылки? Ложно утверждение, что вы можете собрать из этого теорему.

Это как? Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens. И это строгая теорема по определению понятия "теорема".


Впрочем, вы это явно понимаете, теорему сформулировать не удастся, просто переводите тему.

Тему как раз переводите вы :)(
Смотрите, вы попросили дать объяснение про курьеров — я его дал. Далее вы пытаетесь показать, что объяснение в том или ином смысле неиделаьно и может быть гипотетически неверно — все так, как и для любого другого объяснения. В случае нейросетей проблема не в том что объяснение плохое, его просто тупо нет. Вообще никакого.


Тысячи людей, а не человека.

Где эти люди? Почему они скрываются да так, что о их существовании неизвестно?


Почему нет никаких свидетельств в пользу существования самолётов?

Почему же нет? Они есть! Вот я за окно выглянул — самолет летит. Вот в гугле написал "самолет" — мне фото с видео и фото самолетов :)
Захочу — найду инфу, как и из чего самолеты строятся, почему они летают, с расчетами.
А вот с сетями это не работает. Не получится у вас найти какую-то научную статью, в которой объясняются обсуждаемые вещи, как ни старайтесь.


Просто вы ради развлечения берете очевидно ложные посылки.

Ну так вы легко можете их опровергнуть контрпример. Как в случае чайника Рассела — показали его в телескоп и все.
Вместо этого вы просто голословно утверждаете существование чего-то, но пример привести не можете.

Во-первых, слух более сложно устроен. Но это так, к слову. Можете не верить, для вас же статей "не существует" об устройстве слуха.


были бы какие-то научные статьи, в которых эти вещи бы описывались.

Всё верно. И они существуют и там описано. Вам фамилии недостаточно? Вам ссылку на работу, за которую он Нобелевку получил? Ссылки на статьи, развивающие тему? Вы правда полагаете, что это всё фейк? Начните с Википедии. Там есть ссылки на книги, которых "не существует".


Я просто сути вашего троллинга не понимаю. Вроде разговор начинался разумно, а скатился — "нет, его научная работа не считается, потому что чайник Рассела и они не существуют". Сам David Hubel хотя бы существует или тоже чайник, по вашей теории?


Вы же понимаете, что пытаетесь отрицать общедоступную информацию? Если вы продолжите это делать и не опишите причины, если просто опять скажите "статей не существует" — я проигнорирую. Вы можете закрывать глаза сколько угодно, работы по зрительной коре от этого не исчезнут. Можете сравнивать их с чайником. Та же курсера с общедоступными курсами видна любому, у кого есть интернет. Она не видна только вам.


Ну так вы легко можете их опровергнуть контрпример. 

Именно так. Я и привёл. Вы хоть как-то обоснуйте, чем этот контрпример не подходит. Чем ссылка на ученого плоха? Он изучал мозг НЕ с помощью ЭЭГ.


Почему они скрываются да так, что о их существовании неизвестно?

Неизвестно вам? Не знаю. Может вы от них скрываетесь? Эндрю Ын известен многим, например.


Вот же: "Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем."

Нет — это значит "нет, не ЭЭГ". Возможно, фраза сформулирована не совсем ясно, прошу прощения. Но как вы из неё сделали вывод, что я считаю, мол "нейроны не меряют, только косвенно", мне до сих пор непонятно. Грубое измерение — это в смысле меряют потенциал, а не каждую химическую реакцию отдельно (хотя такие подобные исследования тоже есть).


В Вики есть статья, "single-unit recording". Её тоже не существует? Это не свидетельство существания метода?


Что же до вашего мнения, будто я считаю, что отдельные нейроны не меряют — я считаю, что отдельные нейроны меряют. На основе общедоступных данных. Если вы читаете, что я считаю, что нейроны не меряют — ваше право. Можете продолжать думать, что я так считаю. Как я на самом деле считаю, я сказал. Надеюсь, не запутал, не было такой цели.


Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens

Верно. Только у вас нет Х и нет "X => Y", в остальном верно. "Если хочет получить деньги, значит сделает работу" — это утверждение не доказано. Докажите. Оно не очевидно. "Хочет получить деньги" — это утверждение не доказано. Оно верно для любого курьера в любой день? Если да — докажите. Если нет — то когда верно, когда нет?


Вот я за окно выглянул — самолет летит. 

Где этот самолёт? Почему он скрывается да так, что о его существовании неизвестно?


Вот в гугле написал "самолет" — мне фото с видео и фото самолетов :)

Почему-то погуглить "самолёт" вы справились, а прочитать статью в Википедии об учёном — нет. Даже там написано, что измерялись отдельные нейроны. Вы всё ещё уверены, что "отдельные нейроны не меряются"? Вам нужны ещё свидетельства?

Вместо этого вы просто голословно утверждаете существование чего-то, но пример привести не можете.

Если вам действительно не понятен пример с учёным, сформулируйте, пожалуйста, точнее, пример чего вам нужен. Если вам действительно нужен пример (а не просто издевательство по кругу), я попробую найти что-то, что подходит под ваши условия. Опишите, какими качествами должен обладать пример, подтверждающий, что "отдельные нейроны меряют".

Если вам действительно не понятен пример с учёным, сформулируйте, пожалуйста, точнее, пример чего вам нужен.

Пример человека, который знает, почему работает конкретный алгоритм обучения нейронной сети и с-но сама сеть (естественно, мы сейчас не про какие-нибудь однослойные персептроны — те понятно, почему работают, на то есть соответствующие теоремы, так что не работать они просто не могут. мы про сети вроде той, что из обсуждаемой статьи). В качестве подтверждения того, что он правда знает — вполне пойдет статья с указанным объяснением.

Опишите, какими качествами должен обладать пример, подтверждающий, что "отдельные нейроны меряют".

Пример человека, который знает, почему работает конкретный алгоритм обучения нейронной сети.

То есть вы даже мой комментарий не дочитали? Ну да пофиг. Я думаю, по зрительным нейронам у вас возражений уже нет?


Могу предложить по сверточным, как работает, какими свойствами обладает и к каким результатам приводит, если интересно.


Взял старую работу (30 лет прошло), которая показывает, как сверточная архитектура достигает position-shift invariant. Человек — Wei Zhang.


Рассматривается, фактически, только один вопрос, другие вопросы рассматриваются в других работах.

То есть вы даже мой комментарий не дочитали?

Я прочитал, но полагал, что вы просто запутались. Мы же говорили не про подтверждение мерянья нейронов, а про подтверждение понимания работы нейронных сетей. С-но и ответил.


И вы дайте конкретную ссылку-то. Можете на старую работу, можете не на старую, это не важно.

Вы не держите полный контекст. Мы пришли вот к этому. "Совсем нет. Я же озвучил два тезиса:".


Мы разобрались? Вы согласны с тем, что ваш первый тезис неверен?


Смотрите, вы попросили дать объяснение про курьеров — я его дал.

Вы отредактировали комментарий, потому я пропустил это ваше утверждение. Вы сказали, что можно доказать, как теорему. Так докажите. Дело не в "неидеальности" объяснения, дело в том, что теорема не доказана вами. Всё просто, либо теорема доказана, либо нет. Суть не в том, что бы прижать вас к стенке, а что бы продолжить рассуждения. На наличие теоремы опирается ваше "наблюдения не нужны".


И вы дайте конкретную ссылку-то.

Потерялась, извините. Место хранения не очень, но я думаю, подлинность работы не сложно будет подтвердить, если возникнет потребность. Таких работ (по разным аспектам) десятки, это не что-то секретное.


https://drive.google.com/file/d/0B65v6Wo67Tk5ODRzZmhSR29VeDg/view

Вы не держите полный контекст.

Я как раз о полном и говорю.


Вы согласны с тем, что ваш первый тезис неверен?

Нет, но это, вообще говоря, не относится к предмету разговора, потому я и предлагаю оставить.


Таких работ (по разным аспектам) десятки, это не что-то секретное.

Ну так а где там ответ-то на вопрос, почему работать должно? Штука с реализацией на оптических фильтрах прикольная, конечго, но не про то.

Нет, но это, вообще говоря, не относится к предмету разговора, потому я и предлагаю оставить.

Относится. Потому я и говорю, вы не держите полный контекст. Только изначальный вопрос. А почему и зачем мы пришли с этим частностям — забыли. Это не критично, могу напомнить, мы легко вернёмся по цепочке наверх, когда достигнем согласия по этим пунктам.


Так всё же, какими качествами должно обладать подтверждение, что "отдельные нейроны меряют". Я понял, что статья в Википедии про измерения отдельных нейронов для вас подтверждением не является, вы всё ещё уверены, что это то ли невозможно, то ли не используется (не ясно, в чем конкретно вы уверены, но видимо уверены, что "не меряют").


почему работать должно

Почему должно — без понятия. Есть подтверждение, что работает и как работает. Почему должно работать доказательство иррациональности числа пи — я тоже не знаю. И почему оно иррациональное — не знаю. А во то, что оно иррациональное — это без сомнения. Сверточные сети позволяют достигнуть инвариантности к сдвигу и повороту изображения. Это без сомнения и никаким броском монетки не является.


По поводу теоремы мы пришли к согласию? Доказанная теорема о доставке товара конкретным курьером (которая скажет, доставит или нет) — отсутствует. Её возможность не подтверждена ничем. А значит утверждение "наблюдения не нужны" — не верно. Наблюдения в данном случае необходимы, без них никак.

Относится.

Нет, не относится.


А почему и зачем мы пришли с этим частностям — забыли.

А в том и дело, что мы к нему не приходили. Это был просто случайный высосанный из пальца тезис, который не имеет отношения к предмету обсуждения. То есть он никак не следовал из предыдущего контекста.


Так всё же, какими качествами должно обладать подтверждение, что "отдельные нейроны меряют".

Да мы вообще это подтверждение не обсуждали.


Я понял, что статья в Википедии про измерения отдельных нейронов для вас подтверждением не является

Она является подтверждение того факта, с которым я и не спорил. Вы же сами прекрасно понимаете, что между изучением работы одного единственного нейрона в принципе и изучением некоего процесса на уровне отдельных нейронов (о чем мы и говорили) — гигантская пропасть. Так чего придуриваетесь?


По поводу теоремы мы пришли к согласию? Доказанная теорема о доставке товара конкретным курьером (которая скажет, доставит или нет) — отсутствует.

В смысле? Вы так и не указали, какая из сформулированных посылок неверна. Я напомню вопрос: "Какая из посылок по-вашему ложна — что курьер заинтересован, или что из заинтересованность ведет к повышению вероятности выполнения задачи?".


Почему должно — без понятия.

То, что вы без понятия — я прекрасно понимаю, ведь, мой тезис состоит в том, что все без понятия. И вы в том числе, конечно :)
Но вы же утверждаете что есть люди, которые понимают, почему нейронные сети работают. Я у вас попросил соответствующую статью, в которой бы такой человек изложил это свое понимание: "вот нейронная сеть, работает так-то и так-то, результат дает по тем-то и тем-то причинам таким-то таким-то способом". А вы мне привели опять статью, в которой просто констатируется факт работы.
Я у вас не прошу очередного подтверждения, что существуют хорошие книги. Я прошу ссылку на способ написания хороших книг с обоснованием того, почему этот способ должен работать. Мой тезис — нету таких людей, которые это знают/понимают, никто вам не скажет, как написать хорошую книгу с объяснением, почему так.


А значит утверждение "наблюдения не нужны" — не верно. Наблюдения в данном случае необходимы, без них никак.

Как раз наблюдения и несущественны. Важно понимание процесса.


В этом разница между вашей логикой и моей. Я когда рассуждают о том, что что-то работает, исхожу из того, что понимаю процесс этой работы, с-но "не работать оно и не может".
А вы просто смотрите, и из того что монета два раза подряд выпала решкой делаете вывод, что она только решками и выпадает.

А в том и дело, что мы к нему не приходили.

Повторюсь, не держите контекст. Тем не менее, вы можете высказать свою позицию по вопросу, даже если он, по вашему, не относится к теме. Или сказать "не знаю", если не знаете.


между изучением работы одного единственного нейрона в принципе и изучением некоего процесса на уровне отдельных нейронов

Я не знаю, что заставляет вас придуриваться, однако речь именно об изученности процесса. Процесс распознавания низкоуровневых признаков изображения изучен на уровне отдельных нейронов. По этому тезису у вас возражений нет?


Вы так и не указали, какая из сформулированных посылок неверна.

Я не планирую доказать "неверность", что за бред, просить о таком? Ни одна из ваших посылок не доказана, вот и всё. Докажите их, пожалуйста или переформулируйте так, что б доказательство не требовалось.


Если вы сами тщательно рассмотрите граничные случаи, вы увидите, что заинтересованность курьера в получении денег не всегда ведёт к увеличению вероятности. А некоторые условия могут убрать заинтересованность. Деньги ему всё ещё будут нужны, а посылку доставлять откажется.


Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens

Разве из посылки "заинтересованность ведет к повышению вероятности" следует, что посылка будет доставлена? Вы можете в одном комментарии сформулировать и посылки и ваш вывод? Это нужно затем, что бы вам самому было видна необходимость переформулировать. Т.к. вы не видите неконсистентность формулировок, если они в разных комментариях.


мой тезис состоит в том, что все без понятия.

Тут я без сожалений признаю вашу вероятную правоту. Почему некоторые вещи "должны работать" (нейронные сети в частности), вполне возможно, все в мире без понятия. Соглашаюсь, что мне неизвестны люди, знающие об этом.


Ваш более ранний тезис, что построение нейронных сетей — бросок монетки — неверен. Много людей знают, как они работают и каким образом получается результат. Сделать нейронку для изученной области — инженерная задача.


Но вы же утверждаете что есть люди, которые понимают, почему нейронные сети работают. 

Есть люди, которые знают, как они работают и как их делать. В обычном разговоре это то же самое, что "почему", но учитывая предыдущий разговор, я не стану утверждать, что они знают, "почему". Мне достаточно "как".


Важно понимание процесса.

Для понимания процесса нужно знать существенные факторы. Вы указали один — человек согласился работать. Исходя из "несущественных наблюдений" я знаю, что этого фактора недостаточно. Вы — нет. Потому что модели у вас нет (её но у кого нет), а наблюдения вы игнорируете.


исхожу из того, что понимаю процесс этой работы

В этом и ошибка. Не изучив должным образом процесс доставки вы считаете, что "понимаете процесс этой работы". А правда ли понимаете?
Так же, не изучив должным образом литературу по нейронным сетям, вы опять же считаете, что "понимаете процесс", а точнее, что понимать там нечего, сплошной рандом. Да и про изучение зрительной коры аналогично.


Исходить из того, что вы понимаете процесс работы можно, когда вы действительно его понимаете. А не думать так по-умолчанию.


А вы просто смотрите, и из того что монета два раза подряд

Очень странное предположение. Оно, конечно, неверно, но ваше право его придерживаться. К озвученным фактам это отношения не имеет.

Повторюсь, не держите контекст.

Повторюсь, это у вас проблема с удержанием контекста :)
Отмотайте назад и перечитайте сообщения, если забыли разговор.


Процесс распознавания низкоуровневых признаков изображения изучен на уровне отдельных нейронов.

Нет, не изучен. Только по косвенным (очень косвенным) данным. Если вы считаете иначе — ну подтвердите это какими-то ссылками.


Я не планирую доказать "неверность", что за бред, просить о таком? Ни одна из ваших посылок не доказана, вот и всё.

Эм, посылки и не требуется доказывать, на то они и посылки.
Смысл доказательства всегда состоит в том, что из конкретных посылок следует некий факт. Истинность посылок к доказательству уже не относится.
По-этому я и спрашиваю — какую из посылок вы ставите под сомнения? Без указания этого дальнейший разговор смысла не имеет. Если никакую не ставите — значит, все в порядке.


Если вы сами тщательно рассмотрите граничные случаи, вы увидите, что заинтересованность курьера в получении денег не всегда ведёт к увеличению вероятности.

Как вообще что-то может вести к увеличение вероятности ВСЕГДА или НЕ ВСЕГДА? Что-то лили увеличивает вероятность (в принципе увеличивает) или не увеличивает (в принципе не увеличивает). Понятия вроде "в конкретном случае" или "всегда" или "иногда" тут неприменимы. Это не имеет смысла.
Вы как-то переформулируете свой тезис, чтобы он не был случайным набором слов, а то так невозможно понять, что вы имеете ввиду.


А некоторые условия могут убрать заинтересованность.

Конечно, могут. Тогда курьер перестанет быть курьером, ведь зачем ему быть курьером, если он в этом не заинтересован? Человек в принципе никогда не делает ничего осознанно, если он в этом не заинтересован.
На самом деле "быть курьером" и "быть заинтересованным в доставке" — это одно и то же утверждение, просто сформулированное по-разному.


Тут я без сожалений признаю вашу вероятную правоту. Почему некоторые вещи "должны работать" (нейронные сети в частности), вполне возможно, все в мире без понятия. Соглашаюсь, что мне неизвестны люди, знающие об этом.

Тогда с чем вы спорите? Это же и есть мой изначальный тезис.


Очень странное предположение.

Это не мое предположение, это вы сами озвучили. Вы верите в то, что нейронные сети работают, потому что вы это статистически наблюдали (монетка выпала дважды), но при этом не понимаете почему получился такой результат наблюдений (не понимаете, почему нейронные сети работают, то есть почему монетка выпала дважды).
Я же не верю в работу нейронных сетей до тех пор, пока не узнаю, почему они работают — то есть, почему монетка дважды выпала орлом. Может, окажется, что у нее два орла? И тогда, действительно, она всегда выпадает орлом. Или ее хитро бросают. А может — она просто случайно двумя орлами выпала. И тогда тут ни о каком "работает" речи нет.

Отмотайте назад и перечитайте сообщения,

Окей, вы не понимаете, как мы к этому пришли. Пропущу, что бы не усложнять дерево обсуждения. Не существенно.


Нет, не изучен. Только по косвенным (очень косвенным) данным. Если вы считаете иначе — ну подтвердите это какими-то ссылками.

Второй раз? А с первого раза что не так пошло? "single-unit recording", первая ссылка в Гугле на Вики. Вы по прежнему будете считать, что "процесс не изучен"? Прочитайте, пожалуйста, прежде чем писать ещё раз "не изучено" и "нет наблюдений". Там все подтверждения, что распознавание низкоуровневых признаков изучено.


По-этому я и спрашиваю — какую из посылок вы ставите под сомнения?

Обе, я же вполне четко об этом сказал. Обе ваши посылки может сработают в конкретном случае, а может нет. С какой вероятностью они сработают — вы не знаете.


Прочитал ниже и понял, что конкретно вы не догоняете. Вы берете один параметр (курьер/не курьер). Я спрашиваю — от каких ещё параметров вероятность доставки зависит существенно? В этом и суть модели — знать все существенные параметры, согласны? Если считаете, что других существенных параметров нет — скажите прямо. Если не знаете — тоже скажите прямо.


Понятия вроде «в конкретном случае» или «всегда» или «иногда» тут неприменимы.

Применимы, конечно. Есть десять курьеров. Есть десять вероятностей доставки (курьер Х доставит посылку с вероятностью У). Повышаем зп, у пяти вероятность доставить следующую посылку растет, у пяти — не растет. ЗП — это существенный параметр, но не единственный.


а то так невозможно понять, что вы имеете ввиду.

А для вас в принципе невозможно сформулировать понятно, если вы понимать отказываетесь. В Вики вот вроде для всех понятно сформулировано. А вы всё ещё считаете, что распознавание низкоуровневых признаков зрительной корой мозга не изучено. И что предлагаете? Формулировать яснее, чем в Вики?


Вы как-то переформулируете свой тезис

Мой тезис — вы не знаете, какой полный набор существенных параметров, от которых зависит вероятность доставки. Значит вы не можете достоверно сказать, что курьер Х более надёжен, чем случайный прохожий У. Может проявиться фактор, про который вы не в курсе.


Могу в значках. Мы обсуждаем, что
Р(D|X) > P(D|Y), для любых D, X, Y
где D принадлежит множеству доставок, X — множеству курьеров, Y — множеству случайных прохожих.


Так вот, это утверждение не верно. Если ваше утверждение в другом — пожалуйста, изложите его в одном комментарии целиком.


Это не мешает в обычной жизни, т.к. можно предположить примерно, а потом исправить ошибку, если что. Мой вышестоящий тезис в этом и состоял — нет никакой хорошей модели доставки (в которой есть список всех существенных параметров). Для зрительной коры такая модель есть (есть основания считать, что учтены все существенные параметры).


Тогда курьер перестанет быть курьером, ведь зачем ему быть курьером, если он в этом не заинтересован? 

Подмена понятий. Речь в моем комментарии о заинтересованности в получении денег. А не в том, что бы быть курьером. Пожалуйста, не надо так, это не хорошо.


Повторю ещё раз. Вы можете в одном комментарии сформулировать и посылки и ваш вывод? Что бы можно было рассмотреть вашу предлагаемую модель целиком.


Тогда о чем вы спорите? Это же и есть мой изначальный тезис.

Если уж быть точным, ваш изначальный тезис — что разработка сети — это как в казино на зеро, а сверточные сети — как карго-культ. Полагаю, что уж этот "изначальный тезис" отпал и вами больше не поддерживается.


Плюс прочитайте следующий абзац моего прошлого комментария.


Ваш более ранний тезис, что построение нейронных сетей — бросок монетки — неверен. Много людей знают, как они работают и каким образом получается результат. Сделать нейронку для изученной области — инженерная задача.


Остались возражения?


Это не мое предположение, это вы сами озвучили.
потому что вы это статистически наблюдали (монетка выпала дважды), но при этом не понимаете почему получился такой результат наблюдений

Вот утверждение, что я НЕ понимаю, почему получился такой результат, во оно ещё более странное. Как вы такой вывод сделали, например, после ссылки на ту работу по сверточным? Ну да хз, ваши выводы о моем понимании к делу не относятся, какие б странные они ни были.


не понимаете, почему нейронные сети работают,

Ещё более странно. Опять же, оставляю на вашей совести, особенно после моего прямого опровержения. Видимо вы противопоставляете — если я вам рассказал про статистику, а не начал сразу с ссылок — значит видимо я не понимаю, как работает внутри.


Так вот, как работают простые архитектуры — понимаю (сложные — пока нет, в процессе). И не только я, конечно. Пару фамилий я назвал, ещё сотню можете нагуглить сами. Но это так, к слову. Ваше предположение о моем понимании не существенно, я ж не использую это как довод, просто удивился вашему выводу.


А может — она просто случайно двумя орлами выпала. И тогда тут ни о каком "работает" речи нет.

Может быть. А может быть я осмотрел монетку, прочитал, как эту монетку бросали тысячу раз, узнал, из какого материала состоит и теперь предсказываю — упадет орлом, вероятность 100%, она действительно с двумя орлами.


А вы мне в ответ — вы же даже не знаете, почему два тела притягиваются. И никто не знает. Поэтому ставка, что она вообще упадет — это как в казино на зеро. Слабенький довод, не находите?

Второй раз? А с первого раза что не так пошло? "single-unit recording", первая ссылка в Гугле на Вики. Вы по прежнему будете считать, что "процесс не изучен"?

Там нет ничего про изучение процессов.


Прочитал ниже и понял, что конкретно вы не догоняете. Вы берете один параметр (курьер/не курьер). Я спрашиваю — от каких ещё параметров вероятность доставки зависит существенно? В этом и суть модели — знать все существенные параметры, согласны?

Нет, суть модели как раз в том, чтобы не знать параметры. Иначе это бесполезная модель. В случае курьера — я знаю что он курьер, и мне этого достаточно, чтобы сделать совершенно строгий логический вывод о том, что моя посылка будет скорее доставлена, чем нет. я понимаю, почему это так, я вижу статистику, которая это подтверждает. Что еще нужно?


Мой тезис — вы не знаете, какой полный набор существенных параметров, от которых зависит вероятность доставки. Значит вы не можете достоверно сказать, что курьер Х более надёжен, чем случайный прохожий У.

А мне это и не нужно, я говорю, что он более надежен при прочих равных.


Могу в значках. Мы обсуждаем, что
Р(D|X) > P(D|Y), для любых D, X, Y
где D принадлежит множеству доставок, X — множеству курьеров, Y — множеству случайных прохожих.

Так смотрите, P(D | X) — условная вероятность события D при условии выполнения события Х. Вы зачем-то формулируете утверждение как
forall D, X, Y: Р(D|X) > P(D|Y), где D — событие доставки конкретной посылки, а X/Y — конкретный некурьер или курер.


Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.


Так вот утверждение должно быть такое:
Р(D|X) > P(D|Y), где D — событие доставки посылки, X — доставка курьером, Y — доставка некурьером.
Обратите внимание — никакой квантификации по событиям нет, потому что у нас просто три события, вполне конкретных.
То есть не "для любой посылки, курьера и некурьера, вероятность доставки данной посылки при условии, что она доставляется этим курьером, выше, чем вероятность доставки посылки при условии, что она доставляется этим некурьером", а "вероятность доставки посылки при условии, что она доставляется курьером, выше, чем вероятность доставки посылки при условии, что она доставляется некурьером".


Если уж быть точным, ваш изначальный тезис — что разработка сети — это как в казино на зеро, а сверточные сети — как карго-культ. Полагаю, что уж этот "изначальный тезис" отпал и вами больше не поддерживается.

В смысле отпал? Это тот же самый тезис и есть.


Много людей знают, как они работают и каким образом получается результат.

подождите мы только что выше пришли к согласию, что не существует ни одного человека, который бы знал как работают сети и как получается результат, разве нет? А теперь вы говорите совершенно противоположное.


Сделать нейронку для изученной области — инженерная задача.
Остались возражения?

Конечно же есть. Что-то является инженерной задачей если вы можете взять и по определенным правилам повторить результат. В случае нейронных сетей зачастую даже одна и та же команда разработчиков не может повторить результат, не говоря уже о другой команде. По-этому я и считаю, что на данный момент обучение нейронных сетей — ровно в той же степени инженерная задача, как живопись или литература.


А может быть я осмотрел монетку, прочитал, как эту монетку бросали тысячу раз, узнал, из какого материала состоит и теперь предсказываю — упадет орлом, вероятность 100%, она действительно с двумя орлами.

Так в том и дело, что вы ничего не осмотрели и не узнали. И единственная причина, по которой вы что-то предсказываете — потому что так уже было.
Никаких других причин у вас нет.

Обращу ваше внимание только на три пункта.


Нет, суть модели как раз в том, чтобы не знать параметры. Иначе это бесполезная модель.

Не бывает моделей без параметров. Курьер/не курьер — это параметр. Откуда вы взяли, что "суть модели — не знать примеры", не ясно. Если вы сможете подтвердить это ссылками, буду искренне благодарен, т.к. либо вы говорите о чем-то очень интересном, либо крайне заблуждаетесь.


Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.

"Доставлена" — видимо вы говорите о событии в прошлом. Такое событие конечно либо 0%, либо 100%. Всегда. Нас интересует событие в будущем. "Будет доставлена". Утверждение, что вероятность "конкретная посылка будет доставлена", всегда либо 0%, либо 100% — очевидно неверное.


подождите мы только что выше пришли к согласию, что не существует ни одного человека, который бы знал как работают сети и как получается результат, разве нет? А теперь вы говорите совершенно противоположное.

Вы крайне, запредельно невнимательны. И это при том, что сообщения можно перечитывать. Я говорил, что не знаю людей, которые знают, "почему" они работают. Людей, которые знают, "как" — сотни (а может десятки тысяч, но тут не уверен). И предлагал вам обсуждать именно "как".


Пример, как работают свёртки, был дан выше (есть и другие материалы по этой теме, возможно более подходящие). Если вы внимательно прочитаете, вы тоже будете знать, как достичь position shift invariance в нейронной сети. Или можете продолжать настаивать, что вы не знаете, как это сделать.


Остальное не интересно. Если вы настаиваете на своем непонимании — ваше право, мне без разницы.

Не бывает моделей без параметров. Курьер/не курьер — это параметр.

Конечно, речь о том, что некоторыми параметрами, да и вообще в принципе некоторыми свойствами моделируемой системы, мы намеренно пренебрегаем. Именно по-этому модель — это, собственно, модель, а не сама моделируемая система.


Если вы сможете подтвердить это ссылками, буду искренне благодарен

См. выше — это включает понятие модели само по себе.


"Доставлена" — видимо вы говорите о событии в прошлом. Такое событие конечно либо 0%, либо 100%. Всегда. Нас интересует событие в будущем.

А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.


Это, впрочем, как раз не важно, вы почему-то откомментили несущественный для разговора момент но пропустили существенную часть — там, где я объяснял, что вы неверно сформулировали утверждение.


Я говорил, что не знаю людей, которые знают, "почему" они работают. Людей, которые знают, "как" — сотни (а может десятки тысяч, но тут не уверен).

А какая разница между "как" и "почему"? Вы какой-то софистикой занимаетесь. На мой взгляд — это ровно одно и то же. По-этому "никто не знает, почему работают нейросети" = "никто не знает, как работают нейросети".
Ну это с-но не важно, окей, допустим вы интерпретируете "как" как-то иначе, пусть, ну вроде как — никто не знает, почему написанная таким-то автором книга стала шедевром, но при этом понятно КАК он ее написал (тыкал пальцем по клавиатуре, ну или определенным образом пером бумагу шкрябал, если брать более ранний период), и в итоге так и останавливаемся на том, что разработка нейросетей — в точности такая же инженерная дисциплина, как литература, живопись, или музыка.
Музыка, кстати, лучший пример — там есть весьма глубокая тональная теория, которая описывает, какие конкретно звуки нравятся человеку и как их следует совмещать друг с другом, кроме того — есть еще и достаточно годные гипотезы (пусть и гипотезы, но они есть), которые достаточно содержательно объясняют ПОЧЕМУ это так. То есть музыка на данный момент — строго более инженерная дисциплина (если под "уровнем инженерности" подразумевать уровень понимания, почему и как что-то работает), чем нейросети, если уж объективно смотреть.
Так что, поздравляю, вы объявили музыкантов инженерами.

А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.

Вы хоть раз слышали про априорные и апостериорные вероятности?

Вы хоть раз слышали про априорные и апостериорные вероятности?

Апостериорная вероятность условная, с-но она тут не при чем.

Нет, именно они тут и «причем». Когда интересующее нас событие перестает быть «в будущем» и начинает быть «в прошлом» — у нас появляется некоторый известный факт. А значит, условное вероятностное пространство меняется, и апостериорные вероятности меняются вместе с ним.
А значит, условное вероятностное пространство меняется, и апостериорные вероятности меняются вместе с ним.

Апостериорные могут сколько угодно меняться, нас это совершенно не интересует, т.к. мы эти вероятности не рассматриваем. Нас волнует вероятность событий сама по себе, не условная.

Нет, судя по вот этой цитате, вас интересуют именно апостериорные:


Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.

Потому что априорные вероятности рассматриваемых событий не могут быть равны ни 0, ни 100%.

некоторыми свойствами моделируемой системы, мы намеренно пренебрегаем

Вот именно. Параметры есть, но не все возможные, а существенные. Я ещё неделю назад попросил вас дать список существенных параметров для этой вашей модели. Он что, только один? Курьер/не курьер? А если у него сегодня первый день работы — это тоже не параметр? Не существенно? А сумма, которую платят за доставку — не существенно? Всё равно курьер надёжнее, чем не курьер?


См. выше — это включает понятие модели само по себе.

Вы подтвердили, что параметр есть. Пусть даже он в вашей тривиальной модели всего один. Просьба по возможности формулировать чуть точнее, а не в стиле "суть модели как раз в том, чтобы не знать параметры".


А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.

То есть вероятность дождя 8-го сентября либо 100%, либо ноль? И эта вероятность никак не поменяется спустя пару дней? Вы тщательно обдумали этот довод?


откомментили несущественный для разговора момент но пропустили существенную часть 

Это очень существенный момент. Он важен для процесса рассуждения, но проще объяснить сам момент, чем то, как он будет влиять на дальнейший диалог.


Вероятности меняются со временем, есть вероятность не только для категорий, но и вероятность единичного события. Обратите внимание на вероятность дождя. Вероятность завтрашнего дождя (8-го числа) сегодня и послезавтра одинакова? Она больше нуля? Она меньше 100%?


Это, опять же, не какая-то эзотерика или альтернативщина, это вообще-то common knowledge. Probability of a single event отнють не является либо 0, либо 100.


Далее. Суть не в том, что я сформулировал неверно. Формулировка конечно верная по форме. Просто вы говорите, что это утверждение вы не поддерживали, а поддерживаете другое.


Р(D|X) > P(D|Y), где D — событие доставки, X — доставщик курьер, Y — доставщик не курьер.

Хорошо, так можно. Если вы скажете — я вывел это из наблюдений за людьми, плюс у меня есть более сложная модель (с желанием денег, согласием на работу и т.п.), которая тоже в целом соответствует наблюдениям — я с вами соглашусь. Не 100% надёжно, но вполне приемлимо.


Но вы стали утверждать не это! Вы утверждали, что наблюдения не нужны, а Р(D|X) > P(D|Y) вы сможете доказать строго как теорему. Вот это — неверно. Не получится. Если не согласны — продемонстрируйте доказательство.


А какая разница между "как" и "почему"? Вы какой-то софистикой занимаетесь

Если никакой, давайте остановимся на слове "как"? Вам всё равно, а мне удобнее. Никакую софистику по этому поводу разводить не будем.


Я ещё раз обращу ваше внимание (вы проигнорировали) на position shift invariance. Есть люди, которые знают, как достичь этого свойства в нейросети при распознании изображений. Есть работы, где описывается, как это сделать. Совсем не монетка. Если с этим доводом что-то не так — аргументируйте.

Вот именно. Параметры есть, но не все возможные, а существенные. Я ещё неделю назад попросил вас дать список существенных параметров для этой вашей модели. Он что, только один?

Поскольку мы один параметр и рассматриваем — ну да, один. Зачем нам другие и на что они могут в принципе повлиять?


А если у него сегодня первый день работы — это тоже не параметр?

А почему это может быть существенно, если мы смотрим по всем курьерам? Мы же говорим не о ком-то конкретном. Обо всех. Туда входят и те, что первый день работают и те, что не первый. Те, кому платят много и те, кому платят мало. Нас не волнует вероятность доставки конкретным курьером, мы ее не обсуждаем, нам она неинтересна. Мы говорим об интегральном показателе.


Вы подтвердили, что параметр есть. Пусть даже он в вашей тривиальной модели всего один.

Я и не говорил нигде, что параметров вообще не должно быть, вы как-то странно поняли.


То есть вероятность дождя 8-го сентября либо 100%, либо ноль? И эта вероятность никак не поменяется спустя пару дней?

Конечно, дождь, совершенно точно, либо произойдет, либо нет. То, что вы не знаете, как оно будет — это уже другое дело. Я, например, если монетку подкинул и закрыл глаза — то тоже не знаю, чем там она выпала. Хотя чем-то же выпала, вполне определенно.


Это очень существенный момент. Он важен для процесса рассуждения

Вообще-то он никак не влияет на дальнейшее рассуждение. Он совершенно отдельно.


Вероятности меняются со временем

В вероятностном пространстве нету вообще такого понятия, как время. Возьмем ту же монетку, вам дано множество {орел, решка}, сигма-алгебра подмножеств на нем: {{орел, решка}, {орел}, {решка}, {}} и конечная, конечно-аддитивная мера, отнормированная на единицу:
P({орел, решка}) = 1
P({орел}) = 1/2
P({решка}) = 1/2
P({}) = 0
никакого ВРЕМЕНИ и каких-то еще прочих бредней тут нет.


Но вы стали утверждать не это! Вы утверждали, что наблюдения не нужны, а Р(D|X) > P(D|Y) вы сможете доказать строго как теорему.

Ну так еще раз:


  1. люди, которые, в среднем, более заинтересованы в выполнении задачи, выполняют задачу в среднем лучше, чем те, что заинтересованы меньше
  2. курьеры в среднем заинтересованы в доставке посылки больше, чем некурьеры

=> в среднем курьеры выполняют задачу доставки посылки лучше


Если никакой, давайте остановимся на слове "как"? Вам всё равно, а мне удобнее.

Давайте по порядку:


  1. вы согласны с тем, что никто не знает, почему
  2. я согласен с тем, что кто-то знает, как (в вашем понимании "как")
    верно?
    тогда давайте перейдем к следующему тезису

Совсем не монетка.

Литература — тоже не монетка, но при этом не является инженерной дисциплиной.
С-но и вот следующий мой тезис — разработка и обучение нейронных сетей — не инженерная дисциплина. Потому что для того, чтобы быть инженерной дисциплиной, не достататочно понимания "как" (иначе бы инженерной дисциплиной была литература или музыка), но нужно еще понимание "почему", причем достаточно глубокое (см. тот же пример с музыкой — понимание "почему" есть, но не достаточно глубокое).

Новых идей в обучении нейросетей не было уже 50 лет, со времен появления персептрона Розенблатта

Рекуррентные сети — 1980. Энкодеры — конец 80-ых. Свёрточные сети — 1988. LSTM — 1997. GRU — 2014. GAN — 2014.
Да что там говорить, backprop в современном виде был описан только в 1986 году.
Да, не всё из этого про «обучение нейросетей», но, например, backprop и BPTT, а также GANы — это именно про оптимизацию.
А я ведь сейчас прошёлся только по самым известным и высокоуровневым штукам.
Говорить, что после персептрона Розенблатта ничего не появилось — это мягко говоря преувеличение.
UFO just landed and posted this here
Я уж даже не говорю, что к одним нейронным сетям оно вообще-то не сводится.

Об ML никто не говорил, мы конкретно нейросети обсуждаем.
Так можете какие-то конкретные новые идеи в области нейронных сетей за последние 50 лет назвать?
А то это очень странно — все говорят, что идеи есть, но назвать ни одной не могут.

UFO just landed and posted this here
Ганы и другие генеративные модели (FLOW, Vae), капсульные сети, сверточные сети,

Было описано у Розенблатта. Или с тех пор появились какие-то новые результаты, доказаны новые важные теоремы о свойствах таких сетях? Можно примеры? Я бы с удовольствием ознакомился.


дифференцируемый нейрокомпьютер и нейронная машина Тьюринга

Ну здесь можно в какой-то мере согласиться.


Кучи новых алгоритмов оптимизаторов как Adam, например.

Adam сам по себе к нейронным сетям никакого отношения не имеет, по такой логике можно "прорывом в области нейросетей" назвать любой новый эффективный метод оптимизации. Видимо, остальная "куча новых алгоритмов" попадает туда же.

UFO just landed and posted this here
ГАНы были описаны у Розенблатта?
Я конечно не спец, но везде написано, что их описал в 2014 году Гудфеллоу.
Капсульные сети предложил Хинтон и его команда в 2017 году.
Про аутоэнкодеры я не знаю, но не думаю, что они были у Розенблатта.

Все эти сети попадают в тот или иной класс, описанный у Розенблатта. Немного тонкий вопрос с ганами — в прямом виде их нет, но пару из состязательных сетей можно заменить одной эквивалентной сетью.


Я не называл это прорывом в области нейросетей. Это просто новый алгоритм оптимизации в области машинного обучения. Как раз в нейросетях применяется регулярно.

Давайте договоримся, мы говорим конкретно о нейронных сетях. Просто универсальные математические алгоритмы, применимые, в силу универсальности, к нейронным сетям не относятся к разговору.


Ну например были открыты adversarial attacks. Это было довольно неожиданное открытие.

Серьезно, неожиданно? Нет, штука конечно интересная и прикольная, тут я без вопросом соглашусь, но как и для кого может быть неожиданным факт невозможности построить гомеоморфизм между пр-вами разной размерности?

UFO just landed and posted this here
Нет не попадают. Розенблат придумал перцептрон.

Он придумал нейронные сети в принципе и назвал их "перцептрон". "Просто перцептрон Розенблатта" (без уточнений, какой именно) — это "просто нейронная сеть". Любая.


Как именно гомеоморфизмы между пространствами разной размерности связаны с adversarial attacks?

Напрямую. Любая "неполная" (в том смысле, что неспособна в силу недостатка количества нейронов распознать полный набор стимулов — то есть в общем-то все применяемые на данный момент сети как раз в этом смысле неполные) выполняет проекцию из пр-ва высшей размерности в пр-во низшей. Гомеоморфизма между ними нет в принципе. Кроме гомеоморфизма нам еще подойдет просто непрерывное вложение — но непрерывных вложений сильно меньше по сравнению с разрывными. Иными словами — чтобы сеть сошлась к непрерывному вложению должно очень и очень сильно повезти, и никаких внешних причин для такого везения — нет.
Почему для кого-то стал неожиданным тот факт, что не реализовался сценарий, вероятность которого крайне мала и которому нет никаких причин реализовывать — мне искренне непонятны, это вы не у меня спрашивайте. Действительно странной (и удачной) была бы как раз обратная ситуация.
Можно лишь сказать, что:


The existence of the adversarial negatives appears to be in contradiction with the network’s ability to achieve high generalization performance.

на ТАКОМ уровне рассуждения (просто словами, без четкого смысла) действительно может много чего быть неожиданно, с математической же точки зрения — неожиданностей никаких.

UFO just landed and posted this here
Вы мне напоминаете философов, которые используют математические термины безо всякого смысла, чтобы запудрить мозги читателю.

Если вы не понимаете математических терминов на уровне первого курса матфака — это же ваша проблема, а не моя, разве нет?
Я думал, вы имеете какой-то базовый набор знаний, сразу бы предупредили, что нет.


С какой это стати сети выполняют проекцию из пространства высшей размерности в низшую?

Ну это даже не смешно. Не вижу смысла разговор продолжать. Вы себя выше вроде за такого специалиста выставляли, а в итоге не знаете даже самых базовых вещей. Естественно, для вас будут всякие "неожиданности".

Ну вы можете почитать статью, если хотите.

Ну окей, я не поленился, в самой же статье в п.4.3 делается анализ неустойчивости (причем вполне себе тривиальный анализ, буквально в пару строк), где получены оценки, согласно которым нет никаких причин полагать, что сети устойчивы.


Для меня теперь стало все еще более непонятно — каким образом один и тот же человек в одной и той же статье называет явление "неочевидным и неожиданным", а потом там же при помощи несложных математических выкладок показывает, что ничего неожиданного в этом нет.

Качество игры отдельного бота не равно качеству игры команды ботов. Вполне может даже оказаться, что попытка максимизировать качество на отдельном персонаже давала просадку метрики по команде в целом.
Может в какой-то другой игре, но не в Доте.
В ML надо все проверять, интуиция ОЧЕНЬ часто подводит.
Нам кажется, что надо каждому игроку играть лучше, а обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильным, но при изменненных других параметрах.
Задача модели это иметь как можно лучшую заданную метрику, а она может оказаться
1. довольно хитрой или комбинацией нескольких
2. не коррелировать с нашей интуицией.

Те же шахматисты подскажут, что модель часто делает шаги контринтуитивные шаги, но они оказываются выигрышными.
Нам кажется, что надо каждому игроку играть лучше, а обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильным, но при изменненных других параметрах.

Так я же об этом и говорю. Для того, чтобы обучить бота играть более универсально, приходится ухудшить более специфичные навыки. В итоге чем больше мы будем обучать, тем хуже бот будет играть.

Не факт. Затем мы можем продолжить обучать модель и «сильный мид» (еще бы формализовать эту метрику) вновь окажется выигрышным в обучении фактором. И получим условные 81% побед с сильным игроком в середине.
Не факт. Затем мы можем продолжить обучать модель и «сильный мид» (еще бы формализовать эту метрику) вновь окажется выигрышным в обучении фактором.

Но сеть то уже не сможет играть сильно на миде, не влезет в нее.

Почему вы так решили?

Ну так из примера выше. Была сеть, которая умела стоять на миде, стала — та, которая разучилась.
Поскольку навык стояния на миде качество игры не может уменьшить никак, то может такое возникнуть только в том случае, если "разучиться" требуется, чтобы научиться чему-то другому.

Навык этот окажется активностями, возможно, тысяч нейронов во множестве сетей. Так что штука не бинарная ВКЛ/ВЫКЛ.
Навык этот окажется активностями, возможно, тысяч нейронов во множестве сетей. Так что штука не бинарная ВКЛ/ВЫКЛ.

Так речь и не идет о есть/нету, речь о качестве навыка (хорошо/плохо с практически непрерывным спектром).

Как насчет такого варианта: нынешняя сеть играет сразу всей командой, а не только на миде. Допустим, она решает, что есть смысл чуточку слить мид, чтобы спровоцировать человека на агрессивное поведение, которое в итоге выливается в большие локальные победы за счет лучше откормленных (и менее тормозных) саппортов. Именно то, о чем говорили выше в нескольких комментариях: контринтуитивные шига, которые в итоге приводят к желаемому результату.
Зачем, имея более откормленных саппортов, что-то сливать, если можно идти в атаку? о_О А если человек просто заберет мид и уйдет в лес качаться, то ИИ будет сидеть как дурак без мида?
. Допустим, она решает, что есть смысл чуточку слить мид

Нет, не может быть в доте никакого смысла слить мид. Никак и никогда. Дота так не работает.
Не надо обманываться, это никакой не контринтуитивный шаг, а просто бот разучился тащить на миде. Такой же косяк, как свен, разменивающий себя в т2, даблшрапнель снайпера и т.п. вещи.


в большие локальные победы за счет лучше откормленных (и менее тормозных) саппортов

От слива мида сапортам будет хуже, а не лучше.

обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильным
Откуда информация? С кем играла обученная модель и сколько раз? Что понимается под «сильным» мид персонажем?
Вот именно про это я и говорю.
Мы не можем сказать, какие свойства окажутся выигрышными для какой модели заранее. Если бы могли, то нам был бы ML и DL не нужен, мы бы просто писали линейные алгоритмы, которые дофига умны.
Мы не можем сказать, какие свойства окажутся выигрышными для какой модели заранее.

Нет, мы можем, потому что знаем, как игра устроена.

ОК. шахматисты тоже так думали.

Так ведь и правильно думали, разве нет? Никаких неожиданностей нейросети в шахматы не принесли.

Ахаха, вы просто напарываетесь на бритву Оккама, пытаясь приписать маловероятным сценариям наиболее вероятные шансы, не более того. Говорю вам как человек, который убил лучшие годы студенчества на Доту.

Доте нужен ИИ только для того чтобы разработать стратегию взаимосвязанных действий 5 персонажей на карте (т.е. принять решение, когда идти в атаку, когда зачищать лес, когда уйти в оборону, когда сосредоточиться на заработке золота и т.д.). Это нетривиальная проблема, а то что касается отдельных битв, которые уже начались, тут задача сводится чуть ли не элементарному решению (битвы легко просчитываются, т.к. скилов и возможных действий у героев не много).
Говорю как человек убивший пару лет на DL :)
Говорю как человек убивший пару лет на DL :)

Быть специалистом предметной области полезнее в данном случае, чем знать DL.
Да и вообще всегда полезнее.

По вашей же логике: что если ваш опыт игры в DL имеет обратно пропорциональное влияние на вашу способность разбираться в механике Доты? Ведь это, на минуточку, разные игры со своими особенностями. Вполне возможно, что не будь у вас 2-летнего опыта, сейчас бы вы имели другое, более корректное мнение :)
Понимаете, вы говорите о том, что пачка экспертов способны сделать «умную» модель, ибо разбираются в вопросе.
Это уже проходили. Экспертные системы заняли свою узкую нише и не более. В мире ML подобные рассуждения не работают.
Понимаете, вы говорите о том, что пачка экспертов способны сделать «умную» модель, ибо разбираются в вопросе.

Нет, мы говорим о том, что эксперты обычно знают некоторые вещи, которые гарантированно правильны. Например, эксперт в шахматах знает, как ставить детский мат. И что надо сделать, чтобы его гарантированно не поставили.
Есть просто некоторые вещи которые очевидно верны, в силу просто того как устроена игра. Например, в случае доты, абсолютно во всех практически осуществимых случаях при прочих равных лучше заработать больше золота и голды на команду, чем меньше (или не дать заработать противнику, например). Ситуация в которой это не так, практически неосуществима просто в силу игровой механики. Это утверждение из разряда того, что бкб работает 10-5 секунд. Ну вот столько оно работает иничегонисделать.

эксперты обычно знают некоторые вещи, которые гарантированно правильны

Не так. Эксперты знают некоторые вещи, которые работают для них. Это не значит что они гарантировано правильны.


Например, в случае доты, абсолютно во всех практически осуществимых случаях при прочих равных лучше заработать больше золота и голды на команду, чем меньше

Это очевидно не так. Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру. Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже? Можно еще придумать ситуации когда лучше пойти и продавить линию чем разбежаться на фарм. Или такого тоже никогда не случается и нужно фармить как можно больше?

Это очевидно не так. Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру. Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже?
Очевидно, что у вас неправильно задана целевая функция: вопрос не во времени или золоте, а в наборе действий, при которых шанс на победу будет максимальным. С более лейтовым составом высока вероятность, что пойти заработать золота будет менее рискованно, чем пытаться закончить матч сразу.

Это не у меня задана целевая функция неправильно, а у комментатора которому я отвечаю. И я пытался сказать именно то, что говорите и вы.

Не так. Эксперты знают некоторые вещи, которые работают для них. Это не значит что они гарантировано правильны.

Нет, именно гарантированно правильны. В принципе, объективно, для всех.


Это очевидно не так.

Это, очевидно, так.


Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру.

Вы намеренно опустили "при прочих равных"? Не существует такого варианта, где вы при прочих равных зарабатывая больше золота выигрываете игру позже.
Т.к. вы можете просто совершать все те же самые действия, не обращая внимания на то, что лишнее золото у вас есть (и, с-но, выигрываете игру ровно в тот же момент, как если бы золота у вас не было). То есть это, как минимум, не ухудшает вашей ситуации, но при этом дает вам возможность делать некоторые действия, которые без золота вы бы делать не могли (то есть ситуацию потенциально улучшает).
Есть конечно нюанс — это механика расчета золота за убийство, но чисто математически то, что вы таким образом бонусно получите, абсолютно всегда будет меньше того, что получил ваш противник.


Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже?

Это не лучше и не хуже, это одинаково (а для бота играющего против игроков — чем позже тем лучше, как раз, т.к. бот в отличии от человека не выматывается, а дота когнитивно дает очень большую нагрузку). В доту играют не на время.
И, да, имея преимущество, его обычно наращивают — забирают товера, дофармливают нужные айтемы, забирают рошана, и уже потом идут пушить наверочку, на 10-20-30 минут позже. Но зато с бОльшими гарантиями успеха.

Не существует такого варианта, где вы при прочих равных зарабатывая больше золота выигрываете игру позже.

То есть вариант сидеть в защите пока часть команды фармит и выиграть в эндгейме не существует? Всегда идет раш с самого старта? Мне кажется вы либо не разбираетесь в теме, либо уперлись и в упор не видите ошибок в своих рассуждениях. При каких прочих равных? При всех? Но при всех прочих равных у ваас и золота будет одинаково, невозможно зарабатывать больше золота делая то же самое. А значит количество золота зависит от выбранной стратегии, от конкретных действий в каждый конкретный момент. И вариантов как можно заработать больше золота в ущерб другим параметрам — масса.

То есть вариант сидеть в защите пока часть команды фармит и выиграть в эндгейме не существует?

Вы о чем?


Мне кажется вы либо не разбираетесь в теме, либо уперлись и в упор не видите ошибок в своих рассуждениях.

Вы просто не можете понять, что вам пишут.


При каких прочих равных? При всех?

Да, при всех.


Но при всех прочих равных у ваас и золота будет одинаково, невозможно зарабатывать больше золота делая то же самое.

Конечно можно! Если вы выигрываете мид, то вы получаете больше золота/опыта при прочих равных


И вариантов как можно заработать больше золота в ущерб другим параметрам — масса.

Конечно же, их масса! Но если вы выигрываете мид, а не сливаете — вы зарабатываете больше золота без ущерба каким-то другим параметрам.
И вы этого никак не хотите понять.
У того, что вы выигрываете мид — нет никаких возможных негативных последствий.
Речь ведь даже не о том, что вы можете либо стоять и тащить мидл, либо пойти гангать, нет — речь именно о стоянии на миде, где вы либо забираете больше крипов и гнобите противника, либо нет. В первом случае вы не жертвуете абсолютно ничем, вы просто получаете больше к моменту Х, и это никак не влияет на то, что происходит на остальной карте.


Вы сейчас полагаете что бот какой-то сверхумныйй и делает какие-то сверхгениальные вещи. Это не так. Текущий бот (если посмотреть игру) — довольно глуп, часто тупит, очень плох в макроигре, единственное что у него действительно хорошо выходит — это стак скилов в замесах.
Так что глупость бота в данном случае — это именно глупость бота, а не какой-то хитрый план, что "иначе было бы хуже".

в доте — равно.
идеально играющий инвокер может удержать от проигрыша и выиграть игры практически сам.
в ЛоЛе — нет, там концепция игры совершенно другая
У вас есть вся полнота ститискими обучения той модели бота, чтобы такое утверждать?
Идеально играющий инвокер ничего не сможет сделать против своей прямой контры. Ему нужны сапорты, а откуда они возьмутся в команде оптимизирующих личную эффективность ботов?
Идеально играющий инвокер ничего не сможет сделать против своей прямой контры.

Это какой? ;)


Ему нужны сапорты

В том случае, если сапорты противника на миде поселятся. А иначе — отъестся на мидере противника и начнет нагибать всю карту с 10 минуты.

Мидер противника может и не позволить на себе отъесться…

А еще тут могут и свои тиммейты «помочь» — они же тоже личную эффективность оптимизируют! Курьера отобрать, например. Или просто тоже прийти на мид.
Мидер противника может и не позволить на себе отъесться…

Мы же говорим о ситуации, когда скил инвокера значителньо выше.


А еще тут могут и свои тиммейты «помочь» — они же тоже личную эффективность оптимизируют! Курьера отобрать, например. Или просто тоже прийти на мид.

Давайте ближе к реальности все-таки ;)

Практически любому мидеру. Инвокер один из слабейших героев в миде на самом деле.

Мы же не про мид а про контру по игре. Законтрить хорошего инвокера в целом именно через мидера — задача практически нереальная.

У меня сложилось впечатление, что хотели сделать матчи зрелищными, а не уничтожение людей, учитывая игроков, которых valve выбрали играть. Вы только представьте, как бы это смотрелось, играй все 5 ботов как тот с мида ;)

Тогда лучше бы было дать стимул на победу, чтобы игроки всерьез играли :)

С другой стороны закрадывается мысль, что бот реально слабоват.
В общем как по мне, получилось, какое-то двоякое впечатление. Вроде и круто, что команда разработчиков так продвинулась за год, а с другой стороны не понятен выбор игроков и их отношение к игре.
То есть, если в том году, каждый хотел попробовать выиграть того бота на миде, то здесь получился какой-то вялый эффект :(
С другой стороны закрадывается мысль, что бот реально слабоват.

Ну я об этом ниже говорил, игра вышла не показательной из-за плохой игры людей. Если Денди год назад против бота нормально отыграл и уровень бота был виден, то тут ничего не понятно.

Вы не заметили ограничения на реакцию в 200 мс? Это между прочим почти вдвое больше, чем реакция опытного игрока.
Одного этого ограничения достаточно, чтобы сильно порезать возможности ботов.

Сделать, чтобы боты легко убивали человека 1 на 1 — несложно. Основная задача — научить их принимать долгосрочные тактические решения.
Вы не заметили ограничения на реакцию в 200 мс? Это между прочим почти вдвое больше, чем реакция опытного игрока.

А вы сможете указать в каких моментах игры это порешало?
Вы доте реакция (и вообще микро) не так важны как кажется.

В каждом моменте, где из кустов выходит герой, или когда игрок видит что-то появляющееся из тумана войны — это реакция.

Каждый раз в тимфайте, можно попытаться увернуться или побежать в определенном направлении и противник должен на это среагировать — это реакция.

В любой игре реакция и микро важны, просто до определенного уровня. и 200 мс (целая пятая часть секунды) это уровень весьма средненького игрока.
В каждом моменте, где из кустов выходит герой, или когда игрок видит что-то появляющееся из тумана войны — это реакция.

Замечательно, но вопрос остается — где именно это порешало в данной конкретной игре?


В любой игре реакция и микро важны, просто до определенного уровня. и 200 мс (целая пятая часть секунды) это уровень весьма средненького игрока.

Ну я еще раз задаю вопрос — вы можете конкретные моменты показать, где это решало, а не теоретически рассуждения?
Типа: "вот в моменте х если бы игрок среагировал не с 200мс, а с 150мс, то замес бы пошел по-другому..."


Я не отрицаю, что такие моменты возможны. Я лишь говорю о том что вы переоцениваете их количество и, с-но, важность "ограничения реакции".


К слову на счет того, что "200мс — реакция среднего игрока" — на самом деле это совсем не так. Реакция игроков в замесе сильно больше, чем 200мс, просто потмоу что ко времени реакции приходится добавить время на осознание происходящего и на принятие решения.


Пример: в первой доте из-за особенностей анимации можно было гарантированно уворачиваться от подкопа скорпа. Ну то есть если я вижу, как вы пытаетесь меня копнуть, то я отхожу вбок и вы ничего не сделаете, не подкопаете, как ни старайтесь. И для того, чтобы это сделать, не требовалось какой-то особой реакции, ну потрениться полчасика и все. Но ирл это никто не делал, просто потому что в замесе вы не можете следить за одним конкретным скорпом, а если а заметите момент подкопа, то просто не успеете принять решение об увороте, т.к. приходится учитывать еще множество фактором в плане того, в какую сторону бежать и что делать.

Механические мышь и клавиатуру конечно перебор. Но доступ к API это сильно. Я думаю, что все-таки боты не знают положение игроков вне видимости, но тут про это не написано. Например, если противник мелькает на мгновение с краю зоны видимости, человек может не заметить, но бот будет точно знать кто это и какие предметы у него есть.
Это пожалуй и есть основное преимущество ИИ против человека — способность много и быстро обрабатывать информации.
это и не совсем честно. В профессиональной Доте капитаны почти всегда играют саппортами. Почему? Потому что за капитаном слежка за картой и проработка стратегии: кто куда идет, кто свапается линиями, кто роумит, кто что покупает, что купили противники. В случае с ботами данная роль фактически снимается, т.к. это автоматически делает каждый бот. В результате получаем фактически 1 игрока с пятью героями, который знает все и управляет всем
Это не то преимущество, которого ждут от ИИ. Чем, например, оно поможет в классических шахматах?
API это просто возможность использовать не распознавание экрана, а готовые инструменты для получения информации. но это означает, что API это доступ прямо вообще ко всей информации.

API соблюдает условия честной игры — то есть не сообщает ботам о врагах вне видимости.

Ну, реакцию для ИИ замедлили — об этом в статье написано.
200мс для профессионала, я полагаю, вполне приемлимо.

Смотрел игры, там в некоторых местах нифига не 200мс, особенно показателен моментальный хекс
У вас нет опыта в игре просто. Когда хекс кидаешь а радиус действия не достигнут, твой герой идет к цели, если кинуть заранее то при блинке к тебе получиться реакция 0мс такое у людей сплошь и рядом.
UFO just landed and posted this here
Как вы вероятно помните, через shift героя можно вообще на несколько команд вперед «запрограммировать».
Там больше. И сам игрок за шейкера сказал, что не был уверен, что нужно ультовать, даже собрался куда-то идти (видно поворот персонажа после прыжка).
UFO just landed and posted this here
Не знаю, как для доты, но в том же WoW это много. Очень много. Играть просто некомфортно. И в pve, и в pvp. А на той же арене при игре на 120мс и на 50мс разница уже была более очевидна в форматах 2 на 2 и 3 на 3. То есть сказать, что вот разница из-за этого и этого — тяжело, но если я смотрел свою статистику игр за месяц, то было видно, что получаемые результаты лучше на 50 мс при отсутствии изменений в команде, механиках и прочих условий. Просто превосходство в 50-70 мс над среднестатистическим соперником по сумме всех игр набегает в ощутимый результат.
И в pve, и в pvp. А на той же арене при игре на 120мс и на 50мс разница уже была более очевидна в форматах 2 на 2 и 3 на 3.

Вы не путайте пинг с делеем. Ваши 120мс пинга на самом деле ~300.

На чемпионатах, особенно с трансляцией команд, обычно используют локальный вариант турнирного сервера, с пингом 0-10 мс.
Следующим этапом будет:
«Если бы компьютер выиграл считывая информацию органическим глазом (обязательно с слепым пятном и необходимостью моргать!) с монитора, нажимал через устающие биологические руки (с туннельным синдромом!) на мышь и клавиатуру, ему бы хотелось жрать, спать и трахаться, то можно было бы говорить о каком то прорыве.»
тогда и поговорим? :)
а вообще, все таки ограничений маловато, (но это надо вводить для будущих убер версий)
помимо суперреакции которую снизили, есть множество мелких преимуществ у ИИ
UFO just landed and posted this here

Откуда же вы беретесь, воистину!
Шашки, шахматы, го — так же были волны фанатиков, рожавших подобные опусы. Утешает лишь то, что вы обречены на провал.

Скорее, если бы эти человеческие мешки мяса использовали строгую логику позитронного мозга (дань Азимову), то у них было бы столько же внезапных озарений, как и у нас.

UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
скоро во всех отраслях… ладно не скоро ))
но я бы хотел, чтобы мне бот сделал блюда на уровне лучших ресторанов )
UFO just landed and posted this here
UFO just landed and posted this here
Эх грядет новая эра синглплейя… м-да мечты…
UFO just landed and posted this here
Ждем волну банов людей :)
UFO just landed and posted this here

GAN на новом уровне? Генератор vs детерминатор? Интересная идея — сделать имитатор человеческой игры (или иного поведения).

Imitation learning уже существует и используется как одна из стратегий обучения ботов играм.

У меня нет статистики, и возможно это совпадение но имхо шахматы стало меньше людей играть когда известно что лучшим не стать никогда.
> У меня нет статистики
зачем тогда такое говорить?
Для большинства это было справедливо и до побед компьютера.
когда известно что лучшим не стать
Это известно любому логически мыслящему человеку(коими являются шахматисты), что шанс стать лучшим очень низок.
Наоборот, это отличный плюс для новых игр и игр с небольшой аудиторией. А то случаются хорошие игры, в которые просто не с кем поиграть.
Жду бота для Майнкрафта )))
TBS — вот где нужен хороший ИИИ. Жаль, о таком можно только мечтать.
Это да. Но там во-первых нет «скиловых» действий на время типа попасть в голову или добить крипа, а во-вторых больше стратегического рандома — тактика развития может быть зависеть, скажем, случайных заклинаний Гильдии магов, или какие герои в таверне.
Люблю иногда побегать в ГТА Онлайн, но с интернетом (РТК) творится что-то непонятное — то в сессии человек 20+ и творится вакханалия, да и читеры доставляют, то из сессии все пропадают (иногда посреди миссии) и остаёшься один и становится скучно))) Были бы адекватные боты, лично мне было бы интереснее (и маты при вылетах соседи бы не слышали)))
скорее вывести на новый уровень

я слышал в XX веке какого-то гроссмейстера спросили: "а не получится ли так, что компьютер обыграет человека в шахматы, и не станет ли это смертью шахмат, как спорта". На что получил встречный вопрос "может ли автомобиль обогнать человека, и не станет ли это смертью легкой атлетики"


В шахматах люди уже давно проигрывают машинам, но ничего принципиального не произошло

Ну вообще-то, кое-что (может, и не принципиальное, но тем не менее) произошло.
Изменился регламент и теперь партии не оставляют на доигрывание именно по причине мощных анализаторов.
Читерство в любом виде спорта старо как мир. И в киберспорте полно (вроде на Хабре были статьи на эту тему), и в обычном (регламентов на ограничения болидов F1 или биты в бейсболе полно, и постоянно обновляются). Да в тех же шахматах запрет на курение ввели не из-за заботы о здоровье, если легенды не врут. Это было до ИИ, будет и после.
Но в туалет пока выходить можно, а там камер нет :).
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Люди перейдут на консоли, для которых стоят отдельные сервера.
UFO just landed and posted this here
Сложнее хакнуть.
UFO just landed and posted this here
Не сложновато ли?)
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Речь о ботах на месте людей же.
Мы еще в MUD ботов писали, которые по ночам чего нибудь интересное фармили. А как итог — в момент умирания весь мад выглядел как куча зомби, повторяющих одни и теже действия.
И чем это отличается от «тебя там разносит неотличимый от человека донатер/читер»?
UFO just landed and posted this here
Донатера/Читера/Активного игрока — тоже невозможно разнести, играя условно по часу в день. Ни скила, ни прокачки не хватит.
UFO just landed and posted this here
UFO just landed and posted this here
Нет. Донатер донатит чтобы нагибать.
Для этого в соревновательных играх давно уже придуманы всякие системы рейтинга, ну «сядет» играть AI например в рейтинговые матчи в доте, довольно быстро он окажется в топе, где он конечно же привлечет внимание со всеми вытекающими. Вне соревновательного поля, по барабану на него, черные рынки в ммо существует в них с самого начала, и да они ведут к инфляции игровой валюты, но по сколько сама валюта и ее объемы по сути «прихоть» разработчика, все о чем можно сетовать так это о больших цифрах.
довольно быстро он окажется в топе, где он конечно же привлечет внимание со всеми вытекающими

Знаете к чему это приведёт? К тому, что
Мне дали блокировку в кс просто так
Там тип патруль есть чтобы игроки вычисляли читаков, ну и естевственно школьники патрули тож есть
Вот и такой мне дал бан
Якобы я читер
Хотя я просто жесткий игрок

будет тру стори для каждого второго.
Скорее всего этот человек таки пользовался читами когда-то давно. или ставил из интереса и наследил в системе. Патруль просто так не банит, тем более там нужно однозначное согласие большого количества игроков, в том числе жестких
Патруль дается после то ли 250, то ли 500 побед в ММ + ранг не ниже DMG (12 из 16 возможных). Во всяком случае, так было раньше, в году 2015. Жестких сразу видно, точно так же, как видно «ясновидящих» или дающих постоянные префы. У меня есть знакомый, который получил бан от патруля за игру с AWP и постоянные флики. Я больше года сомневался, читак он или нет. А потом в один прекрасный день он поменял мышь, так как старая сдохла (даже в дискорде клики слышались иначе) и его результативность с AWP резко просела, хотя понимание игры осталось то же. Ему пришлось пересесть на AK-M4 и несколько недель тренироваться со мной в режиме «напарники», вроде вернулся в норму, но 180 no scope в прыжке у него до сих пор получаются не всегда. В те дни патчей КС не было.

Так что ИНОГДА патрули ошибаются, но это бывает очень и очень редко.
У патруля есть свои «ранги», и вес голоса новичка в патруле совсем не равен голосу топового игрока.
Нет, это сын моей кумы и он не использовал читы, просто молодой, реакция хорошая плюс много играл, чуть ли не подумывал о киберспорте как занятии, но после бана как я вижу остыл, занялся изучением веб-программирования :)
Очень попахивает история. Киберспортсмены же как-то играют ММ, и ничего.
Киберспортсмены, как подозреваю, не играют рейтинговые матчи. Им не нужен рейтинг, скины, и всё такое; кроме того, они не играют с рандомными противниками чтобы «не терять квалификацию».

Вполне себе играют, как раз чтобы квалификацию не терять.

По моим данным — нет, ранкед это для них потерянное время. Они играют только в составе своей команды против таких же спортсменов по лану, так как скилл не повысишь, играя с рандомными ливерами/троллями/школоло и всё такое.
UFO just landed and posted this here
будет любопытно почитать откровения самих спортсменов

Ну вот например: hellraisers.pro/ru/news/4006-oskar-otvetil-na-voprosy-bolelschikov
1matas1: Сколько ты тренируешься в день, чтобы поддерживать свой уровень игры?
oskar: Не очень много. Я считаю, что я достаточно талантлив, чтобы поддерживать уровень своей стрельбы в хорошей форме. Я также надеюсь, что моя реакция не хуже. Я просто играю FPL (закрытый ладдер на платформе FACEIT для профессиональных игроков — примечание моё) (от 2 до 5 часов) и тренируюсь со своей командой (6 часов).

В моих тренировках нет ничего особенного, несколько часов я играю FPL, потом тренируюсь с командой. Когда я чувствую, что часто не могу попасть по врагу, я захожу на DM и играю там минимум 30 минут. Примерно получается 8-9 часов почти каждый день.

Про ранкед игры ни слова.
То же самое касается не только «контры», но и других киберспортивных игр, вот например про доту: www.the-village.ru/village/people/people/315317-kiber_voini
Обычно я просыпаюсь около 11 часов утра. После завтрака сажусь с кружечкой кофе почитать новости. Потом открываю доту, смотрю, как играют другие игроки. Играю три-четыре игры для разминки один, после чего начинаются тренировки против других профессиональных команд. Делаем от шести игр в день и обычно заканчиваем часов 8–9 вечера. После тренировки проводим ее разбор, потом можем покурить кальян, сходить в кино, либо же продолжаем играть по отдельности.

Играть из дома в трусах по интернету не эффективно: не получится вместе разобрать спорные игровые моменты, да и концентрация при игре из дома совершенно не та.

Опять ничего про ранговые игры. Вы удовлетворены, или у вас есть другая инфа, противоположного плана?

В вашем же интервью человек пишет про ладдер каждый день.
хинт: ладдер — это и есть рейтинговые игры.


Играю три-четыре игры для разминки один

и тут рейтинговые игры


читайте внимательнее собственные же источники :)

В вашем же интервью человек пишет про ладдер каждый день

Покажите пожалуйста цитату про ладдер, я в упор не вижу ничего подобного, даже самого слова такого там в статье нет.
читайте внимательнее собственные же источники

А вы не фантазируйте. Ладдер если кто и играет, то по собственному желанию, в качестве развлечения, если есть на то время. Каждый же день — только командные тренировки. Ладдер каждый день может себе позволить только тот, у кого нет команды. Таки читайте внимательнее мои источники.
Покажите пожалуйста цитату про ладдер, я в упор не вижу ничего подобного, даже самого слова такого там в статье нет.

Я просто играю FPL (закрытый ладдер на платформе FACEIT для профессиональных игроков — примечание моё) (от 2 до 5 часов) и тренируюсь со своей командой (6 часов).
Это не тот ладдер, это соревнование для профессионалов, с призовым фондом, принять участие в котором можно лишь по инвайтам или через FPL Challenger — квалификационный дивизион. Ничего общего с обычными рейтинговыми играми.
Хотя я тут нагуглил рейтинг обычного ладдера по доте (ссылочку любезно предоставили ниже) — таки первые 3-6 мест занимают игроки, входящие в какую-либо команду. По контре статистику было бы интересно найти.
Так что сойдёмся на том, что некоторые профессиональные игроки регулярно играют в рейтинговые игры. Как часто у них возникают проблемы и как они решаются, это уже другая история.
Про CS:GO не скажу, но в доте все (или практически все) про игроки играют ранкед. Убедиться можно здесь, например. Скажу больше, в доте прямо в клиенте есть специальный раздел, где можно «в прямом эфире» смотреть ранкед игры про игроков.
Любой стрим посмотрите. Вполне играют топовые спортсмены ММ.
Вот открыл твич, зашёл на канал cs:go, и вижу там либо командные бои в туринирах, либо одиночек «качаем лвл», не относящихся к про игрокам. Может, конечно, я «не вовремя зашёл» или «не там искал», тогда не могли бы вы дать мне ссылку на стрим про игрока (входящего в состав киберспортивной команды), играющего ранкед?
Открываете гугл, вводите «shroud plays counter strike mm», не нравится шрауд — заменяете на GetRight, или ещё пару десятков топовых игроков вполне играющих ММ. Ещё раз, то что вы нашли как несколько игроков во время подготовки к чемпам не играют ММ — совсем не показатель чего либо. Я и не пытался утверждать что абсолютно все и абсолютно всегда играют ММ, я лишь сказал что таких примеров не мало, и тысячи результатов по моим запросам — вполне себе доказательство. И никого из них не банил патруль.
Мне кажется вы делаете обобщающий вывод на основе нескольких стримеров, попавших в команду на волне популярности.
Например, возьмём этого Michael «shroud» Grzesiek. Топовый стример, ушедший из команды чтобы продолжать стримить!
Возьмём его команду, Cloud9; первый попавшийся и довольно давно в ней числящийся игрок — Tyler «Skadoodle» Latham. Гуглю «Skadoodle plays counter strike mm» — и получаю болт. Не играет в ранкеды, видимо. Беру следующего, autimatic. Нахожу одно единственное видео «AUTIMATIC PLAYING ESEA RANK S ON MIRAGE (FT.STEWIE2K)». Вроде бы это ранкед? Я не уверен из-за ESEA. На его стримах — командные игры в основном. Следующий игрок STYKO — снова ничего не найдено. И так далее.
В общем, ваши доводы не убедительны.
Шрауд вначале был топовым игроком, и только потом стал стримером. То что сейчас он ушёл из про игр не отменяет того факта что он стримил ММ игры ещё будучи про игроком. Если бы сын вашей снохи (или кого там забанили) играл на уровне хотя-бы в половину от Шрауда — он легко бы попал в любую тир2 команду. Ещё ники про играющих в мм — pashabiceps, kennys, screaM, s1mple. Вас права будто забанили в гугле.
Шрауд вначале был топовым игроком, и только потом стал стримером

У меня другие сведения:
Mike «shroud» Grzesiek has been playing since the launch of Counter-Strike: Global Offensive. He rose to prominence through the popularity of his twitch stream as well as his talent in the game which he displayed in ESEA-M with Slow Motion and then with Exertus and Manajuma in ESEA Invite.

He decided stepped down as he wanted to become a backup player and full time streamer for Cloud9, although at this point he had already decided to retire from the game.

Сейчас он стримит исключительно пубг уже с год.
У меня другие сведения:

Ну так по вашим собственным данным —

as well as his talent in the game which he displayed in ESEA-M with Slow Motion and then with Exertus and Manajuma in ESEA Invite.

И помимо шрауда я вам дал не мало имён
Они играют только в составе своей команды против таких же спортсменов по лану

Вы в курсе, что многие прогеймеры тренируются по режиму, эдак 8-12 часов в день? На каких ланах это происходит, по-вашему?

Уточните — они тренируются порознь, или таки командой? Если порознь, то они точно входят в состав команды?! Почему они не тренируют командный скилл, почему задрачивают ненужный ранг? Если в команде, то при чём тут ранкед?
Уточните — они тренируются порознь, или таки командой?

И командой и нет.


Если в команде, то при чём тут ранкед?

А как ранкед мешает игре в команде? оО

Про игроки постоянно играют в соло ранкеды, иногда играют с другими про командами.
Не знаю откуда у вас «ваши данные», но это можно узнать как из интервью у про игроков, так и на их стримах.
Думаю, как раз наоборот — попав в команду, играют в основном с ней (и было бы странно играть соло), время от времени развлекаясь в ранкеде, да и то не все командные игроки продолжают ранкед игры.
это можно узнать как из интервью у про игроков

Хотелось бы видеть. То, что я находил (см выше например), говорит об отсутствии интереса к ранкед при наличии команды.
Ясно что ранкед будет далеко не в приоритете, но тем не менее они его играют.
Вы смотрите одну конкретную дисциплину, а не киберспорт вообще.
Если взять League of Legends/DOTA — то там про игроки регулярно стримят. Включая тех, кто участвует в чемпионатах мира (то есть игроки из топ-16 команд).
Мы просто говорили про конкретную дисциплину.
Скорее всего этот человек таки пользовался читами когда-то давно. или ставил из интереса и наследил в системе.

Вот это точно ни при чём, потому что бан ему дали «следователи патруля» после просмотра записи игры, где на него тупо нажаловались «за неподобающее поведение». Читы им в той игре, запись которой смотрел патруль, не использовались 100%, что не помешало дать ему бан за «сторонние программы, помогающие целиться, видеть местоположение врагов или получать другие преимущества над остальными» (цитирую со скриншота ответа, возможно автоматического, службы поддержки по поводу бана).
ПыСы им было наиграно в том аккаунте до бана 680 часов игры. Как я смотрю, он взял после бана чей-то аккаунт (не помню точно чей, то ли приятеля то ли родственника) и, видимо, продолжает играть там. Видимо я ошибался насчёт того что он забросил кс: го как киберспорт, так как тот акк входит в какую-то закрытую группу «HUNTER TEAM».
Конечно есть крайне малая вероятность ложного срабатывания патруля, но ещё раз — это работает совсем не так просто как вы описали. Для бана необходимо единогласное согласие большого количества игроков разного уровня. При этом всех в патруле проверяют роликами с заведомо не-читерами и заведомо читерами, если «патрульный» такой тест не проходит — его голос в последующем значит очень мало. Поэтому вариант со «школьниками банящими за читы всех кто хорошо играет» не проходит, хотя бы потому что в контре очень много очень скиловых игроков.

Я склоняюсь к тому что ваш знакомый побаловался софтом, да и забыл даже, а бан подвезли через год-полтора, совсем не редкая ситуация.
Я склоняюсь к тому что ваш знакомый побаловался софтом, да и забыл даже, а бан подвезли через год-полтора

Ёлы-палы, я же ссылался на конкретную причину блокировки:

Такое невозможно для игры пол года назад — жалобы не рассматривают с таким огромным лагом. Повторяю, это не VAC бан, а ручной бан патрулём.
Я кстати не знаю какая там очередь на жалобы патруля. Ввполне может быть что и не маленькая. Ну тут два варианта — либо он читер, либо он словил вероятность схожую с вероятностью победить в лотерею.
Ещё забавный момент — всем в патруле время от врмени подсовывают игры известных про игроков на проверки, и если они этого про игрока отметят как читера — их голос перестанет иметь какой либо вес.
А можно уточнить, как вы определяли популярность шахмат в медийном пространстве и после какого события она сильно упала?
Я лично не могу сказать за цифры, но вот когда был мальцом — я точно знал и следил за матчами Карпова и Каспарова и помню как по центральным какналам показывали разобры матчей. Конечно сейчас есть интернет, который уже выигрывает у телика по аудитории, но вот мой сын не смотрит шахматы и даже не умеет в них играть в своем возрасте. Ну ок, может быть моя вина, но никто из моих родителей и прародителей ничего мне не рассказывал про шахматы и не учил играть.

Всё таки нельзя строить выводы об изменениях на основании одного наблюдения. Возьмите хотя бы десяток. Если это будут друзья и знакомые — это тоже не будет достаточно репрезентативной выборкой, но хоть что-то. Делать выводы просто на основании сына — это совсем перебор. Вдруг он у вас в футбол не играет — так что же, популярность футбола, выходит, упала?

Он играл и занимался футболом, потому что это популярно. Но в целом я с вами согласен что нельзя делать выборку по мне одному, но я и привел другой аргумент — раньше матчи транслировались по телевидению, по центральному, а сейчас нет — а они там ориентируются не только на меня. И да — мой сын и шахматами занимался :).
Меняем шахматы на футбол, находим сына геймера и вуаля: популярность футбола упала потому что чей-то сын им не интересуется, а отец интересовался.
У меня сын ещё и геймер, то есть и футболом и шахматами и в Доту гамает. Но вот так — теннис конечно упал в популярности :), им не занимался :).
Перечислите настольные игры, которые были популярны во времена вашего детства?
Шахматы, шашки, морской бой, карты и…
И все?
Менеджер/Монополия вдвоем не так интересно.
Ну может еще 5-10 игр.

Сейчас шахматы/шашки не потеряли популярности в абсолютном количестве, но в процентном конечно уступают миллионам игр на телефонах, планшетах, и т.д.
Не совсем понял что вы хотите сказать… Давайте на язык цифр. Вы утверждаете что шахматы в абсолюте не потеряли — то есть как ими увелекалось N человек, так и увлекается N человек. Но если раньше это Н было А%, то сейчас это N это B%, но так что A > B? То есть если раньше всего «увлеченных» людей было N/A*100, то теперь их N/B*100 — так? N/A*100 < N/B*100 — правильно?

Ну или по простому — шахматы потеряли рынок, то есть стали менее популярны — в принципе я это и говорил.
Онлайн шахматы, шахматы на мобильных устройствах — стали еще более доступны. То есть аудитория есть и она вполне могла вырасти.
Население земли увеличилось.

Другое дело, что у шахмат есть серьезные конкуренты, поэтому да, я предполагаю, что количество людей, играющих в шахматы, не стало меньше.

Стало однозначно. Я же перестал играть :)

Будет стимул. После создания подобного ИИ встает следующая задача, научить его ошибаться так, чтобы метрика заинтересованности живых игроков была максимальна.

А после этого — мне будет глубоко безразлично живой ли там человек. Скорее даже наоборот, если бот будет давать максимальную заинтересованность, то он будет предпочтительнее живого человека. А следующим этапом станут личные боты, которых таскаешь из игры в игру, потому что они будут знать что нужно конкретно тебе. Такой виртуальный друг. Потом ему добавят функцию общения, а там уже один шаг до влюбленности… Так стоп, что-то меня не туда немного занесло...

Почему нет. Или просто твои данные будут таскаться из игры в игру и боты новой игры будут подбираться под тебя. Если игра «с вызывом», то и боты будут на уровень выше «средней» игры.

Ну собственно да, к этому все и идет. Я не фантастику описывал а вероятный по моему мнению сценарий. Более того, я реально этого жду потому что для меня главная проблема в мультиплеере это то, что со случайными людьми мне играть не интересно практически, а с одними и теми же начинаются проблемы совпадения по времени. С ИИ ни того ни другого не должно быть в идеале.

Поддерживаю. Интереснейшая область, где может быть действительная польза.

Помимо изменения регламента (без доигрываний, без гаджетов и т.д.):


  • изменился процесс подготовки (дебюты просчитываются дальше)
  • продвинулась теория (базы окончаний),
  • радикально изменился послематчевый анализ (игрокам в прямом эфире показывают альтернативные ветки, чемпион мира делает большие глаза, оппонент говорит что видел эту линию но не рискнул — шоу продолжается и после окончания партии),
  • больше людей могут понимать партии топов (движки в реальном времени показывают оценки и лучшие ходы)

Но в целом шахматы не умерли, а получили развитие. На каждом крупном турнире применяются новые идеи, которые можно играть не раз и ходы, которые вообще не игрались раньше.

UFO just landed and posted this here
Вообще то сравнение шахматиста не совсем верное.
Вот когда автопилот научится водить лучше человека (а пока он ещё отстаёт), тогда реально начнется закат «человеческих» автогонок.
Как уже писали выше по моим субъективным оценкам, люди перестали стремится как раньше развивать уровень в шахматах, играют просто для удовольствия. Без заучивания и проработки всяких партий, дебютов и т.д.
Не дисциплина не умрёт, просто после того как достоверно установлено что человек не станет лучшим, люди перестают стремится быть лучшими.

В итоге, да люди будут продолжать играть и ездить на авто, и т.д. во всех средах где ИИ станет сильнее, но будут делать это для удовольствия, а не соревнования.
UFO just landed and posted this here
Развитие происходит по спирали.
Когда-то в Ф-1, если не случалось механических неполадок, выигрывали чисто гонщики. Просто потому, что в принципе повернуть на этой болванке на велосипедных колесах мог далеко не всякий. Потом появились более широкие колеса и выигрывать гонку начали двигатели. Потом придумали антикрылья, и выигрывать гонку начала аэродинамика. Потом придумали турбину и снова начали выигрывать двигатели. Потом аэродинамику и двигатели придушили и снова начали выигрывать гонщики, но не долго — появились трэкшен контроли и АБСы… Их тоже придушили… Но появились КЕРСы… Сейчас придушили все и выигрывать начала надежность. Думаю, что на следующей итерации снова на первый план выйдут гонщики.
Это я все к чему? Шашки 8х8 и 10х10 уже решены, примерно как крестики-нолики 3х3, где победа невозможна. Но продолжают проходить чемпионаты…

после того как достоверно установлено что человек не станет лучшим

Факт, что человек с ружьем и некоторым опытом стрельбы на открытой местности примерно всегда дойдет до финиша первым — не отменил соревнований по легкой атлетике между людьми без ружья.
Или дополнить…
Ээээ… AI тут вообще не причем. Боты для игры в разные онлайн игры пишутся давно и пачками. И админы с этими ботами борются с переменным успехом.
Наиболее широко «в прессе» представлены битвы против ботов администрации WoW, которая, как считается, недополучает кучу денег из-за активности ботов и из-за того, что игрокам не использующим ботов — тяжело. И да, время от времени банят «ботоводов» пачками в сотни тысяч аккаунтов… Но в свое время народ писал автоприцеливалки для различных он-лайн шутеров. (Да и в «нашем все» Quake, кстати, штатных встроенных ботов для игры при недостатке онлайн-игроков, по рассказам авторов в те годы, пришлось делать сильно тупыми и медленными. Иначе у мясных игроков вообще шансов не было.)
Уважаемый, просто из любопытства, вы в 1994м году уже в школу пошли? А я вот в 1994м году забросил тему искусственного интеллекта как бесперспективную на время моей жизни (вариант, что мне когда-то стукнет 45 и я еще после этого буду жить — не рассматривался).
ИИ, победивший людей в Доту — интересен в первую очередь тем, что он «самообучился» своим стратегиям и тактикам. Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было. Даже близко. Совсем.
О чем я и упомянул в контексте Quake: 19 лет назад разработчикам ботов в Quake Arena пришлось оных ботов сильно оглупить и замедлить. Ибо иначе хомо сапиенсы дохли до того, как имели шанс увидеть бота.
Но основная моя мысль была в том, что администрации онлайн игр не очень важно, управляется бот нейросетью на суперкомпьютере или скриптом на вижуал васике. Им важно, чтобы «платящий кастомер» продолжал платить. А платящий кастомер почему-то упорно не хочет платить, когда его всегда обыгрывают. По этому, администрация примерно всех более-менее крупных онлайн игр активно борется с неофициальными ботами, нарушающими игровой баланс.
Молодой человек, вы меня с кем-то путаете.

Вдобавок вы путаете ботов для всяких wow, цель которых не обыграть человека, а прокачать аккаунт. И ботов, которых пишут именно для игры против людей, так чтобы людям с ними было интересно играть.
А в 94-м я своих «ботов» писал, а не в школу ходил.
Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было.

Лучшие «традиционные» боты для доты, писанные неплохими программистами не имеют никаких шансов против мало-мальски умеющей играть команды людей. Вы путаете шутеры где основное действие довольно просто (стрелять в голову) и на 99% решает реакция с MOBA играми, где даже идеальная реакция не спасёт от слаженных командных действий.
Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было.

В случае доты это неверно. Quake в этом плане намного проще. Для доты вы хорошего бота без самообучения не напишете.

Ох… Вы прям почти убедили меня таки тряхнуть стариной и снова заняться программированием, написать бота для Дота… Но тут больше чистой математики, чем программирования.
Просто, на момент начала игры, когда выбираются команды, бот должен исходя из состава соперников решить задачу оптимизации, выбрать свою команду, и модель поведения с соответствующими команде соперника весовыми коэффициентами. Дальше вопрос кодинга и получения доступа к API. (и да, решить задачу оптимизации — нетривиальная штука в данном случае, нужно будет потрудиться, чтобы задачу сформулировать и более-менее быстрый метод ее решения придумать...)

Вы менеджер с техническим бэкграундом? Общую схему вы описали конечно верно (она тривиальна), а вот решить те самые детали — без обучения — это вряд ли. На уровне стандартных ботов доты — да. Но не на уровне профи.

Скорее железячник с программерским бэкграундом
Хотя, уже наверное можно сказать, что менеджер. Но все еще считаю себя инженером. Просто 30 лет назад решил, что не хочу быть просто математиком, 25 лет назад ушел из программистов, а 20 лет назад ушел из чистого ИТ в энергетику и охлаждение для ИТ.

А про бота… Решать детали — это можно использовать мудреные нейронные сети, а можно вспомнить, что каждая характеристика каждого персонажа — это чиселка. И эту чиселку можно вбить в соответствующую клеточку матрицы. И потом, понадергав строчек из этой матрицы, порешать систему уравнений… И потом, решив задачу оптимизации, выбрать одну из достаточно типовых стратегий поведения для «своих» персонажей с весовыми коэффициентами.
Мало стратегию поведения выбрать, ее нужно еще и закодить. И еще как-то успевать поддерживать в актуальном состоянии в условиях постоянно меняющихся правил…
Изменение правил — это чаще всего просто изменение чисел в матрице. И все. В остальном алгоритмы остаются. Если эффективность бота после этого снизилась, можно залезть, ручками поправить ему какие-нибудь весовые коэффициенты.
А если что-то более глобальное, то тут и люди не час потратят на то, чтобы приспособиться.
UFO just landed and posted this here
Почему бы вам не сделать так для шахмат? Или Го?

Если я правильно помню, то примерно так и были устроены всю жизнь системы для игры в шахматы. В том числе, система, которая обыгрывает чемпионов мира. Про Го — не уверен.

когда могли бы просто решить «несколько уравнений»

У нас вроде есть доступ к API и нам не нужно заниматься распознаванием изображений? Если бы нужно было распознавать изображения, то да, сверху системы уравнений можно было бы прикрутить нейронную сетку для распознавалки. Опять же, простые «тупые» алгоритмы вполне справлялись с распознаванием характерных паттернов в 90-х на 386-х процессорах с 640К оперативной памяти и жестким диском на 20 мб… Но, соглашусь, на ML в наше время это делать проще.
Мне кажется несколько наивно считать себя умнее довольно большого количества людей, пытавшихся решить эту проблему уже больше десятка лет. Хороших ботов для доты пытались сделать ещё со времён WC3, но их всё ещё нет.
И эту чиселку можно вбить в соответствующую клеточку матрицы. И потом, понадергав строчек из этой матрицы, порешать систему уравнений…

Вычислительная сложность той системы, что у вас получится, вас не смущает? ;)

UFO just landed and posted this here
Вычислительная сложность той системы

Как бы так сказать… Была у меня во студенчестве задачка. Как ни крути, требовалось для решения три «матрицы» 64x64x64 типа флоат… А памяти было в плохие дни 32 килобайта, а в хорошие — те самые знаменитые 640… Ну и пришлось извратиться чуть-чуть и обойтись двумя матрицами 64х64. И много других примеров было в моей жизни. Так что, нет, сложность меня не смущает.
Знаете, на протяжении всех лет существования MOBA игр, это самое сложное.

Потому что вариантов как можно отыграть чемпионом, в какую сборку пойти, какие руны проставить — слишком много. Поэтому игроки выбирают контр-пик исходя из своих навыков.

Поэтому даже просто выбрать свою команду — это огромное количество обучения, которое критически зависит от навыков управления чемпионом.

Это обучение, обучение, обучение.
Мне кажется, вы просто слабо себе представляете размеры тактического простора в доте, потому что слабо знакомы с самой игрой. Нет никаких шансов сделать ботов без привлечения нейросетей, ограничиваясь хоть сколько-нибудь вменяемыми вычислительными ресурсами. Серьезно. Это не Quake, где можно быть полным дубом в плане тактики, компенсируя это нечеловечески быстрыми выстрелами в репу из рельсы. Идеальные в плане реакции и механических скиллов боты, не умеющие играть впятером и не «чувствующие карту», обречены против сколько-нибудь умелых мясных игроков.

Кроме того, дота — игра с неполной информацией, и это кардинально усложняет задачу. Задача «что делать, когда я вижу врага» намного проще, чем задача «что делать, когда врагов не видно» — не только для машин, но и для людей.
А каков тактический/стратегический простор доты в сравнении со старкрафтом?
Грубо: больше/меньше/сравнимый?
А каков тактический/стратегический простор доты в сравнении со старкрафтом?
Грубо: больше/меньше/сравнимый?

Тактический — в старкрафте сильно шире за счет большого количества юнитов (с-но тут боты могут очень силньо выигрывать, т.к. могут позволить себе многозадачность, в то время как никакой игрок не может успеть сделать все, что требуется, с-но распределение внимания с расстановкой приоритетов — один из важнейших скилов хорошего игрока в ск). Стратегический — в старкрафте немного уже.

UFO just landed and posted this here
Моменты с мгновенным хексом — слишком быстрая реакция для человека. В истории PRO доты таких случаев единицы, а тут бот без проблем повторяет этот трюк снова и снова. (там ведь не только прожать айтем, но ещё и довести курсор до модельки противника, и прожать второй раз). Тоеть за время которое мы наблюдаем на экране нужно сделать три действия. Возможно нужно ещё 20-40мс прибавить ко времени реакции чтобы у людей было больше шансов.
Сейчас в доте из «коробки» есть настройка использования скила\предмета по 1 нажатию (срабатывание будет в месте курсора). Так что кликать не надо, только навестись + нажать кнопку слота.
в любом случае надо навестись, это наиболее долгое действие, как мне кажется.
На самом деле нет. Примерно так же быстро, как и фликшоты с AWP в CS:GO. Только отличие в том, что модели героев достаточно жирные и уберточность как в шутерах не нужна. Больше всего времени уходит на анализ ситуации и принятие решения.
Как раз фликшот с авп на мой вкус выглядит легче, там всё гораздо лучше по контрасту модельки противника с фоном. (сужу со своего ранга GlobalElite и частой игре с авп)
Те же ранги, та же игра с AWP как с мейн-девайсом. Только кроме 4+ лет в CS:GO и 4к часов в этой дисциплине, у меня еще 7к часов в Dota 2. Разница невелика. В доте даже проще, так как есть ренджи, быстрые действия часто производятся с блинка и так далее, там даже больше времени на осознание и подготовку к самому действию, когда в CS на чистом рефлексе.
В кс сами условия позволяют реагировать на рефлексе, в дотке как-то сложнее. Лично мне, опять же.
Касты через апи, насколько я понял. Т.е. никакого наведения у ботов в принципе нет. А так было бы интересно посмотреть, промахивались бы боты способностями или нет?
наверное только через механическое управление…
правда до этого еще далеко )

А в чем причина упования на механическое управление? Если бот собирает стандартный кубик рубика за 0.35 секунд, то и на кнопки нажмет, и мышкой подвигает с нечеловеческой реакцией. Просто создание таких роботов — это другая ключевая компетенция команды исследователей, и смысла распыляться сразу на два фронта никакого нет.

UFO just landed and posted this here
Промахиваются, в первой игре Death Prophet не попала способностью. Сам момент тык
Промахиваются, в первой игре Death Prophet не попала способностью. Сам момент тык

Кажется, она его не видела, когда волну кастовала.

Так там способность на площадь а не targeted
Кажется, она его не видела, когда волну кастовала.

Некромант вышел из тумана когда ударил крипа, AI сразу же применил способность.

Так там способность на площадь а не targeted

Таргетно да, не промажет, даже среди кучи вражеских юнитов.
Некромант вышел из тумана когда ударил крипа, AI сразу же применил способность.

Нет, не сразу, баньше пришлось подходить примерно секунду, и некра скорее всего не было видно. Она подумала что он остался в лесу стоять, а он вышел.

Активировать вещи можно с клавиатуры еще с первой доты. Я регулярно так делаю, если PRO игроки игнорируют такую возможность — значит скорость для них не главное. Или им есть куда развиваться :)

Вы кажется не поняли мой комментарий. Конечно все пользуются хоткеями, вот только от необходимости вычленить из визуальной мешанины модельку противника и навестись на неё хоткеи не избавляют.
3-4 персонажа ИИ согласованно ломали вышк
Скажите, а бот всё-же один, или их несколько? Я про то, что управляются они с одного компьютера, или нескольких?
В примере у живых(pro) игроков нужно добавлять важную составляющую как коммуникации — кто танкует, кто идёт. Чаще всего проблема в коммуникациях является причиной поражения(кто-то вышел в лес фармить, его поймали и пропушили базу 5 на 4; либо кто-то сказал «валим!», один понял «валим домой», другой понял «валим их»).

В жутком замесе(который может длиться всего 10 секунд) очень сложно разговаривать и координировать аттаку, и люди полагаются только на навыки, опыт и сыгранность команды.
Если боты управляются с одного компа, значит ему ничего не стоит контролить все 5 героев и согласовывать моментально действия.

Если боты управляются с разных машин, то стоит для (немного) бОльшей чистоты эксперимента(они же ввели 200мс на реакцию, значит хотят чистоту) делать также задержу на координацию хотя-бы в 1 секунду: кто перетанковывает, кого начали пушить, итд.
Как-раз из-за того, что в живых играх живые игроки видят игровую ситуацию немного в разные моменты времени, то и оценивают ситуацию они по-разному: одному игроку может показаться хорошей идеей идти в контр-аттаку, а другому нужно сходить на базу. Чтобы принять решение что делать — все должны мыслить одинаково (еще не изобрели нейро-хаб).

Опять-же боты получается должны быть примерно в аналогичных условиях: каждый бот играет только 1 персонажем, принимает решения только исходя из своей текущей ситуации (ты всё знаешь о своём герое), и немного о ситуации у твоих союзников, обмен командами тоже в ограниченном объёме и с существенной (для бота) задержкой.

промахивались бы боты способностями или нет
Тоже хорошее предложение. Как вы знаете, у человека имеется задержка на опознание цели. Мы видим не текущую картинку, а с запозданием в ~80мс. Это значит, что мы никогда не сможем попасть в движущуюся цель, если не начнём предсказывать следующий её шаг. Это значит, что человек при прицеливании(что в доте, что в action) планирует, где будет враг через ~200мс(пока рука кликнет, пока наведётся). Это очень хорошо видно в стрелялках — очень часто стреляя в выбегающего противника ты стреляешь правее/левее него, потому-что ты ожидал, что он остановится там. И это хорошо видно в самой доте — опытные игроки очень часто красиво уворачиваются от AOE-стана людей.
Так вот, ботам также стоит добавить задержку в прицеливании с прогнозом/предсказанием где будет герой противника через это время.
Боты управляются отдельно. Но, не в курсе насчет коммуникации, насколько она быстрая и как они принимают решения.
ПС: Я конечно понимаю, что суть эксперимента не в том, чтобы наконец-то выиграть в доте и накачать рейтинг. Но всё-равно я пока скептически отношусь ко всему этому(не потому что не верю, что ИИ будет обыгрывать людей). Как вариант, не стоит называть этот эксперимент игрой в доту, а скорее «экспериментом игры против людей в очень сложной, постоянно меняющейся обстановке».
Если боты управляются с разных машин, то стоит для (немного) бОльшей чистоты эксперимента(они же ввели 200мс на реакцию, значит хотят чистоту) делать также задержу на координацию хотя-бы в 1 секунду: кто перетанковывает, кого начали пушить, итд.

Вообще вполне возможно что боты не осуществляют никакой коммуникации вовсе. В таком случае для чистоты эксперимента следует отключить внутриигровой чат и разнести людей-игроков по разным комнатам. И запретить им видеться до игры полгода.
IMHO, команда людей-непрофессионалов, играющих первую игру в заданном составе, по уровню коммуникации сопоставима с ботами без общения. Люди могут крикнуть «ультуй», а боты независимо рассчитают что подранок 90% уйдет и не полезут под башню. И то и то может сработать как в плюс, так и в минус :-)
Посмотреть на игру сыгранной команды ботов против сыгранной команды людей было бы действительно интересно, даже если люди — не супер-про.
Ограничение на коммуникацию без проблем преодолевается пятикратным запасом по вычислительным ресурсам…

А как же неполнота информации? 5 кратный ресурс работает, когда каждый бот владеет полной информацией о каждом игроке своей команды

Так ведь так и есть, каждый игрок владеет полной информацией о всех союзниках. В доте же видимость на всех союзников общая.
Насколько я понял, коммуникации между ботами нет. Они просто идентичны, и поэтому «знают» что будет делать их команда.
UFO just landed and posted this here
Для тех кто не знаком с киберспортом в доте поясню: blitz, cappitalist, merlini, fogged не являются профессиональными игроками, а только аналитиками и комментаторами освещения киберспортивных турниров. В то время только Moonmeander является игроком, за последние пол года он проиграл практически все что только можно было проиграть.
Справедливости ради, ваш комментарий тоже можно понять двояко. Да, сейчас это комментаторы и аналитики, но почти все были про-игроками. С ликвипедии:
William «Blitz» Lee is an ex-professional Dota 2 player

Austin «Capitalist» Walsh is an independent Dota 2 caster and content creator. He has also played Dota 2 at a semi-professional level

Ben «Merlini» Wu is a former professional DotA player

Ioannis «Fogged» Loucas is a Dota 2 player

Поэтому не стоит думать, что взяли абы кого. Этот матч изначально преподносился как команда ботов против команды бывших про-игроков.
ИМХО эти 5 игроков обыграют любую команду собранную из любых пользователей ХабрХабра.
А вот это интересно. TimsTims, не хотите «профессиональную» Дота лигу открыть? «Профессионалы» с Хабры, профессиональные комментаторы\аналитики с матчей, профессиональные букмекеры, разработчики, создатели ботов?
Сейчас dota2 выпущена такой урезанной и закрытой, что старым in-house лигам места не осталось. Там нету чата, нет каналов, невозможно завести ботов, негде взять статистику по последней игре. Ты не можешь изменить сам карту для доты с крутыми модами, чтобы все в неё играли (эх, кузница карт worldeditor и площадка battle.net… рай для творчества.). Всё закрыто, всё контроллируется Valve. А когда тебя контроллирует 1 источник — то сегодня ты есть, а завтра тебя нет.

пс: про букмекеров и деньги в dota-лигах всё не могу свою 3ю статью дописать :/
Дота и Лига Легенд — игры достаточно старые.
Вы можете удивиться, сколько на Хабре может оказаться уважаемых людей, которые успели в свое время потратить достаточно времени на МОБА игры. И даже поигрывать сейчас.
Наблюдая за пируэтами спасающейся от сокола ласточки понимаешь, что человеку такое недоступно. Только вот ласточек и соколов становится все меньше, а людей… Мораль: кто его знает, чем все это закончится...)))

А для коров вообще сработал принцип: хочешь хорошо размножаться — позволяй себя кушать

«Порхай как бабочка, кукожься как гусеница», если я правильно понял принцип этой ветки комментов
UFO just landed and posted this here
Не забывайте про туман войны.
Основная суть в том, что боты смогли поймать человека толпой.

А для этого нужно было вовремя согласовать свои передвижения таким образом, чтобы уйти со своей линии, успеть догнать человека так, чтобы он не успел убежать, успеть его убить, успеть вернуться на линии за фармом.

Опытный игрок не должен быть идиотом — если с другой линии уходит противник, значит возможно он вышел к тебе на перехват, и надо отступить. И вот в этом часто и заключается основная сложность. Когда уже непосредственно началась драка 1 на 2 или 1 на 3, это уже самый финал комбинации.
было много подобный статтей, но ни в одной не увидел, хоть и спрашивал, информацию о том, сколько стоит это мероприятия?… во сколько долларов обошелся этот матч? ведь подобные вещи требуют огромный вычислительных мощностей, на офф сайте читал, если не изменяет память, было задейстковано более 200т машин в кластере…

это как сделать лапмочку нового типа, которая очень светит, то жрет 10кВат в час… прикольно, освещает, но нафиг не нужно, зато сделали… могёте!

Сам матч? Я думаю, вы это не серьезно. Ясно же, что основные расходы на эту исследовательскую работу — это зарплаты самих исследователей и железо для обучения.


Если считать прям совсем грубо (с ошибкой в несколько раз), то условно, зарплаты за год — $1млн (там человек 10, но как я понимаю, самые высокооплачиваемые над другими проектами тоже работают, не только над openai-five), ещё столько же — аренда железа (256 gpu, 128000 cpu cores).


Теперь можете говорить, если хотите, мол, как дорого, лучше бы пенсионерам раздали.

Будучи игроком в доту со стажем, вставлю свои пять копеек.
1) > однако, не слишком радикально влияли на игровой процесс
Именно, что влияли радикально. Например, именно 5 бессмертных курьеров позволили ботам делать то, что они делали: танковать вышки и не возвращаться на базу для отхила.
2) > пул из 18 героев
Это не просто 18 героев, а 18 героев с простейшими механиками. Там не было ни одного героя, которых люди обычно называют «мерзкими». Тот же Тинкер в одиночку мог бы в одиночку защитить базу от пуша ботов, и вся их тактика была бы поломана.
3) > реакция ботов была ограничена 200 мс
Не похоже, судя по инста-хексам лиона. Я не разбирал тот момент, но такое возможно в двух случаях: ошибка человека и каст хекса заранее (что, по сути, тоже ошибка). Поясню: ульт шейкера имеет нулевое время каста, то есть должен срабатывать моментально после блинка (при активации через shift). Если человек не использовал shift — это его ошибка (в первую очередь из-за отсутствия опыта игры против ботов). Если человек позволил заранее сделать на себя каст хекса — это тоже его ошибка (для этого есть смок). В итоге либо ошибка человека, которую не допустит опытный игрок, либо невероятное время реакции, что не является честным на мой взгляд.

По итогу: боты сильно прожимают кнопки и двигаются по карте, но делают множество бесполезных вещей (вроде прожимания смоков под вражеским тавером). И если последнее рано или поздно поправят, то как править общую «безыдейность» игры — мне не понятно. Как только боты оказываются в незнакомой или сложной ситуации, они перестают действовать адекватно. В последней игре (когда зрители напикали им ерунды) боты пытались сплитпушить, и даже местами удачно, но это всё, на что их хватило.
После игры были вопросы разработчикам, и на вопрос о коммуникации ботов был получен примерно следующий ответ (если я правильно перевёл): им не нужно коммуницировать, потому что они все одинаковые. Имхо странная точка зрения.
Мне, честно говоря, не совсем понятно зачем вообще этим занялись люди. Точнее говоря, зачем именно так занялись. Видел слайды архитектуры ботов — там сплошные нейронные сети. В связи с этим, я не вижу смысла в этой разработке. Предположим через 2 года боты будут выигрывать любую команду людей. И что? Какой от этого толк? Люди перейдут в другую игру с похожей механикой, и переход займёт пару дней, а для перенастройки ботов придётся проделать заново половину работы. И это хорошо, если у вас будет огромная выборка игр, как в случае с дотой. А что если такой выборки не будет? Я бы понял, если бы за ботами стояла какая-то новая архитектура, но от приклеивания очередной порции НС я не вижу никакого толка.
Не похоже, судя по инста-хексам лиона.
Уже разобрали:
I downloaded the clip which runs at 60fps showing the hex. I counted the frames from when he blinks in until he gets hexed and it was 13 frames. At 60fps each frame is around 16.66ms of time.
So with 13 * 16.66 it shows that the reaction was around 216.58ms well within the response time the OpenAI team said that the bots have.
Плюс комментарий от шейкера:
THIS. I did not shift queue, I thought I clipped lion in the fissure and didn't instant echo either. I havent rewatched the clip but I'm sure you see me hesitate and it gave the bot more than enough time. Hard to change muscle memory to change vs bots because vs humans it's still unlikely they get the hex off before and blink shift queuing echo can be risk in other situations. I saw an ideal 2 hero block but just made an error.
www.reddit.com/r/DotA2/comments/94vdpm/openai_hex_was_within_the_200ms_response_time/e3ofipk
Добавлю. По-моему стоило все таки выбрать для этой игры, если не про игроков, то хотя бы просто хороших. Все эти комментаторы совершают такие ошибки, которые никогда не совершит просто средний игрок в доту. В результате чего иногда появляется ощущение, что смотришь игру в поддавки. Это очень портит впечатление.
Добавлю. По-моему стоило все таки выбрать для этой игры, если не про игроков, то хотя бы просто хороших.

Да дело не в том, что игроки плохие, дело в том, что играли на расслабоне (как-то иначе запрыгивания по одному в четверых объяснить нельзя) и (что более важно) стак не сыгран.

А с чего вы взяли что они плохие игроки?

Fogged — He's ranked 180 in the Americas leader boards.

Blitz — I couldn't find Blitz in the leaderboards but according to his dotabuff he's 576

Merlini — Immortal, Ranked 674

Capitalist — Immortal, Ranked 961


Про то, кто такой MoonMeander думаю вы догадаетесь погуглить, прежде чем что-то писать.

Не знаю на счёт рангов, но иногда складывалось ощущение, что играют выходцы с 3к паба.

Вы же в курсе, что Merlini — один из самых именитых англоязычных игроков в истории доты и, вероятно, лучший игрок своего времени?
Да, сейчас он вряд ли играет на уровне условных Noone или Miracle, но я почему-то уверен, что он играет лучше лично вас, какой бы у вас рейтинг там ни был.

То, что он когда хорошо играл, не значит что он сейчас играет хорошо, и уж точно не значит, что он хорошо отыграл в каком-то конкретном моменте. Кроме того, есть ещё 4 игрока. Лучшие команды эпизодически играют как рандомный стак на 3к и сами же это признают.

То, что он когда хорошо играл, не значит что он сейчас играет хорошо

То, что он Rank 674, не значит, что он хороший игрок.
То, что он один из топовых игроков в прошлом, не значит, что он хороший игрок.
То, что его отобрали для этого матча, не значит, что он хороший игрок.

Попахивает диванной аналитикой, не находите?
Попахивает диванной аналитикой, не находите?
Ну можно немного поанализировать на самом деле.
То, что его отобрали для этого матча, не значит, что он хороший игрок.
Мы не знаем по каким критериям они отбирали игроков, потому то что его отобрали — не значит хороший он или плохой.
То, что он один из топовых игроков в прошлом, не значит, что он хороший игрок.
Судя по ликвипедии — достижений особых у него нет, потому судить насколько он топовый — тоже довольно сложно.
То, что он Rank 674, не значит, что он хороший игрок.
Не стоит забывать, что американский регион — слабейший в доте, и в сравнении с другими регионами его 674 ранг очень сильно обесценивается.

В целом можно и дальше продолжать, но не особо интересно. Этот Мерлини довольно сильно переоценен.
им не нужно коммуницировать, потому что они все одинаковые. Имхо странная точка зрения.

Это не странно, а полностью логично. Любой бот и так может узнать, что хочет и собирается сделать другой бот, просто "представив" себя на его месте. И если человек может предположить с ошибкой, то идентичный бот, имя ту же самую информацию, предположит точно то же самое, что и второй бот.

А почему у ботов должна быть одна и та же информация? Они же управляют разными персонажами.

UFO just landed and posted this here

Т. е. каждый бот считает поведение сразу всех остальных ботов? Потому что чтобы знать какое решение принимает другой бот, нужно посчитать то же, что посчитал он. Зачем тогда ботов 5?

Бот управляет одним персонажем. Другим он отдавать команды не сможет. То есть к игре нужно 5 подключений. Почему они сделали 5 копий для пяти подключений вместо одного бота с пятью подключениями? Полагаю, так тупо проще оказалось. Обучать именно одного бота, который управляет одним персонажем (хоть и решает за пятерых), а не такого, который держит сразу пять подключений.

Тогда это нифига не логично и не эффективно. Бот должен быть либо один на 5 персонажей, либо коммуницировать с другими ботами.

Так а зачем? Коммуникация — это точно сложная задача, я в ML не очень хорошо разбираюсь (на уровне хобби), но мне кажется нет никакого смысла к такой сложной задаче ещё и коммуникацию прикручивать.


Вычислительные ресурсы нужны крайне маленькие. Большие они на этапе обучения, а на этапе игры там вычисления просты.

Насчет «не эффективно» — соглашусь. Но ничего «не логичного» в такой ситуации я не вижу. Просто делали как проще и все.

Информация — это то, что бот видит и про что знает. Видимость в доте — общая. Т.е. все видят одно и то же (у человека кроме карты есть ещё основное окно, но для ботов это не актуально).

Посмотрел по диагонали.
— Не нравится сетап
— Люди совершают одни и те же ошибки снова и снова
— Много перегибов с агрессией

Мне бы интересней было на hots глянуть, ибо его евенты являются тактической вилкой.
Хотя если, например, тейсер или гендзи каждый раз будет получать прицельный стан то тут конечно будет тяжело
UFO just landed and posted this here
Всю игру OpenAI Five можно охарактеризовать таким популярным среди сообщества термином, как «душили».

Правильно, скорее: "ребятишки, да че ж вы себя не бережете-то?!". С-но team human играли настолько плохо, что матч получился совершенно не показательным, если бы вместо OpenAI были бы обычные боты из доты — результаты был бы ровно тем же. Что печально — если в случае с матчем с денди ИИ действительно смог что-то продемонстрировать, то в данном случае никакой демонстрации не вышло — нельзя продемонстрировать уровень, когда противник даже не пытается сделать вид, что играет на победу.

Возник ряд вопросов.
1. Команда человеков была сыграна? Или это была просто некая группа людей?
2. Один OpenAI управлял всеми 5 AI персонажами? Или за каждого свой AI?
3. Что покажет следующая игра, после того как человеки проанализируют «собственное понимание механики» ботами?
2. За каждого свой
3. Игроки против ИИ в этот раз не были профессионалами, вряд ли они смогли придумать хорошую стратегию.
3. Как я понял суть в том что AI действовал не так как обычно принято. Вот и вопрос — зная теперь такую стратегию поможет это игрокам человекам?
Или каждый кон AI будет придумывать неожиданное и непринятое?
Или таких стратегий все же ограниченное количество?
Или даже зная стратегию с которой AI будет действовать не получится его одолеть?
  1. Как я понял суть в том что AI действовал не так как обычно принято.

Да нет, ничего такого. Вполне обычная игра (если не считать каких-то объективно плохих решений, вроде отдаться под товером, но зато его добить).


Вот и вопрос — зная теперь такую стратегию поможет это игрокам человекам?

То, что показывал ИИ — стандартная безыдейная игра 5 тел вне какой-либо стратегии кроме "бежим вперед и убиваем/умираем", при этом уже даже по статистике видно, что боты имея преимущество в десяток фрагов не имели преимущества по золоту (а то и проваливались), это признак очень плохого понимания макроигры. Любая команда даже самых средних игроков такое снесет вообще без проблем, играя в стандартного фармящего кери. Команда затерпит, а потом на 20+ минуте выйдет какая-нибудь фармящая магина и в соляного разломает ботам лица без каких-либо шансов.

Пожалуйста, уточните кого из этого списка — Axe, Crystal Maiden, Death Prophet, Earthshaker, Gyrocopter, Lich, Lion, Necrophos, Queen of Pain, Razor, Riki, Shadow Fiend, Slark, Sniper, Sven, Tidehunter, Viper, или Witch Doctor — вы назвали магиной :-)
Пожалуйста, уточните кого из этого списка

Мы же предполагаем, что пул будет расширяться, нет? :)
Но если даже ограничиваться чисто предлагаемыми героями — то свен вполне потянет на фармящего хардкерри такого рода :)

К 9 минуте к людям уже на базу заходили ломать тавера, о каких 20 минутах речь.
К 9 минуте к людям уже на базу заходили ломать тавера, о каких 20 минутах речь.

Можно и раньше к людям заходить на базу и ломать товера, только на практике это, представьте себе, очень редко работает. Практически никогда, если люди перед этим не отдадутся перед эти в 2+1 у хг.
Если вы сами вместо дефа выходите и отдаетесь — ну при чем тут боты? Ну да, они молодцы, конечно, что пошли в этот момент пушить, а не устроили пикничок. Но на этом заслуга и заканчивается.

UFO just landed and posted this here
А как вы предлагаете терпеть, когда уже на 1 минуте боты заходят под Т1 и по очереди танкуют урон от вышки?

Зачем терпеть? Можно просто убивать. ТП на деф и -5 "танковальщиков".
Если пик неудачный — ну и фиг с ней этой т1, мы то про т3 говорим.


Поверьте, если бы было выгодно заходить и танковать т1 на 1 минуте так, то это бы игроки давно делали и давно бы это пофиксили :)

"Так как Dota 2 — дисциплина крайне разносторонняя и сложная для освоения"
Для кого сложная? Для детей с задержкой в развитии?
А может люди проиграли лишь потому, что оказались не такими умными, как себя считали, играя в этот "киберспорт".

"Так как Dota 2 — дисциплина крайне разносторонняя и сложная для освоения"
Для кого сложная? Для детей с задержкой в развитии?

Да для всех сложная, неподготовленному человеку потребуется несколько недель, чтобы начать понимать, что вообще происходит на карте (не говоря уже о том, чтобы начать играть).

UFO just landed and posted this here
Тогда бы в неё никто не играл.

Да вот играют.

UFO just landed and posted this here
Соответственно, на то, чтоб начать понимать, что вообще происходит, лимит секунд 30.

Минимум для понимания происходящего на конкретной карте — узнать и запомнить 10 героев, их скилы, анимации героев и скилов, несколько десятков используемых предметов и базовую механику игры, которую меньше чем на нескольких листах а4 не изложишь.
Так что, в вашей реальности никто в доту не играет.

UFO just landed and posted this here
Бред. Скилы надо знать, чтоб понимать, как с ними бороться.

Скилы надо знать, что понимать, что происходит на карте. Потому что иначе вы видите как летит какая-то цветастая переливающаяся хрень… и? Зачем она нужна? Хилит она? Дамажит? Откуда взялась?


О сложности же игры говорит совсем другое. Сколько памяти нужно для того, чтоб запомнить всё дерево игры и какая его часть нужна, чтоб гарантировать ничью даже против идеально играющего противника.

Вы путаете сложность игры и сложность победы над противником.

UFO just landed and posted this here
, а два идеальных игрока могут сыграть только вничью.

Исключительно при идеальном балансе.

Ни одна MOBA не является идеально сбалансированной, хотя и стремятся к этому и регулярно выпускают патчи, в которых усиливают или ослабляют чемпионов. А потом выпускают новых чемпионов, слегка меняют баланс и все по новой.
Человек не успевает перепроверить баланс всех комбинаций и все варианты. А вот бот, который может виртуально отыграть тысячи матчей за день без устали и перерыва, вполне может это сделать. Поэтому при игре 1 на 1, я уверен, из двух идеальных ботов победит тот, который делает первый пик.
UFO just landed and posted this here
В доте нет ни одного чемпиона без контр-пика?
UFO just landed and posted this here
Это вы сейчас называете контрастные пики. А есть же пики неконтрастные. Которые не особо кого-то контрят, но и их законтрить сложно.
В командном сражении это не прокатит, но в сражении 1 на 1 думаю всегда найдется лидер.
Ну или, если такого лидера нет вообще — да, всегда будет побеждать бот, у которого второй пик.
Мне почему-то кажется что все строго наоборот: в командном сражении еще можно попытаться сбалансировать команду, а вот в сражении 1 на 1 у выбранного первым героя всегда найдется какая-нибудь слабость.
UFO just landed and posted this here
Лишь в вашей голове.
Да судя по профилю этой личности, там в голове вообще что-то невообразимое происходит…

Чистый субъективизм. Это вообще не про доту. Ее надо изучать долго и упорно, сотня героев с минимум 4 скилами, сотня предметов, нейтралы, механики из wc3. А ещё комьюнити в России недружелюбное — новичок в игре моментально покрывается матом. А ещё игра совсем не приносит кайф, когда после часа "потной" (устоявшееся выражение) игры сливается победа за один замес. И вопреки всему этому игра все равно популярна (и не у бессмертных тоже).

UFO just landed and posted this here
Вот читаю и понимаю, что выводы смогли сделать только боты играющие против людей.
Выбрана самая оптимальная стратегия для победы. Всем звеном до победного.
UFO just landed and posted this here
Игроки из топ 0.05% для вас нубы? Им конечно далеко до сыгранной команды активных про, но все они на ладдере имеют ранк Immortal.

Ранг — это одно дело, а как люди отыграли конкретную игру — другое. Отыграли они далеко не на immortal, какой бы ранг у них ни был.

Сила и слабость познаётся в сравнении.
Вам кажется, что боты крайне слабы, поэтому и проигравшие им очень слабы. Хоть на самом деле ситуация радикально отличается.
Сила и слабость познаётся в сравнении.

Это с чего вы взяли? Есть вполне объективные вещи, которые сравнений не требуют.


Вам кажется, что боты крайне слабы, поэтому и проигравшие им очень слабы.

Нет, я вижу вполне конкретную и объективную дичь, которую делали игроки, и которую люди даже с 2-3к ммр себе при серьезной игре не позволяют. Вне зависимости от того, с какого уровня противником идет игра. Просто выбор, типа: "делать дичь запрыгивая 1в4 или не делать".
Хинт: если вы все-таки решили "делать", то получите 4 репорта, успехов.

Подойдите с такими же оценками для любой игры Инта и тоже найдёте много дичи.
Подойдите с такими же оценками для любой игры Инта и тоже найдёте много дичи.

На порядок меньше, поверьте.

А тут уже берёте рандомный матч инта, и одну из игры OpenAI (Кроме фаночки со зрителями и пика зрителей. Так как не ревалентны) И просто в блокнитик ставите галочки каждый раз увидив дичь.

Ну, да, в каких-нибудь групповых инта такие матчи тоже бывают, когда игрокам уже плевать на победу в силу ситуации по очкам, например.
Но мы в итоге возвращаемся к тому с чего начали — игроки, может, и хорошие, но отыграли откровенно говенно.

Если взять пять игроков вашего уровня то боты на 5ой минуте вам т3 поломают :).
UFO just landed and posted this here
Интересно было бы посмотреть вариант эксперимента где боты играли бы в конфигурации 4 бота + человек против скажем другой команды ботов, прогнав несколько матчей на одной и той же карте одними и теми же персонажами но с разными людьми. Будут ли боты пытаться применять командное взаимодействие с человеком, и как оно будет различаться в зависимости от стиля живого игрока.
Это типичные современные шахматы (человек+компьютер), и к этому полагаю все придет.
Давайте не будем забывать о том, что все функции, которые выполняют боты на карте, это лишь скрипт, который работает в разных вариациях. За этим всем, стоят люди. Людей надо боятся, а не ботов.
Было бы круто увидеть в официальной доте режим игры с такими ботами (с учетом всех ограничений).
Там были 5 взаимодействующих ботов? Или один бот управляющий пятью персонажами?

Пять ботов, не взаимодействующих напрямую. Есть только параметр, исходя из которого бот начинает "ценить" положение команды в игре, а не только своё личное. Цитата из блога:


OpenAI Five does not contain an explicit communication channel between the heroes' neural networks. Teamwork is controlled by a hyperparameter we dubbed "team spirit". Team spirit ranges from 0 to 1, putting a weight on how much each of OpenAI Five's heroes should care about its individual reward function versus the average of the team's reward functions. We anneal its value from 0 to 1 over training.
Думаю скорее всего это выглядело как 5 ботов которые управляли каждый пятью героями, но команды отдавали только своему. А командный дух это скорее как бот распределяет ценность действий для каждого героя в отдельности и команде в целом.
Расчет количества вариантов для игры 5х5 неправильный, так как для любых 10 выбранных персонажей есть еще C_10^5 способов составить разные команды, поэтому из n героев можно составить C_n^5 * C_10^5 матчапов. Для 18 персонажей ответ будет 11 027 016, а для всех 115 уже в районе 2e16, а не «жалкие» 74 триллиона.
Все меньше и меньше игр где человеку будет комфортно играть с компьютером.
image

xkcd.com/1002
Какого года картинка? В го компьютер человекам уже не проигрывает :)
Вспоминается игра R2D2 с Чубакой в голографическую настолку… Когда Хан Соло намекнул C3PO, что проигравшие роботы не имеют тенденции отрывать сопернику конечности… Так что, думаю, примерно одновременно с тем, как компьютеры научатся выигрывать у человеков всегда, они или научатся иметь поблизости лазерную турель, или иногда проигрывать человекам для обеспечения выживания.
Интересно будет посмотреть на игру ИИ в Starcraft2
Была по старкрафту. По старкрафт2- пока нет. Пока только анонсировали разработку API
А кто-нибудь может техническую часть пояснить?

Каким образом Боты управлялись? Ведь у доты нет открытого API.
Есть ли исходные коды этих ботов в открытом доступе?
Если хочется поднять у себя на компе этих ботов и с их кодом и алгоритмом обучения поиграться, то это можно как-то сделать?
UFO just landed and posted this here
Проблема в том, что при игре 1 на 1 игроки не поняли, как надо действовать против бота, а просто научились эксплуатировать его неполноценность, намеренно создавая ситуации, которых бот не понимает и отвечает на них неадекватно. Что как бы намекает, что при полноценном боте все эти лавочки будут закрыты. Другое дело, что непонятно, когда этот полноценный бот появится. Вероятно, не на этом TI.
Я не играл в доту и не знаю её механик, но разве это не основа любой игры с противником — поиск его слабых мест и создание ситуаций в которых они проявятся наиболее явно
Да. Но в данном случае это был не поиск слабых мест, а скорее поиск эксплоитов, создание нестандартных ситуаций, на которые бот отвечает не просто слабо, а именно неадекватно. Примерно как если бы при игре в шахматы с ботом можно было бы просыпать на доску опилки, после чего он отдавал бы ферзя. Никакого интереса, челленджа и достижения в такой победе не найти.

Про «честные» победы по правилам, знакомым боту, тут тоже упомянули, но на это способны единицы.
Игроки не понимали escape threshold (момента, когда надо убегать чтобы не добили) и использовали подобный для людей

Мне казалось, что как раз контроль количества хп и знание, какие атаки сколько отнииают как раз и отлисают хороших игроков от не очень хороших.

UFO just landed and posted this here

А кто в курсе, играло действительно пять ботов (инстансов), или один бот, управлявший пятью персами? Синергия для одного инстансов естественна и не удивительна, другое дело если пять инстансов действительно скооперировались. Мне думается, таки был один инстанс...

Один и тот же код запущенный на 5 разных машинах будет давать один и тот же результат. Так что разницы на деле никакой.