Как стать автором
Обновить

Комментарии 32

победила чемпионов мира среди людей в командной компьютерной игре DOTA2

У вас очепятка в "чемпионов мира". Буквально первые два предложения из статьи по ссылке:


полупрофессиональной командой игроков в Dota 2. Среди людей были бывшие профессионалы, комментаторы и один действующий профи

Исправьте пожалуйста, а то доверие ко всей статье и автору как-то теряется.

OG, являются чемпионами мира и в 2018 и в 2019, и они проиграли OpenAI в апреле 2019 со счетом 2:0.

Я пропустил эту новость, и хотел бы почитать подробности. Вы не могли бы подсказать хорошую статью по теме?


P.S. И если есть, видео с комментариями на русском. На английском какое-то уже нашел.

www.youtube.com/results?search_query=openai+vs+og
Напишу свое summary, так как есть статья на хабре (https://habr.com/ru/post/419399/). После победы лагерь комментариев, разделился на 2 части: да, это победа — нет, опять не все 150 героев и вообще это не Dota. С моей точки зрения, это вполне обычная Dota, возможно в 6-8 раз упрощенная. Тупо у OpenAI не хватило денег-времени на обучение всех героев, по их оценкам это стоило бы в 10^2 раз дороже, что и так очень дорого.

Самое интересно было позже, когда они открыли арену, где любой мог сыграть с ботами. Dota такая игра, где любую стратегию можно законтрить, что в принципе и случилось и одна полупрофессиональная команда одержала аж 9 побед подряд над ботами! После чего OpenAI быстро свернули арену и объявили, что боты побеждают 99%.

Я думаю, мораль такова, да фактор неожиданности победил людей, но коллективный мозг людей остался непобежден, потому что люди совместными усилиями разложили ботов буквально за 2 дня. OpenAI еще предстоит доказать, что они могут обучаться достаточно быстро, быстрее, чем люди будут распознавать их стратегии и обучение должно стать гораздо дешевле, ведь люди учатся играть в Dota с 150 героями за пару лет, а не за 1 миллион компьютерных часов.
Я бы ещё отметил, что игры не были похожи на то, что обычно делают OG на турнирах.

Может просто играли не напрягаясь, может бот их в тупик поставил, непонятно.
Думаю им не дали сыграть в OG-доту, потому что она как раз очень похожа на сверхактивную доту ботов, не зря же на TI9 все шутили, что OG натренировался с ботами и теперь их дота еще сильнее.
Посмотрите игры, что проиграл OpenAI — это страдания людей до 40 минуты и выход в late game, игра от обороны 40 минут не сильная сторона OG.
Ограниченный пик сильно влияет. Когда на героев тупо нет контрпика — это не та игра, это не дота =)
Да ладно был там контрпик, просто не было сигнатурных героев OG :)

За собственный комментарий — отдельное спасибо!


Как-то так получилось, что ваша ссылка на статью — про ту же самую полупрофессиональную команду, не про OG.

Согласен, что-то не то с Google поиском ) habr.com/ru/news/t/448138
Уважаемый ads83 прав, с чемпионами OG OpenAI Five играла в другой раз. Спасибо за вашу внимательность, исправлено.
Такие трюки показывают, что ИИ способен находить решения, которые люди упускают, говорит Бейкер.

Вроде как в Counter Strike люди играют так же используя баги карт и выпрыгивая за пределы карт.
Также есть отдельное направление в speedrun которое позволяет использовать баги игр.
Не вижу ничего нового что изобрели боты.
В соревновательном CS любые способы просмотра сквозь текстуры считаются нарушением правил, и подобное фиксится ASAP. Аналогично с выходом за пределы карт, хотя надо понимать, что периметр глухой. Вот залезть на какую-нибудь коробку хитрым способом нарушением не будет.
просмотр да, а вот тонкий расчет и прострел, никогда не считались читерством, так же как с коробками, хотя фактически это можно считать тоже багом/фичей (нет особой разницы, потому что как говорится — баг это хорошо задокументированная фича) игры, потому что в реальной жизни такой фокус в большинстве случаев не прокатит.
НЛО прилетело и опубликовало эту надпись здесь
Ну там ведь не только прострел коробок, я давно уже не играю, но в старых версиях (по которым и могу судить) там можно было через огромные бетонные стены только так прошибать)
НЛО прилетело и опубликовало эту надпись здесь
А еще легкий гугл говорит о том, что пробивание любого очень прочного предмета, в большинстве случаев сильно уменьшит поражающую способность пули, и цель стоящая за бетонной стеной, скорее либо не получит вообще никаких повреждений либо они будут незначительны. В любом случае, тема мне кажется недостойной дальнейшей дискуссии, т.к. проверить и что то доказать, лично у меня возможности нет)
Тем не менее, это не отрицает мою версию, пока кто то не докажет обратного)
В интересное время мы живем господа.
Делается вид, что ИИ чё-то там нашел. Хотя правильнее было бы «наткнулся». После миллиона попыток тупого перебора и человек бы наткнулся на эти баги.
Вернее «баги» в данном случае они с точки зрения реализаторов, с точки зрения «ИИ» — это вполне себе часть мира. Потому что разницы между багом и запланированной фичей для такого «ИИ» — нет.
Вот может и у нас весь квант.мех. это баги при работе со сверхмалыми числами.
После миллиона попыток тупого перебора и человек бы наткнулся на эти баги.

Перед тем, как человек смог наткнуться, у него были миллиарды попыток для совершенствования своего механизма «интеллектуального перебора».
Статья конечно не содержит полезную техническую информацию, чтобы понять что именно сделал АИ, и насколько дешевле было бы это сделать программистам, но суть текущего исследования АИ в том и заключается — как запрограммировать базу, чтобы АИ доделал остальное сам.
«Делается вид, что ИИ чё-то там нашел. Хотя правильнее было бы «наткнулся».»

— Эволюция слепа, и даже не обладает разумом, но термин «эволюционный поиск» всё же существует и описывает вполне себе объективную реальность.

В принципе не столь уж и важна терминология — задумка достойна внимания и возможно скоро войдёт в нашу жизнь. Обучение нейросетей и МИ в виртуальной среде может многократно ускорить эволюцию этих технологий.
Так там и было сказано «миллионы раз». Если бы ИИ мог бы сразу находить выгодные решения, то это была бы уже другая тема.

Прочёл статью, из всего что написано понял только то что людям нужно научиться пропихивают предметы сквозь стены. Почему так много желтухи и так мало подробностей о том как учились боты, как всё это моделировалось?

Поверьте, желтухи тут нисколько. Просто все, вот просто все новости написанные про вещи, которые выходят за рамки бытовухи — они вот так и устроены.

Мем про изнасилованного журналиста — он не на пустом месте возник. Журналисты просто иначе не умеют.
Логично, ведь машинное обучение, как и эволюция — это сильно оптимизированный брутфорс.
«оптимизированный брутфорс» — точно сказано, но всё равно посмотрите видео. Ловко и разумно действуют эти боты. Если такое сложное поведение смогли сформировать перебором, то это потрясающе.


Не сказал бы на счёт эволюции. Машинное обучение — это сложный без энтропийный алгоритм по решению задач комбинаторики с определённой целью. «Дарвинская» эволюция (если мы конечно про неё говорим) — это энтропийный процесс с самозародившейся алгоритмизацией и самопоставленной целью. Вообщем сказка какая-та.
Прикольно. А ведь можно так и программы тестировать… Боту ведь все равно, учится через стены прыгать, или вываливать форму по эксепшену
А смысл? В любой программе размером больше сотни строк (ну хорошо — тысячи, может быть) обычные фаззеры, без всякого искусственного интеллекта, находят столько ошибок, что никто не знает что с этим делать.

Ну пофигу всем, никому не интересны программы без ошибок, на самом деле. Интересны дешёвые программы… ну а если они будут без ошибок, то это хорошо, конечно, но главного требования никто не отменял…
А если программу научить метапрограммированию? Чтобы она переписывала свой код по ходу игры/эволюции. Чтобы была самая настоящая эволюция, по принципу — чем хуже приспособлен, тем быстрее тебя выпилят соседние боты.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Изменить настройки темы

Истории