Haber777 7 дек 2018 в 10:38

AlphaZero снова обыграл Stockfish в матче из 1000 партий

3 мин

29K

Искусственный интеллектЛогические игрыБудущее здесь

Из песочницы

+34

Комментарии 21

mikhaelkh 7 дек 2018 в 12:48

Опять основные результаты со Stockfish 8 двухлетней давности и без дебютной книги. И добавление дебютной книги привело к большему количеству поражений Stockfish белыми? Странно.

aksas 7 дек 2018 в 16:17

с дебютной книгой стокфиш смог выиграть больше партий белыми чем без. Вот тут есть картинки www.chess.com/news/view/updated-alphazero-crushes-stockfish-in-new-1-000-game-match

olegshutov 7 дек 2018 в 15:24

Я вообще не люблю шахматы, но на самом деле разборы партий с комментами смотреть интересно

Gray5 7 дек 2018 в 16:17

Для самих игр, Stockfish использовал 44 процессора, а AlphaZero использовал одну машину с четырьмя TPU и 44 ядрами процессора.

Этим всё сказано.
Лучше бы сравнили с Lc0, который разрабатывался на основе идеи AlphaZero.

Haber777 7 дек 2018 в 16:25

Наверное именно с Stockfish сравнивают из-за статуса «чемпиона среди шахматных движков». Кстати, прямо сейчас проходит турнир шахматних движков на chess.com в котором участвуют Stockfish и Lc0.

Mad__Max 1 янв 2019 в 22:28

При ограничении вычислительных мощностей до примерно одинакового уровня все-равно выиграл бы AlphaZero, т.к. у него тут был почти 30 кратный запас по времени обдумывания хода.
Т.е. смог бы выигрывать имея даже в 30 раз меньшие вычислительные мощности, просто «думая» над ходом по столько же времени как противник.

Хотя в машинных поединках я бы ограничивал не время на ход и сравнивал вычислительные мощности (которые часто и сравнить то сложно из-за принципиально разной архитектуру). А ограничивал бы электрическую энергию затрачиваемую на ход/партию.

Скажем 1000 Дж энергии на ход. Или 100 кДж на парию + 200 Дж на ход.
А дальше уж в рамках лимита пусть программисты и инженены используют что угодно для достижения результата.

dmagin 7 дек 2018 в 21:53

Я посмотрел пару партий и снова, как и год назад, ощутил присутствие сверхразума. Его решения абсолютно непонятны, подражать ему невозможно. Не уверен, что можно извлечь пользу для шахматистов из этого разума, поскольку непонятно, как и чему можно научиться на таких партиях. Отдал 3 пешки за инициативу и выиграл через 30 ходов. Мда… Можно только восхищаться.

+11

robotrobot 8 дек 2018 в 03:29

Ваш комментарий гораздо интереснее чем вся статья :)

dmagin 8 дек 2018 в 18:38

Спасибо)

Akon32 8 дек 2018 в 14:57

Игроки в го вроде бы учатся у AlphaGo (говорят что учатся). И при анализе партий клоны AlphaGo Zero почти всегда используются.

dmagin 8 дек 2018 в 18:49

Шахматные программы и щас активно используются при подготовке и анализе. Удобно дебютные идеи проверять, ошибки смотреть и прочее. Но сама игра людей остается при этом вполне человеческой.
Вот только что закончился матч на первенство мира среди людей Карлсен — Каруана. Матч не особо получился интересным, но все партии вполне себе людские, понятны планы, ошибки и пр. Но матчи программ между собой (особенно альфы с рыбкой) — это вообще другие шахматы. С малодоступными идеями и приемами.

splxgf 8 дек 2018 в 21:55

Вы просто не так в шахматы играете, к примеру у меня всего второй разряд и пожертвовав на старте две-три пешки вполне неплохо себя чувствую против равных противников (правда это чаще блиц). Фигуры более мобильны и не скованы пешками. Хотя к этому пришел случайно, посмотрев обзор гамбитных дебютов.

Haber777 8 дек 2018 в 21:59

Среди современных топовых игроков тенденцию к использованию жертв фигур ради инициативы и мобильности можно увидеть например в партиях Магнуса Карслена, но все же в AlphaZero это какой-то совсем иной уровень.

dmagin 10 дек 2018 в 10:09

Да, известно, что чем короче контроль, тем сложнее защищаться. Поэтому в блице людей гамбитный стиль довольно популярен.
Вообще с приходом компов длинный контроль потерял свою привлекательность. При достижении определенного предела качество игры людей не увеличивается с ростом времени на раздумья. И чем сильнее шахматист, тем ниже этот предел.
Поэтому сейчас быстрые шахматы выходят на первый план. Некоторые известные гроссы вообще отказались играть при классическом контроле.

Akon32 8 дек 2018 в 14:54

Я слышал такую же новость (победа Alpha Zero в го и шахматы, обучение без использования базы человеческих партий) примерно год назад, в ноябре-декабре 2017.
В чём разница по сравнению с прошлым годом?
Откуда хайп сейчас?

Haber777 8 дек 2018 в 21:52

В прошлом году использовался контроль времени в одну минуту за ход и это считалось большим преимуществом для AlphaZero, в этом году было отведено три часа на партию каждому движку плюс прирост времени в 15 секунд за ход. Кроме этого проводились партии с неравным контролем времени и AlphaZero начинал существенно проигрывать только при соотношении 30-к-1 на пользу Stockfish.
Вообще релиз партий AlphaZero всегда событие в шахматном мире не столько из-за условий матча и собственно победы, сколько из-за самых партий. Посколько AlphaZero не использует стандартной схемы анализа позиции (слон и конь — три пешки, ладья — пять и тд) которой пользуются классические движки, да и люди тоже, то партии получаются совсем необычные и очень интересные, а это уже событие на фоне некой общей стагнации в шахматах.

perfect_genius 8 дек 2018 в 22:41

А потом оно обучится понимать женщин, но не сможет поделиться этими знаниями с нами.

MyshinyjKorol 9 дек 2018 в 13:02

Было бы очень любопытно увидеть популярное описание значимости компьютерного железа для подобных результатов. Насколько сильно зависит сила игры этих и других программ от ресурсов использующейся машины. Вот то, что для этого матча по 44 процессора использовалось, — это некоторого рода уравнивание вычислительных мощностей или нет? Вроде довольно «небольшой комп»… Чтобы могло измениться в результатах, если бы классический движок играл бы на каком-нибудь суперкомпьютере из топ-500?

Nehc 10 дек 2018 в 13:33

А я бы с удовольствием почитал, желательно на русском, об общих принципах того, как именно там используется нейронная сеть… Т.е. она обучается, я бы даже сказал — самообучается, это понятно. Но вот чему именно? Особенно это интересно как раз в контексте жертвования фигур ради инициативы и тп.

Nehc 10 дек 2018 в 13:35

Черт… Не умею пользоваться поиском… ((
habr.com/post/279071
habr.com/post/343590

dmagin 16 дек 2018 в 21:32

Если кому интересна шахматная сторона, то вот
неплохой обзор

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

AlphaZero снова обыграл Stockfish в матче из 1000 партий

Комментарии 21

Публикации

Истории