Как стать автором
Обновить

Комментарии 21

Опять основные результаты со Stockfish 8 двухлетней давности и без дебютной книги. И добавление дебютной книги привело к большему количеству поражений Stockfish белыми? Странно.
Я вообще не люблю шахматы, но на самом деле разборы партий с комментами смотреть интересно
Для самих игр, Stockfish использовал 44 процессора, а AlphaZero использовал одну машину с четырьмя TPU и 44 ядрами процессора.

Этим всё сказано.
Лучше бы сравнили с Lc0, который разрабатывался на основе идеи AlphaZero.
Наверное именно с Stockfish сравнивают из-за статуса «чемпиона среди шахматных движков». Кстати, прямо сейчас проходит турнир шахматних движков на chess.com в котором участвуют Stockfish и Lc0.
При ограничении вычислительных мощностей до примерно одинакового уровня все-равно выиграл бы AlphaZero, т.к. у него тут был почти 30 кратный запас по времени обдумывания хода.
Т.е. смог бы выигрывать имея даже в 30 раз меньшие вычислительные мощности, просто «думая» над ходом по столько же времени как противник.

Хотя в машинных поединках я бы ограничивал не время на ход и сравнивал вычислительные мощности (которые часто и сравнить то сложно из-за принципиально разной архитектуру). А ограничивал бы электрическую энергию затрачиваемую на ход/партию.

Скажем 1000 Дж энергии на ход. Или 100 кДж на парию + 200 Дж на ход.
А дальше уж в рамках лимита пусть программисты и инженены используют что угодно для достижения результата.
Я посмотрел пару партий и снова, как и год назад, ощутил присутствие сверхразума. Его решения абсолютно непонятны, подражать ему невозможно. Не уверен, что можно извлечь пользу для шахматистов из этого разума, поскольку непонятно, как и чему можно научиться на таких партиях. Отдал 3 пешки за инициативу и выиграл через 30 ходов. Мда… Можно только восхищаться.
Ваш комментарий гораздо интереснее чем вся статья :)
Спасибо)

Игроки в го вроде бы учатся у AlphaGo (говорят что учатся). И при анализе партий клоны AlphaGo Zero почти всегда используются.

Шахматные программы и щас активно используются при подготовке и анализе. Удобно дебютные идеи проверять, ошибки смотреть и прочее. Но сама игра людей остается при этом вполне человеческой.
Вот только что закончился матч на первенство мира среди людей Карлсен — Каруана. Матч не особо получился интересным, но все партии вполне себе людские, понятны планы, ошибки и пр. Но матчи программ между собой (особенно альфы с рыбкой) — это вообще другие шахматы. С малодоступными идеями и приемами.
Вы просто не так в шахматы играете, к примеру у меня всего второй разряд и пожертвовав на старте две-три пешки вполне неплохо себя чувствую против равных противников (правда это чаще блиц). Фигуры более мобильны и не скованы пешками. Хотя к этому пришел случайно, посмотрев обзор гамбитных дебютов.
Среди современных топовых игроков тенденцию к использованию жертв фигур ради инициативы и мобильности можно увидеть например в партиях Магнуса Карслена, но все же в AlphaZero это какой-то совсем иной уровень.
Да, известно, что чем короче контроль, тем сложнее защищаться. Поэтому в блице людей гамбитный стиль довольно популярен.
Вообще с приходом компов длинный контроль потерял свою привлекательность. При достижении определенного предела качество игры людей не увеличивается с ростом времени на раздумья. И чем сильнее шахматист, тем ниже этот предел.
Поэтому сейчас быстрые шахматы выходят на первый план. Некоторые известные гроссы вообще отказались играть при классическом контроле.

Я слышал такую же новость (победа Alpha Zero в го и шахматы, обучение без использования базы человеческих партий) примерно год назад, в ноябре-декабре 2017.
В чём разница по сравнению с прошлым годом?
Откуда хайп сейчас?

В прошлом году использовался контроль времени в одну минуту за ход и это считалось большим преимуществом для AlphaZero, в этом году было отведено три часа на партию каждому движку плюс прирост времени в 15 секунд за ход. Кроме этого проводились партии с неравным контролем времени и AlphaZero начинал существенно проигрывать только при соотношении 30-к-1 на пользу Stockfish.
Вообще релиз партий AlphaZero всегда событие в шахматном мире не столько из-за условий матча и собственно победы, сколько из-за самых партий. Посколько AlphaZero не использует стандартной схемы анализа позиции (слон и конь — три пешки, ладья — пять и тд) которой пользуются классические движки, да и люди тоже, то партии получаются совсем необычные и очень интересные, а это уже событие на фоне некой общей стагнации в шахматах.
А потом оно обучится понимать женщин, но не сможет поделиться этими знаниями с нами.
Было бы очень любопытно увидеть популярное описание значимости компьютерного железа для подобных результатов. Насколько сильно зависит сила игры этих и других программ от ресурсов использующейся машины. Вот то, что для этого матча по 44 процессора использовалось, — это некоторого рода уравнивание вычислительных мощностей или нет? Вроде довольно «небольшой комп»… Чтобы могло измениться в результатах, если бы классический движок играл бы на каком-нибудь суперкомпьютере из топ-500?
А я бы с удовольствием почитал, желательно на русском, об общих принципах того, как именно там используется нейронная сеть… Т.е. она обучается, я бы даже сказал — самообучается, это понятно. Но вот чему именно? Особенно это интересно как раз в контексте жертвования фигур ради инициативы и тп.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации