Как стать автором
Обновить

Комментарии 25

Спасибо за потрясающий цикл статей.
Карякин хорошо сказал, конечно:
«В поединке против компьютера тебя не покидает чувство обреченности...»
Подводя итоги, можно сказать что время громких матчей людей и машин окончательно ушло в прошлое. Компьютер сегодня не соперник, а помощник людей.

Могу ошибаться, но слышал мнение, что до сих пор нету хорошей программы, играющей в Го, неужели в эту игру не проводят чемпионаты между машиной и человеком?
Нет, Вы не ошибаетесь.

Дерево вариантов в Го на много порядков больше чем в шахматах, кроме того позиционные нюансы в японской игре гораздо более сложные.

То есть в компьютерных го пока весьма далеко от решения 2-х основных проблем, которые сейчас преодолены в компьютерных шахматах: эффективный перебор и оценка позиции.
Тут такое мнение, выражаемое одним предложением. То, что в Го машина проигрывает, это результат того, что человек в Го играет очень хорошо, а компьютер очень плохо. В шахматах всё ровно наоборот. И дело не в алгоритме-дело в количестве возможных комбинаций и предсказуемости поведения фигур противника. В шахматах и фигуры предсказумее ходят, и количество ходом намного-много порядков меньше. А раз так-то это в разумных пределах вычислительной мощности компьютера, которое и есть его главное преимущество над человеком.
Бувально через месяцев после этого сообщения вышла AlphaGo и полностью поменяла ландшафт) Go оказалась еще более простой игрой — первая же попытка серьезной компании сделала игру машин с человеком полностью бессмысленной.

Ну нет — более простой она от этого не стала. В шахматы человеку сейчас тягаться бессмысленно даже с мобильным телефоном, а для Го потребуется как минимум десктопный комп, а в идеале — специализированное оборудование.

а для Го потребуется как минимум десктопный комп


Почему вы так думаете? Есть какие-то достоверные оценки игры AlphaZero если ограничить ее скорость скоростью доступной на телефоне?

Согласно википедии самые продвинутые версии AlphaGo и AlphaGo Zero работают на такой конфигурации:


4 TPU v2, одна машина

Соответственно на мобилке это просто работать не будет, либо очень очень медленно.

Да и десктопов с TPU я вроде пока что не встречал в продаже.
либо очень очень медленно.


Конечно очень медленно по сравнению с TPU. Но почему вы думаете что этого «очень медленно» не хватит для человека?
Просто могу сказать что для AlphaGo Zero шахматной есть опенсорсный клон, который работает и очень сильно играет на обычном CPU. Намного сильнее чем любой человек когда-либо играл. Я не знаю, есть ли подобная версия для го, но ожидаю что если бы ее кто-то сделал, она точно также выносила бы любого человека и в го. Процессоры для мобильника — они все еще обрабатывают сотни миллионов операций в секунду, и с обученной сетью можно обсчитывать лучший ход и на мобильнике.
Конечно очень медленно по сравнению с TPU. Но почему вы думаете что этого «очень медленно» не хватит для человека?

Можно вообще использовать обычный перебор варинтов, но это будет настолько медленно, что бессмысленно, потому что вселенная успеет сколлапсироваться, прежде чем закончатся расчеты одного хода.


Просто могу сказать что для AlphaGo Zero шахматной есть опенсорсный клон, который работает и очень сильно играет на обычном CPU.

Шахматы — игра полегче Го, там намного меньшее ветвление. В шахматы компьютеры выигрывали у людей и до появления Alpha Zero без использования нейронных сетей. Что за клон?


Я не знаю, есть ли подобная версия для го, но ожидаю что если бы ее кто-то сделал, она точно также выносила бы любого человека и в го.

Нет такой версии, что-то до сих пор не сделали. Да и даже о версии под обычный CPU я не слышал.


Процессоры для мобильника — они все еще обрабатывают сотни миллионов операций в секунду, и с обученной сетью можно обсчитывать лучший ход и на мобильнике.

Это все теория, вот когда появится такая версия на мобилке, тогда и можно будет вернуться к обсуждению.

Что за клон?


Полностью нейросеть и параметры от AlphaZero скопировала LCZero.
ru.wikipedia.org/wiki/Leela_Chess_Zero
Есть и другие программы — Leelenstein и прочие, которые тоже используют подход на нейросетях, но либо имеют другую сеть, либо другую стратегию обучения.

При этом LCZero не требует видеокарты или тем более TPU для работы. Она совершенно спокойно работает на любом CPU — пусть и значительно медленней чем она бы работала на GPU той же стомости.

Шахматы — игра полегче Го, там намного меньшее ветвление.


Это было важно пока главной силой программ была способность перебора вариантов, а главной проблемой — оценка позиции. Но после появления нейросетевых программ ситуация изменилась: у них теперь есть оценка позиции которая превосходит человеческий уровень ( а скорость перебора наоборот снизилась примерно в тысячу раз).

Чтобы не быть голословным: в шахматах я видел блитцматч гроссмейстера против LCZero, которая играла с ограничением перебора в 1 позицию. Иными словами — вообще безо всякого перебора. И этого оказалось достаточно чтобы обыграть гроссмейстера. Пусть и в блице, но даже в блице гросс делает перебор на несколько ходов вперед, т.е. гросс рассматривал вариаты глубже, рассматривал больше позиций чем LCZero и все равно проиграл. Мгновенная оценка позиции нейросети оказалась гораздо лучше человеческой — что-то что раньше казалось невозможным.

Теперь если рассмотреть Го — вроде как считается что там интуитивная оценка позиции более важна чем в шахматах, а способность к перебору — менее важна. Именно тем, что программы не могли научить оценивать позицию и объясняют проблемы ранних Гошных программ по сравнению с шахматными.
В какую силу будет играть AlphaGo Zero если ограничить ее перебор, скажем, 1 позицией или сотней? ( Вполне очевидно, что рассмотреть сотню позиций за разумное время сейчас сможет и мобильник). Возможно что также как и в шахматах: сильней аналога гроссмейстера, а возможно и сильней любого человека. Мы не знаем ответ на этот вопрос т.к. я не слышал чтобы AlphaGo Zero клонировали для игры в Го и выложили в открытый доступ.
Поэтому ваша оценка

а для Го потребуется как минимум десктопный комп,


мне кажется безосновательной.
LCZero

Здесь можно смотреть непрерывный компьютерный чемпионат. На данный момент (6.08.20) Lc0 рвет Stockfish +37-4.
блитцматч гроссмейстера против LCZero

1. Блиц есть блиц.
2. Гроссмейстеры бывают разные.
В данном случае я имел в виду только шахматы. Го — это отдельная тема. Сейчас лучшие программы в Го играют примерно на 5-й дан на популярном сервере KGS. В переводе на российскую классификацию это примерно уровень мастера (плюс-минус). Так что пока программы для Го лучшим игрокам мира не конкуренты.

В настоящий момент актуальнее соперничество в сёги — японском варианте шахмат. Этот вид шахмат вариативнее обычных, и потому сложнее для программ. Сейчас как раз в Японии проводится серия встреч люди-машины. Информации мало, но можно отслеживать здесь
Будем ждать когда же компьютер будет научится щелкать и Го.
В Го совсем недавно был прорыв и АИ уже может играть на одном уровне с человеком. Информация из этого курса: CS188.1x Artificial Intelligence на edx
Скорее всего речь идет о методе монте карло. Но насколько я знаю, и там не было речи о том, чтобы программа выиграла 9 дана без форы.
Десять лет назад, когда я более менее серьёзно занимался го, лучшие программы играли примерно как я (у меня был 10 кю). Потом они начали довольно резво развиваться (возможно это было связанно с тем, что задача обыграть человека в шахматы была в общем решена и внимание программистов переключилось на го, где всё было плохо). Учитывая что разница между профессиональным 1 даном и 9 даном довольно небольшая (в теории 4 камня форы, а на практике часто и меньше), и программы уже вплотную подобрались к 1-му профессиональному, думаю ждать осталось не долго.

В итоге так и вышло :)

Да, я конечно не ожидал что от этого моего комментария до победы компьютера над профессиональным 9-м даном пройдёт всего год. Я тогда не знал что DeepMind этим уже занимается и думал что ещё лет 5-10 понадобится. Но с другой стороны матч против Ли Седола в 2016-м ещё был на куче железа (48 TPU на нескольких серверах) и до сверхчеловеческого уровня на домашнем ПК потребовалось ещё несколько лет.
Шахматы все-таки величайшая игра! На небольшом поле, с несложными правилами, и такая глубина!
А можно в последнюю статью вставить ссылки на все предыдущие статьи? Хотел этот цикл скинуть другу почитать.

А вообще спасибо за материал. Было очень интересно.
+1
UPD: Автор добавил ссылки в конце статьи.
Меня, как давнего любителя шахмат, соревнования людей с компьютерными движками перестали интересовать уже давно. У человека шансов выиграть у компьютера нет. Но удивительно, что соревнования людей с людьми и движков с движками превратились в два разных, но по своему интересных вида спорта.

Если раньше соревнования людей в шахматы носили характер поиска абсолютной истины, то с появлением движков этот мотив ушел. Многие считавшиеся ранее эталоном партий после анализа с компьютером были серьезно пересмотрены. Поэтому игра людей с людьми стала носить более спортивный характер с элементами случайности, в некотором смысле шахматы стали в чем-то более близки к киберспорту (что-то типа StarCraft). Посмотрите, например, партии в шахматы Б. Джобавы (хотя бы вот эту www.chessgames.com/perl/chessgame?gid=1708295). Этот отход от строгих канонов с целью удивить противника, вывести его на необычные позиции.

А вот движки, в свою очередь, могут находить удивительно красивые вещи. Например, неизбежный мат в 517 ходов [ timkr.home.xs4all.nl/chess2/diary_16.htm, позиция 316 ], пока самый длинный из известных матов. Человеку найти такое не под силу. И очень интересно смотреть соревнования движков, например вот эти [ tcec.chessdom.com/live.php ]. Тут нет случайностей, а есть поединок стратегий. Это отдельное удовольствие.

Так что я думаю, шахматы будут еще очень долго жить, но движки и люди это будут отдельные ветви шахмат.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории