Comments 40
- «Два Go» — игра, где один из чемпионов го из Китая будет играть против другого… Все традиционно, кроме того, что у обоих будет собственный напарник AlphaGo. Ожидается, что в таком формате компьютер и человек смогут учиться друг у друга;
- «Команда Go» — соревнование в котором пять профи будет играть против AlphaGo. Профессионалы попытаются выиграть у системы, изучив особенности ее игры;
- «Кэ Цзе против AlphaGo» — пожалуй, центральный элемент всего праздника го. В нем сразятся два чемпиона — компьютер и человек.
- Разминка (розыгрыш).
- Приигрываемся к соперникам.
- Рвём в клочья.
Как-то так это мне со стороны выглядит.
Приигрываемся к соперникам.
Насколько я знаю, AlphaGo не сможет сильно изменить стиль игры на основании нескольких сыгранных партий, даже если по этим партиям прогонят цикл обучения. Веса связей в нейросетях AlphaGo сформированы на основе миллионов партий, несколько дополнительных партий — капля в море.
Но в клочья порвёт. При условии, что в DeepMind не пожалели электричества на несколько месяцев дополнительного обучения.
Ну строго говоря не совсем. Обучали скорее всего SGD, что означает, что мы можем сильно изменить веса просто прогнав новые примеры с большим learning rate. Другое дело, что после такой операции сеть, скорее всего, будет плохо играть.
Имхо, это желтизна.
Есть миллионы игр, где требуется именно интеллект, а не просто отсутствие возможности перебрать все комбинации.
Например тот же покер, где есть случайность, игра на чувствах и блеф.
Например подавляющее большинство стратегий и 3д шутеров, если ИИ предоставить именно те исходные данные, которые видит человек (звук из колонок и изображение с монитора).
А суть то — в распознавании ситуации и принятии решения.
Это извечный спор, побьёт ли Брюс Ли чемпиона мира по сумо.
Давайте скормим вашему боту фотографию монитора, и посмотрим, когда он начнет принимать решение после того, как распознает, что там нарисовано?
Ну не путайте же вы процесс принятия решения и процесс его реализации.
Для десятислойной полносвязной сети с размером слоя 320х240, на распознавание и принятие решения потребуется около 100Gflop. Пиковая производительность GTX 980 — 5Tflops. Итого: около 20мс на не самой новой видеокарте.
Прикидка очень грубая, но, учитывая, что сеть не будет полносвязной, должна быть в пределах одного десятичного порядка.
Ну давайте, например CS:GO, без предварительно зашитой карты уровня.
Не только распознавание, а распознавание и формирование реакции. Какая игра — неважно, на какой обучат, на такой и будет играть.
А вот смотря на монитор, распознать хотя бы КАК ПЕРЕДВИГАТЬСЯ — там же полос разметки нет, можно ли запрыгнуть на ящик — только экспериментально.
Или вы про того бота, который получает всю информацию об уровне на генетическом уровне?
То есть у бота просто нету понимания психологии, а человек прочитает его поведение мгновенно.
Гугл говорит что в покер уже. А там даже ИК-камеру, которая может служить простеньким детектором лжи, не прикручивали.
В шутерах и стратегиях значительная доля успеха — умение быстро кликать куда надо при появлении внешнего стимула (выстрелить первым, на 3 секунды быстрее нафармить 1000 веспена, ), в чем компьютеры ужепереплюнули хуманов. И, ЕМНИП, инфа которая скармливается ботам не так уж и превосходит ту что приходит игрокам. Так что если не увеличивать боту время реакции на внутриигровые раздражители — то у людей шансов тоже маловато.
Но вот написать адекватного бота…
Вы где-нибудь видели адекватного AI компаньона, который будет тебя сопровождать, передвигаясь хотя бы адекватно. Понятно, что по заранее прописанным маршрутам он это сделает, а построить удобный и безопасный маршрут по свободному пространству, с учетом физических возможностей?
Не путайте работу интеллекта и работу мышц, сразу предположите, что человек способен управлять компьютерным персонажем мысленно с идеальной точностью, и подумайте где преимущество сегодняшних ИИ в этой ситуации.
Если добавить время на распознавание картинки в время реакции ИИ, а из времени реакции целовека вычесть время между подачей команды и ее выполнением — боты все еще будут быстрее.
Имхо, это желтизна.
Упрощение. Читайте как: "Программы для игры в го, в отличие от других игр с полной информацией, показывали низкие результаты при использовании эвристик, созданных при участии профессиональных игроков." -> Не получилось формализовать интуицию игроков в го -> Не получилось научить компьютер хорошо играть в го -> Комьютер не "понял" игру го
https://habrahabr.ru/post/310638/
Поэтому крайне сложно найти реал-тайм игру, где интеллект в таких условиях будет иметь решающее значение.
Можно использовать не ИИ, а простейшие алгоритмы, но при этом побеждать.
Подобный пример все поясняет:
https://www.youtube.com/watch?v=IKVFZ28ybQs
Поэтому крайне сложно найти реал-тайм игру, где интеллект в таких условиях будет иметь решающее значение.
Начать с задержки в 250 миллисекунд, если проигрываем — уменьшаем на 5 миллисекунд. Быстро достигается наилучший результат среди человеков, каждый более опытный противник — скорее исключение.
Сама игра го считается более сложной для компьютеров потому, что возможных позиций камней на стандартной доске в гугол больше, чем в тех же шахматах. Это больше, чем число атомов во Вселенной.
В который раз уже читаю эту безграмотную фразу. Чего больше, чем атомов во Вселенной? Позиций в го? Или гугол, может, больше? Правильный ответ — они все больше, включая и позиции в шахматах.
А если атомы начать переставлять? Любой атом на любое место?
Речь ведь про количество атомов, а не количество их комбинаций.
Интересно, чисто теоретически, можно ли каким-либо способом записать все эти позиции, хватит ли материала во вселенной?
Другими словами, способны ли современные накопители (HDD, Flash и прочие) вместить базу данных с бОльшим количеством уникальных записей, чем количество атомов, из которых состоит носитель?
DeepMind объявила о матче AlphaGo с чемпионом мира по го Кэ Цзе