Моя челюсть упала на пол, когда я увидел, как ИИ справляется с одной из самых сложных физических игр в мире всего за шесть часов.

только что освоил Лабиринт за шесть часов, и я ставлю под сомнение свое существование.

Я начал играть в «Лабиринт» в 1970-х годах. Хотя Лабиринт может выглядеть обманчиво простым и полностью аналоговым, он представляет собой невероятно сложную физическую настольную игру, существующую почти 60 лет назад, в которой вам предстоит провести металлический шар через пронизанный дырами лабиринт, меняя ориентацию игровой платформы, используя только поворотные выступы на двух соседних сторонах рамы коробки игры.

Я до сих пор помню, как мой отец принес «Лабиринт» домой, в нашу квартиру в Квинсе, и мою почти полную одержимость его освоением. Если вы никогда не играли, то понятия не имеете, как тяжело удерживать металлический шарик на узкой дорожке между двумя лунками, ожидая, чтобы его сожрать.

Это не значит, что вы преодолели несколько ям и оказались дома свободными; на всем извилистом пути их 60. Одно неверное движение — и мяч проглатывается, и вам придется начинать заново. Чтобы пройти через это невредимым, требуется хорошая моторика, ловкость и умение решать множество задач в режиме реального времени. Возможно, мне несколько раз удалось успешно пройти по коварному маршруту.

Иногда он игнорировал путь и сокращал путь. Это называется обманом.



В последующие годы я время от времени играл (однажды памятно с гигантский лабиринт в Google I/O), но в основном я забыл об игре, хотя, думаю, я никогда не забывал о вызове.

Возможно, именно поэтому у меня открылся рот, когда я смотрел, как CyberRunner научился и прошел игру всего за шесть часов.

В недавно выпущенном видеоролике программисты из государственного исследовательского университета ETH Цюриха продемонстрировали своего простого робота с искусственным интеллектом, который использует пару приводов, которые действуют как «руки», чтобы поворачивать ручки Лабиринта, а также верхнюю камеру для наблюдения за происходящим. и компьютер, на котором работает алгоритм искусственного интеллекта, который обучается и, в конечном итоге, побеждает в игре.

В видео разработчики объясняют, что «CyberRunner использует последние достижения в области обучения с подкреплением на основе моделей и его способность принимать обоснованные решения о потенциально успешном поведении путем планирования на будущее».

Изначально CyberRunner был не лучше меня или любого другого среднестатистического игрока. Он бросил металлический шар в отверстия менее чем на одну десятую пути, а затем и на пятую часть пути. Но с каждой попыткой CyberRunner становился лучше – и не просто немного лучше, а в геометрической прогрессии.

Согласно видео, всего за шесть часов «CyberRunner способен пройти лабиринт быстрее, чем за любое ранее зафиксированное время».

Видео потрясающее. Два мотора раскачивают доску со сверхчеловеческой скоростью и удерживают мяч настолько идеально на траектории, что ему никогда не грозит опасность упасть в какую-либо лунку. В конечном итоге лучшее время CyberRunner составило потрясающие 14,8 секунды. Я думаю, что мое лучшее время было… ну, часто это могло длиться много минут.

Я хорошо помню игру и то, как иногда я останавливал мяч в лабиринте, делая перерыв в середине испытания, чтобы подготовиться к оставшейся части предстоящего все еще трудного путешествия. С CyberRunner дело обстоит иначе. Его уверенность возможна только при наличии ИИ. Он не боится уронить металлический шарик в яму; нет страха неудачи.

Кроме того, изначально он не боялся быть пойманным на мошенничестве.

Пока CyberRunner учился, он делал то же, что и компьютеры, и искал лучший и самый быстрый путь через лабиринт, а это означало, что иногда он игнорировал путь и использовал короткие пути. Это называется обманом. К счастью, исследователи поймали CyberRunner и перепрограммировали его, чтобы он мог следовать по всему лабиринту.

Конечно, достижение CyberRunner заключается не только в победе над людьми в действительно сложной игре. Это демонстрация того, как ИИ может решать проблемы физического мира на основе зрения, физического взаимодействия и машинного обучения. Единственный вопрос: какие реальные проблемы будет решать этот проект с открытым исходным кодом в дальнейшем?

Что касается меня, то мне нужно выкопать свой Лабиринт из родительского шкафа.

Вам также может понравиться