Николай Чикишев 18 августа 2020, 15:02

Рука робота собрала кубик Рубика, но восстание машин откладывается

Компания OpenAI создала робота, который спустя 10 000 симуляционных лет тренировок научился собирать кубик Рубика. Эксперимент показывает, что до превосходства роботов над человеческим интеллектом пока далеко.

Оставить комментарий

Робот собрал кубик Рубика за 10 тысяч лет, что это значит?

Исследовательская компания OpenAI из Сан-Франциско показала роботизированную систему Dactyl, которая научилась собирать кубик Рубика. Система состоит из человекоподобной руки британской компании Shadow Robot Company, которая подключена к мощной компьютерной системе, множеству камер и других датчиков.

Компания заявила, что ловкость робота «близка к человеческой». На видеозаписи машина без особых усилий поворачивает кубик, и у пользователей сложилось впечатление, что это доказательство революции в роботостроении.

В прошлом году OpenAI показала, что Dactyl научился вращать куб в руке, используя движение, изученное в процессе подкрепления. Чтобы решить головоломку, робот не стал полностью полагаться на обучение подкреплением — ему помог более традиционный алгоритм решения головоломки. Хотя сам Dactyl оснащен несколькими камерами, робот не может видеть каждую сторону куба. Поэтому разработчикам пришлось спроектировать специальный кубик, оснащенный датчиками, чтобы робот понимал, как расположены квадраты.

Это начало восстания машин?

Успехи компании оказались не настолько впечатляющими. В восьми случаях из десяти робот просто уронил кубик. Чтобы научиться им манипулировать, Dactyl потребовалось 10000 симулированных лет тренировок.

— Я не сказал бы, что это ажиотаж. Но люди будут смотреть на это видео и думать: «Боже мой, следующим будет тасование карт и другие вещи», а это не так, — говорит Кен Голбдерг, робототехник из Калифорнийского университета в Беркли.

— Знаете ли вы шестилетнего ребенка, который роняет кубик Рубика в 80% случаев? — иронизирует Гэри Маркус, ученый-когнитивист, который критикует шумиху вокруг искусственного интеллекта.

По сути, ролик — это демо-версия с бизнес-задачами. Компании и университеты размещают впечатляющие промо продуктов, которые захватывают воображение публики и приводят к появлению интригующих заголовков в прессе. Это маркетинговый ход компаний, которые ожесточенно конкурируют на рынке за клиентов и финансирование.

Так что же в этом революционного?

Ловкость Dactyl специфична и ограничена: он может адаптироваться к небольшим изменениям, но без серьезной подготовки система не может подобрать кубик со стола, использовать другой захват или взять другой предмет. Настоящая инновация разработчиков на видео не продемонстрирована: как робот переносит обучение из симуляции в реальный мир.

Dactyl решает, как манипулировать тем или иным предметом, с помощью машинного обучения: он тренируется в управлении рукой сначала в симуляции и потом вживую. Бессмысленно тратить годы на отработку задания роботом, поэтому его обучение проводят в симуляторе. Но часто бывает трудно перевести движения из симуляции в реальность, когда малейшее трение или шум могут сбить робота с толку.

Инновация заключается в том, что разработчики добавили в симуляцию помехов и шумов, чтобы система научилась быть более устойчивой.

С роботами все безнадежно?

Есть и другие обнадеживающие примеры. DeepMind, дочерняя компания Alphabet, использовала машинное обучение для тренировки своей программы AlphaGo, чтобы научить ее играть в настольную игру го лучше, чем игроки-люди. В 2008 году эксперт в области искусственного интеллекта Эндрю Ын обучил беспилотники выполнять фигуры высшего пилотажа. Его ученик Питер Абель спустя несколько лет научил робота складывать полотенца. Хотя коммерческая выгода этой технологии не была очевидна, выглядело это многообещающе.

Самое убедительное доказательство, что роботы пока не слишком ловки, — это небольшой диапазон задач, которые они могут выполнять на производстве. Компания Tesla с трудом внедряет автоматизацию на своих заводах, а компания Foxconn не смогла добиться того, чтобы роботы выполняли большую часть кропотливой работы по выпуску iPhone и других гаджетов.

По мнению одного из пионеров робототехники Родни Брукса, научная работа, связанная с машинным обучением роботов, пока еще далеко от того, чтобы быть коммерчески полезной.

Читать на dev.by