На страницах нашего сайта мы очень часто рассказываем о различных системах искусственного интеллекта и об их достижениях, среди которых можно отметить создание произведений искусства, музыкальных композиций и т.п. Такие системы обычно обучаются делать свое дело путем анализа сотен тысяч и миллионов примеров. Но когда системе искусственного интеллекта предоставляют возможность обучить саму себя с нуля, это приводит к получению весьма странных и забавных результатов.
Показательным примером результатов самообучения системы искусственного интеллекта является работа "Emergence of Locomotion Behaviours in Rich Environments", выполненная специалистами DeepMind, подразделения компании Google, занимающегося проблемами искусственного интеллекта. Специалисты DeepMind использовали метод усиленного самообучения (reinforcement learning, RL) для того, чтобы компьютер смог обучиться передвижению в незнакомой и сложной окружающей среде.
Все, что делает нарисованный линиями "человечек" на приведенном ниже видеоролике, является результатом процесса самообучения. Прыжки, подтягивания и прочие движения - являются элементами линии поведения, разработанного компьютером для решения задачи перемещения из точки А в точку Б. Программисты DeepMind снабдили своего агента рядом виртуальных датчиков, благодаря которым агент может узнать свое текущее положение и получить множество других данных об окружающей среде. А компьютер, методом проб и ошибок выдумывает новые движения и способы перемещения.
Наиболее интересным в данном случае является то, что чем сложней виртуальная окружающая среда, то тем более изощренные методы и движения выдумывает компьютер, к примеру, использование упора на колено при преодолении высокого препятствия. Вторым интересным моментом является то, что наиболее эффективные движения и способы перемещения, выдуманные компьютером, не похожи на естественные движения человека. То, что делает агент на экране компьютера, весьма похоже на движения человека, находящегося под воздействием достаточно сильной дозы спиртного. Это же, в свою очередь, указывает на то, что роботы не должны быть ограничены только набором естественных для человека движений при выполнении поставленной им задачи.
Проведенные исследования являются одним из базовых видов подобных исследований, проводимых в виртуальной окружающей среде, Но однажды все это может превратиться в программы управления роботами, которые смогут самостоятельно действовать в сложной среде промышленного предприятия или на поверхности другой планеты, к примеру.