Для того, чтобы роботы могли компенсировать затраты на их разработку и изготовление, они, естественно, должны работать. Но перед этим кто-нибудь должен научить их выполнять необходимую работу. Сейчас это делают группы программистов, которые целыми днями разрабатывают программы для промышленных роботов, но представьте себе, что робот может обучиться выполнению какой-либо работы, просто наблюдая за человеком, выполняющим эту же самую работу. Именно такую возможность реализовали исследователи отдела искусственного интеллекта компании NVidia, они создали систему, которая после непродолжительных доработок и испытаний уже может быть использована для управления универсальными роботами следующих поколений.
Технологии обучения роботов некоторое время развиваются достаточно бурными темпами. Роботы уже имеют возможность обучаться при помощи словесных инструкций, обучаться, буквально читая мысли человека, накапливать опыт, исправляя собственные ошибки, и делиться своим опытом и знаниями через специализированные облачные сервисы.
Основой новой системы, как и других систем искусственного интеллекта, является искусственная нейронная сеть, точнее несколько нейронных сетей, совместно работающих над решением одной задачи. Эти нейронные сети работают на аппаратных средствах графических процессоров NVidia Titan X GPU, куда подаются потоки видеоданных от камер, наблюдающих за действиями человека и действиями робота, который пытается подражать человеку.
Сейчас эта система работает на достаточно примитивном уровне, она способна распознавать цветные кубики, игрушечные автомобили, которые человек-учитель сначала расставляет в определенном порядке, а затем перемешивает их, нарушая этот порядок. И робот должен самостоятельно выстроить все эти предметы так, как показал ему человек.
Для того, чтобы справиться с этой несложной, на первый взгляд, задачей, каждая из нейронных сетей выполняет свою собственную задачу. Одна из сетей идентифицирует, определяет местоположение и пространственную ориентацию каждого из объектов. Следующая сеть определяет, в каком порядке находятся эти объекты относительно друг друга, и последняя сеть рассчитывает порядок действий, которые необходимо выполнить роботу, для того, чтобы упорядочить объекты заданным образом.
Робот также имеет некоторые интеллектуальные способности, он может учиться и приобретать опыт на своих собственных ошибках. Когда он портит что-либо на каком-нибудь этапе процесса, он пробует сделать это еще раз, но уже не повторяя предыдущей ошибки. Помимо этого, робот "расписывает" план своих действий в удобочитаемом для людей виде, что позволяет наблюдателям проверить правильность понимания роботом поставленной задачи. И в случае необходимости человек может провести повторный процесс обучения робота.
Данная работы была представлена вниманию общественности в рамках Международной конференции IEEE по вопросам робототехники и автоматизации (IEEE International Conference on Robotics and Automation, ICRA), которая проходила на прошлой неделе в Брисбене, Австралия. А на приведенном ниже видеоролике вы можете увидеть весь процесс обучения робота и его самостоятельные действия.