Люди совершенно не испытывают затруднений при рассматривании фотоснимков и сопоставлении двухмерных представлений с реальными трехмерными объектами. Но для компьютеров, обладающих не столь богатым опытом жизни в реальном мире, решение подобной задачи связано с множеством сложностей. Однако недавно группа исследователей создала новый алгоритм "развертки", использование которого значительно упрощает процесс распознавания образов на фотоснимках. Этот алгоритм прошел предварительное обучение на ряде примеров трехмерных объектов и их разверток на двухмерной плоскости, а его нормальная работа заключается в выполнении обратного преобразования.
После процесса предварительного обучения нейронной сети алгоритм научился полностью самостоятельно преобразовывать снимки трехмерных объектов, самолетов различных типов, к примеру, в набор двухмерных поверхностей, которые могут быть "сшиты" обратно в трехмерную форму. И такой подход успешно работает по отношению к изображениям различных объектов, самолетов, автомобилей и тел людей. Отметим, что предыдущий вариант этого алгоритма во время своей работы допускал множество ошибок, из снимков самолетов он иногда производил трехмерные модели птиц, а автомобили-седаны трансформировались "чудесным" образом в хэтчбеки.
Программа SurfNet (от слова "surface") была представлена на конференции IEEE по компьютерному видению и распознаванию объектов (Institute of Electrical and Electronics Engineers Conference on Computer Vision and Pattern Recognition), которая проходила на прошлой неделе в Гонолулу. А алгоритмы, лежащие в основе этой программы могут быть использованы в практических целях для создания систем виртуальной и дополненной реальности, для составления трехмерных карт окружающего пространства и помещений, в которых предстоит действовать роботам, в новых компьютерных интерфейсах, где управление осуществляется при помощи движений и жестов рук, и во многих других областях.