Специалист по технологиям компьютерного видения Тобиас Вейанд (Tobias Weyand) и его коллеги из компании Google разработали новую систему искусственного интеллекта под названием PlaNet, основанную на технологиях глубинного изучения, которая была обучена по визуальным признакам идентифицировать местоположение, в котором был сделан анализируемый снимок. Основой базы данных программы PlaNet является условная сетка поверхности земного шара, исключая океаны и полярные области, к координатам которой привязано 126 миллионов снимков, снабженных геолокационными метками и взятых на "просторах" Интернета.
По строению программа PlaNet является искусственной нейронной сетью. Как известно, такие нейронные сети обладают возможностью самообучения, для этого им надо дать только "первоначальный толчок". Именно это сделали исследователи из Google, которые обучили программу определять местоположение по визуальным особенностям, присутствующим на сниках.
Для проверки точности работы программы PlaNet, Тобиас Вейанд с коллегами "натравили" программу на сервис изображений Flickr, 2.3 миллиона снимков на котором снабжены геолокационными метками. Программа в 48 случаях правильно определяла континент, страна правильно была определена в 28.4 процентах случаев, а правильное определение города и улицы было произведено в 10.1 и 3.6 процентах случаев соответственно. Вышеперечисленные цифры имеют не очень впечатляющие значения. Однако, здесь следует отметить, что на сервисе Flickr имеется масса снимков, не несущих информации о местоположении, это снимки интерьеров, домашних животных, пищи и т.п.
Проверив работоспособность программы, исследователи из Google заставили свое детище конкурировать с десятью людьми с высокой степенью интеллекта, которым довелось много поездить по всему белу свету. И искусственный интеллект выиграл у людей более чем в половине раундов, всегда демонстрируя более высокую точность определения местоположения снимка.
Интересен тот факт, что программа PlaNet не нуждается в огромных вычислительных ресурсах, ей требуется всего 377 МВ памяти, что позволяет запускать ее даже на смартфоне. А это, в свою очередь, позволит людям получать более разнообразную информацию, чем могут предоставить другие подобные сервисы типа Google Googles или Panoramino.