Новые данные по соревнованию Visual Question Answering (VQA) Challenge 2021 по распознаванию образов машинными алгоритмами выявили несомненного лидера — компанию Alibaba и её модель AliceMind.
Китайский алгоритм превзошёл не только алгоритм Microsoft, но также оказался сообразительнее человека. Точность работы алгоритма составила 81,26 %, а точность человека — 80,83 %.
В соревнованиях VQA Challenge 2021 использовалось свыше 250 тысяч изображений, после изучения которых требовалось ответить на 1,1 млн текстовых вопросов об увиденном. Машинный алгоритм компании Alibaba справился с заданием лучше всех и лучше людей.
Пока разница между машиной и человеком не очень большая, но со временем разрыв будет расти. К тому же, что критически важно, алгоритм может работать круглосуточно с одинаковой погрешностью, тогда как человек быстро снизит концентрацию внимания уже после пары–тройки часов работы.
В компании Alibaba считают, что алгоритм не вытеснит человеческий труд, но сможет убрать из него рутину. Например, компьютерное зрение сможет проводить первичный медицинский анализ, не отвлекая врачей от их главной обязанности — ставить точный диагноз.
Также алгоритм распознавания поможет развить автоматическое вождение транспорта и улучшить поиск на тех же сайтах электронной коммерции, что уже сегодня реализуется в том или ином объёме.