Программный продукт политехника позволит распознавать людей в видеопотоке по любым «плоским» изображениям

| 808

Инженер лаборатории 3D-моделирования и промышленного дизайна Томского политехнического университета Степан Небаба стал одним из победителей программы УМНИК Фонда содействия развитию малых форм предприятий в научно-технической сфере. Гранта была удостоена разработка программного продукта для мультисенсорной системы распознавания личности в видеопотоке в режиме реального времени с привлечением трехмерных моделей. Опытный прототип системы планируется получить в 2019 году, полностью завершить работу — в 2020 году.

Потребность в быстрой некооперативной идентификации личности по изображению лица высока во многих сферах, особенно в сфере безопасности, где оперативность реакции на событие имеет решающее значение. При этом лучшие современные разработки обладают достаточно высокой стоимостью и редко достигают высокой точности распознавания в сложных условиях съемки.

«Моя разработка, — говорит ученый, —  призвана решить задачу быстрого некооперативного распознавания личности по изображению лица в видеопотоке с высокой точностью, используя при этом оборудование бюджетной ценовой категории, без привлечения серверов обработки информации и строгих спецификаций для датчиков».

Комплекс позволит искать на видеозаписи человека по любому «плоскому» изображению. Например, можно будет определить по фотороботу преступника, попавшего на камеры в аэропорту, в метро, на вокзале. Или его можно будет использовать для контроля доступа на предприятии, чтобы выявить в производственном помещении человека, у которого туда нет допуска.

Степан отмечает, что система состоит из специальных датчиков для съемки и программного обеспечения, которое он и разрабатывает. Под датчиками понимаются как видеокамеры, так и камеры инфракрасного диапазона, которыми можно с достаточно высокой точностью определять расстояние до объектов, составляя таким образом их 3D-модель. Эти датчики выпускаются серийно и достаточно широко распространены. Обрабатывать данные, поступающие с такой системы, сможет обычный компьютер. Но чем больше число изображений, по которым ведется поиск, тем выше будут требования к вычислительным ресурсам и объему оперативной памяти устройства.

Степан не первый год занимается этой темой. Предыдущая разработка, по его словам, способна синтезировать 3D-модели лиц людей и проводить их сравнение как с 3D-моделями, так и с плоскими растровыми изображениями лиц. Разрабатываемая сейчас технология призвана расширить круг применения этой системы на 3D-модели, получаемые с помощью датчиков глубины, что в перспективе должно положительно сказаться на качестве распознавания личности при сохранении высокого быстродействия. С помощью этой технологии можно также сравнивать снятые на видео лица, для которых имеется только какое-то изображение в 2D.

«Суть моего проекта в том, чтобы построить универсальную систему, способную сравнивать все типы моделей лиц: 2D с 2D, 2D с 3D и 3D с 3D.

Как раз в области сравнения 3D моделей с 2D изображениями существующие системы не работают, отдавая предпочтение либо быстрому, но не очень точному 2D-распознаванию, либо точному, но крайне медленному и сложному 3D-распознаванию. Двумерное изображение, 2D, в данном контексте — это любое растровое изображение лица человека, например, кадр из видео, достаточно точный фоторобот. Естественно, чем четче и ближе к реальному лицу изображение, тем точнее и надежнее получается результат распознавания. Большинство современных систем имеют довольно строгие требования как к эталонным изображениям, так и к условиям съемки видео, моя разработка стремится снизить эти требования, сохранив при этом высокую точность и скорость распознавания личности в видеопотоке» — уточняет ученый.

Персоны