Знаток Финансов

Технология распознавания лиц

Как программируется распознавание лиц

Никогда не надо отвечать на вопросы разработчиков и для разработчиков, если ты не разработчик. Поэтому за помощью мы обратились к специалисту.

Дмитрий Сошников

Член Российской ассоциации искусственного интеллекта и старший эксперт по разработке систем ИИ и машинного обучения Microsoft.

Распознавание лиц (а также другие связанные операции) — это достаточно типовая задача. Поэтому многие компании предоставляют готовые сервисы в виде облачных API (программных посредников между приложениями) для качественного решения этих задач. Кроме IT-гигантов вроде Microsoft и Google, распознаванием лиц занимаются также специализированные компании, в том числе российские. Их продукты стремительно развиваются и предоставляют ещё более интересные функции, такие как идентификация лиц и силуэтов в толпе.

Самому с нуля натренировать нейронную сеть намного сложнее. Нужен большой и качественный набор исходных данных, то есть десятки и сотни тысяч (а лучше ещё больше!) фотографий людей. Кроме того, понадобятся существенные вычислительные ресурсы и знания в области ИИ и машинного обучения. Крупные компании располагают всеми этими средствами, поэтому решают задачу намного лучше.

Также существует промежуточное решение — использовать уже натренированную нейросеть, например OpenFace. Такой вариант, скорее всего, будет работать чуть хуже, чем готовый облачный сервис, однако позволит иметь полный контроль над системой. При этом потребуется определённый уровень понимания работы нейросетей и нейросетевых фреймворков и, по всей видимости, некоторое знание языка Python, который завоевал популярность как основной язык программирования среди специалистов Data Science.

Действительно, на нём удобно проводить различные эксперименты, визуализировать данные и производить эффективные матричные вычисления благодаря прекрасному пакету NumPy. Это не самый лучший язык для промышленной разработки, поскольку он не содержит эффективных средств для создания больших безопасных программных систем, однако альтернатив ему в области обучения глубоких нейросетей пока нет.

Принцип работы уличных камер с технологией распознавания лиц

Данные комплексы рассчитаны на то, чтобы распознавать лица людей на некотором расстоянии. При этом вначале считывается визуальная информация на улице, а затем она сравнивается с базой данных. Характерной особенностью системы является ее чувствительность, позволяющая эффективно идентифицировать человека даже при изменении внешности и плохом освещении.

Обработка текущей информации происходит в режиме реального времени. При этом для опознавания лица конкретного человека требуется минимум времени.

В случае соединения системы с устройствами блокировки происходит автоматическое срабатывание, а в памяти компьютера сохраняется фото для дальнейшей идентификации охраной.

Данные современные комплексы используются в оборонной сфере, внутри крупных компаний. Их использование повышает уровень безопасности конкретных организаций.

Видеокамеры могут работать в 2D или 3D режимах. Двухмерные камеры более чувствительны к недостатку освещенности, поэтому их применение имеет некоторые ограничения. Агрегаты, работающие с трехмерным пространством, эффективно функционируют даже в темноте. В любом случае следует учитывать разрешение устройств.

Полная LUNA

Компания VisionLabs, основанная в 2012 году, — это пример успешного российского высокотехнологичного бизнеса. Да, такое бывает, хотя многие не верят в российские технологии и конкуренцию на мировом технорынке. Стартап собрал целый ряд инвестиций от крупных организаций (Фонд содействия инновациям, фонд «Сколково» и другие) и сегодня успешно занимается разработкой идентификационных биометрических систем для банковской сферы.

Соответственно, «Открытие» не стал первым и единственным клиентом VisionLabs — LUNA внедрена и другими банками, но — в ограниченном формате. В качестве системы идентификации в отделениях, в банкоматах, для предоставления сотрудникам доступа к внутренним ресурсам и активации кредитных карт. Но мгновенные транзакции по фотографии получателя — это новый рывок российской банковской сферы.

Упоминание того, что система разработана ещё в 2015 году, тоже может смутить читателя: неужели за два года технологии не шагнули так далеко вперёд, что LUNA устарела? Технологии-то шагнули, но и разработчики не отстают. Более того, именно они эту технологию вперёд и толкают. Например. несмотря на то, что методика на сегодняшний день тщательно протестирована и в полной мере доказала свою надёжность, уже идёт работа над технологией будущего — системой Liveness, которая не позволяет идентифицироваться по неподвижному селфи: программа просит клиента сделать какое-либо действие в определённый момент, например, моргнуть, и сравнивает это выражение лица с аналогичным дополнительным селфи из базы. Так что скачать фото клиента и просто по нему идентифицироваться злоумышленник не может. Разве что изучить все выражения лица жертвы и изготовить пластический грим.

Впрочем, у VisionLabs есть конкуренты — компанию стремительно догоняют NtechLab и BSS, работающие над приложениями для совершения покупок в Интернете. Появляются всё новые и новые предложения по голосовой идентификации, определению пользователя по движениям губ, видеособеседовании с клиентом. Но тут вопрос не в том, что существует в виде стартапов, а что внедрено и работает. Так что первенцем в этом плане можно считать именно сотрудничество «Открытия» и VisionLabs. Даже если другие банки нагонят через месяц, они будут только вторыми. А фора в месяц на рынке высоких технологий — это очень, очень много.

Преимущества и эффективность

Данное устройство наиболее эффективно работает в единой сети с использованием общей базы данных. Это дает возможность анализировать информацию, поступающую одновременно со всех наружных камер наблюдения.

Например, до конца года в Москве будет работать около 174 тысячи уличных камер, большинство из которых установят в жилых домах, учреждениях образования, станциях метро, стадионах, вокзалах, рынках и других местах массового скопления народа.

Благодаря такой функции, можно без проблем распознать фото разыскиваемого человека. Кроме того, вполне реально восстановить его маршрут, действия за определенный промежуток времени.

Таким образом, с помощью технического прогресса уровень защиты городских жителей значительно повышается. По мнению специалистов, установка дополнительных камер видеонаблюдения с функцией распознавания лиц снижает преступность на 20-40%.

Данные системы используются для решения следующих задач:

  • организация эффективной пропускной системы с использованием турникетов;  
  • фейс-контроль в ночных заведениях, ограничение доступа проблемным посетителям; 
  • обустройство охранных систем частных домовладений и многоквартирных жилых домов;
  • предотвращение краж в супермаркетах, других точках продаж.

Возможно ли распознавание лиц онлайн

Интернет — место парадоксальное: люди здесь одновременно могут беспокоиться о том, не определяет ли каждая вторая камера на улице их личность, и искренне хотеть «распознавать лица других людей по фотографии онлайн». Рассмотрим это направление face recognition отдельно.

Программа распознавания лиц — это либо описанный выше аналитический модуль (камера видеонаблюдения + софт  + облачное хранилище), либо софт, аналогичный известному (слегка скандально) сервису FindFace. Сегодня скачать программу распознавания лиц «бесплатно и без регистрации» в подавляющем большинстве случаев, понятное дело, невозможно.

Веб-сервис FindFace.ru, помогающий найти людей в социальной сети «ВКонтакте» по их фотографии, был основан 18 февраля 2016 года. Помимо прочего, благодаря ему все желающие могли находить профили девушек, снимавшихся в порнофильмах. Очень скоро сервис стал использоваться для множества флешмобов по обнаружению лиц, которые имели полное право никогда и никем обнаруженными не быть. Разразился скандал, сработавший как вирусная реклама: технология, которая легла в основу сервиса, получила ряд престижных наград и вызвала интерес заказчиков со стороны государства и бизнеса. С 1 сентября 2018 года сервис более не оказывает Сервис FindFace, с помощью которого распознавали участников протестных акций, объявил о закрытии услуги поиска людей по фотографии, так как он был преобразован компанией NtechLab в линейку решений для различных отраслей бизнеса.

Мечта пользователя, который вводит запрос, очевидно, выглядит так: заходишь на сайт, загружаешь фото человека, снятого украдкой в метро, программа распознаёт лицо и выдаёт ссылку на профиль в соцсети. Ага, попался! Или же так: загружаешь программу на компьютер, подключаешь к ней веб-камеру и распознаёшь мордочку своего кота. Успех — теперь тебе будет приходить уведомление каждый раз, когда кот ворует сосиски.

Реальность жестока. Первый же сайт, который предлагает вам подобное, отказывается работать, а второй — требует навыков программирования на Python. Более-менее похожее на мечту приложение называлось SearchFace, которое недавно перезапустилось Searchface перезапустился с авторизацией через «ВКонтакте». Но соцсеть закрыла эту функцию под названием FindClone. Вы загружали фотографию, а алгоритм пытался распознать это же лицо в базе социальной сети «ВКонтакте»

Ссылок на профиль приложение не выдавало, только сами снимки — причём неважно, кем они были загружены. Если пользователь давно активен в соцсети, выдача фото создавала жутковатый «биографический» эффект, если же нет, распознанные изображения могли рассмешить

Иногда SearchFace работал вот так

Собственно, пример SearchFace наглядно отвечает на вопрос «Как социальные сети используют распознавание лиц?». Точнее было бы cформулировать его таким образом: «Как социальные сети используются для распознавания лиц?» Ответ прост: как база данных. Неисчислимое количество уникальных сочетаний цифр (а именно так для алгоритмов , «ВКонтакте» и остальных выглядят лица на фото) формирует базу для обучения нейросетей, которые ложатся в основу того или иного решения face recognition.

Решения все разные, и нейросети разные тоже, а детали и технические особенности заказчики и поставщики сервисов, как правило, не разглашают. В частности, пол и возраст модуль распознавания умеет определять благодаря тому, что может учиться на информации, содержащейся в «Одноклассниках», «ВКонтакте», Instagram и Facebook.

Что же такое распознавание лиц

Отделим мух от котлет. Пользователи чаще сталкиваются с распознаванием лиц в собственных смартфонах, где биометрическая идентификация применяется, чтобы разблокировать устройство и получить доступ к данным мог только его владелец. В процессе распознавания обязательно участвует 3D-камера, чтобы невозможно было обмануть гаджет фотографией.

Ещё существует идентификация лиц в реальном времени и реальных же условиях: в этом случае она неразрывно связана с системами видеонаблюдения, где лица буквально «выхватываются» из снимаемого камерами видеопотока.

Представим себе качественную современную камеру видеонаблюдения, размещённую чуть выше среднего человеческого роста в хорошо освещённом месте. Перед ней каждый день проходит примерно одинаковое количество примерно одних и тех же людей. Двигаются они не очень быстро.

Снятое видео может храниться в облачном архиве. К камере подключается аналитический модуль: сложное сочетание алгоритмов (искусственный интеллект, нейросети, вот это всё) плюс пользовательский интерфейс. Модуль «выхватывает» лица из видеопотока, определяет пол и возраст и заносит данные в базу.

Постепенно изображений становится больше. Система запоминает все распознанные лица автоматически и заносит их в архив, а пользователь с допуском указывает дополнительные данные: имя, должность, статус, прочие отметки («VIP-гость» или «вор»). Можно загрузить фото нужной персоны, а модуль найдёт в архиве все детекции этого лица.

Как только человек с отметкой вновь проходит перед камерой, система фиксирует это как важное событие и отправляет push-уведомление заинтересованным пользователям. Детекция в контексте распознавания лиц — это ситуация, когда алгоритм в принципе понял, что перед ним лицо, а не яблоко или русалка с кружки Starbucks

Вычислительные мощности ему сначала требуются для этого, и только затем он может сопоставить лицо с базой или запомнить.
Иногда детекция может удивить

Детекция в контексте распознавания лиц — это ситуация, когда алгоритм в принципе понял, что перед ним лицо, а не яблоко или русалка с кружки Starbucks. Вычислительные мощности ему сначала требуются для этого, и только затем он может сопоставить лицо с базой или запомнить.
Иногда детекция может удивить

Если вы дочитали предыдущие несколько абзацев до конца, поздравляю, теперь вы знаете, как работает распознавание лиц в идеальной ситуации. Описание подходит к любой системе: от тех, которые используются в московском метро, до решений для малого бизнеса.

Главное, что нужно понимать: идеальную ситуацию в реальной жизни создать сложно, особенно если речь идёт о целом городе, а не офисе или магазине. Скажем, в метро людей много, все разные, ходят быстро. Камер нужно очень много, они стоят денег, размещать их должны грамотные специалисты.

Развитие технологии распознавания лиц: мировые практики

Если говорить о развитии разработок с внедрением технологии распознавания лиц, стоит отметить достаточно быстрый рост в этом секторе именно Азиатско-Тихоокеанского региона. При этом США в настоящее время предлагают самый большой рынок для применения таких систем биометрической идентификации личности. Индия и Китай также являются лидерами в этой индустрии.

В частности, Китай разрабатывает и расширяет систему видеонаблюдения по всей стране. В конце 2017 года использовалось 176 млн камер видеонаблюдения. Ожидается, что к 2020 году количество этих устройств увеличится до 626 млн единиц.

В Индии действует проект Aadhaar — крупнейшая биометрическая база данных в мире, в которой зарегистрированы 1,2 млрд пользователей. Так, с 1 марта 2018 года Агентство Индии по уникальной идентификации (UIDAI) собиралось ввести виртуальные номера Aadhaar, которые состояли бы из 16 цифр. Однако это решение пока не удалось реализовать: в настоящий момент все еще разгораются споры вокруг такого типа реестра граждан.

Проект Aadhaar в Индии. Фото: bloomberg.com

Высший избирательный суд Бразилии участвует в общенациональном проекте по сбору биометрических данных жителей страны. Цель этой инициативы — к 2020 году собрать биометрическую базу данных, зарегистрировав в ней 140 млн граждан.

«Открытие. Переводы»: как работает идентификация по фото

Во-первых, вы должны иметь на смартфоне приложение «Открытие. Переводы». Во‑вторых, нужно сделать фотографию клиента, которому вы хотите сделать перевод. Можно сфотографировать его, сидя с ним рядом в кафе или стоя в очереди в музей — это гораздо быстрее и удобнее, чем спрашивать у него номер карты и «вбивать» его в форму. И всё, можно переводить деньги. Кстати, для переводов можно использовать и уже сделанную фотографию, загрузив её из галереи.
Конечно, помимо переводов по фотографии, приложение имеет стандартный функционал, в том числе переводы по номеру телефона или номеру карты. Все переводы проводятся по международному стандарту безопасности PCI DSS — набору требований систем Visa и MasterCard, который защищает ваши деньги в интернете. Кроме того, все переводы подтверждаются 3D-secure кодом, который гарантирует, что вашими деньгами не воспользуется кто-то другой.

Как развивается технология распознавания лиц

Системы видеонаблюдения с идентификацией лиц действительно захватывают мир. В Москве количество камер в 2019 году достигнет Высокие технологии и безопасность: сколько камер видеонаблюдения появится в этом году 174 тысяч. Это вовсе не значит, что все эти устройства по умолчанию могут распознавать личность: чаще всего сообщается Система распознавания находящихся в розыске преступников через видеокамеры заработает в Москве в 2019 г. о 160 тысячах камер с этой функцией. Тем не менее в конце 2018-го московская мэрия заявляла о намерении Власти Москвы в 2019 году собираются заменить видеокамеры и запустить систему распознавания лиц заменить все устройства видеонаблюдения и сформировать полностью инновационную систему в следующем году.

Парадокс в том, что 160 тысяч — это не так уж и много. Особенно если сравнивать с другим лидером запросов поисковиков по тематике распознавания лиц — Китаем. Там в конце 2017 года было In Your Face: China’s all-seeing state более 170 миллионов камер видеонаблюдения и за три ближайших года планировалось China’s ‘Big Brother’ surveillance technology isn’t nearly as all-seeing as the government wants you to think подключить к сети еще около 400 миллионов.

Грамотное и корректное использование face recognition работает в первую очередь на повышение безопасности и комфорта. Люди обычно быстро проникаются доверием к технологиям, которые избавляют их от очередей на футбольный матч (улыбнулся камере — прошёл), предотвращают воровство и хулиганство или помогают меньше тратить на покупки (программы лояльности). Всё это, понятное дело, требует определённого регулирования — именно для этого принимаются законы о защите персональных данных.

В будущем, вероятно, сфера распознавание лиц в системах видеонаблюдения будет регулироваться аналогично текущей практике работы с идентификацией лиц в интернете. Стремящиеся к конфиденциальности люди просто не загружают в Сеть лишнего — частичное фиаско сервиса SearchFace доказывает, что такая стратегия эффективна.

Конечно, нельзя бесконечно ограничивать себя в прогулках по улицам, где камеры установлены на каждом перекрестке, однако возможность сохранить анонимность сформируется, если будет соответствующий запрос от общества.

Описание выделения лица с помощью алгоритма Виолы-Джонса

Как уже было выше сказано, существует два подхода к решению задачи выделения лица на снимке. Алгоритм Виолы-Джонса реализует второй подход, абстрагируясь от задачи выделения лица до задачи выделения любого объекта на снимке. Более того, данный алгоритм относится к обучаемым алгоритмам, т.е. он требует некоторое время до применения. Основная идея алгоритмов второго типа – пиксели и их расположение характеризуют объект на изображении. Для того, чтобы ускорить процесс выделения объекта в алгоритме Виолы-Джонса используются не отдельные пиксели, а наборы пикселей. Основной особенностью данных наборов является то, что они разделены на несколько областей двух типов: светлые и темные. Каждый такой набор называется признаком или функцией Хаара. У него есть характеристика – значение признака. Именно эта характеристика и определяет, есть ли лицо на снимке. Происходит это следующим образом: для того, чтобы определить, есть ли лицо на снимке, признак многократно накладывается на изображение. При накладывании на признака часть пикселей попадает под светлую область, часть – под темную. Для каждой области высчитывается среднее значение яркости. Здесь необходимо пояснить, что алгоритм Виолы-Джонса использует в качестве входного изображения снимок в серых оттенках. Как только будет рассчитаны средние яркости для темной и светлой области, из среднего светлой области вычитается среднее темной области. Это и будет значением признака. Для того, чтобы определить, принадлежит ли область под признаком лицу или нет, необходимо сравнить значение признака со значением признака, полученным на этапе обучения. Но поскольку признаки могут иметь различное значение в зависимости от расположения, то необходимо проверять каждый признак еще и при повороте на различный угол. Классическая схема с признаками Хаара подразумевает поворот на 90 и 180 градусов. Алгоритм Виолы-Джонса допускает поворот и на другие углы. Также применяются и другие преобразования над признаками, в том числе масштабирование. Но тут появляется вполне логичный вопрос – как реагировать на изображения различного размера? Для этого в алгоритме используется метод плавающего окна – вместо того, чтобы применять признаки ко всему изображению, признаки применяются только к небольшой области, называемой окном. Окно может менять размеры, а передвижение окна позволяет охватить все изображение. На рисунке 1 представлена общая схема работы алгоритма Виолы-Джонса.

Рисунок 1 – Схема работы алгоритма Виолы-Джонса(анимация: 23 кадра, 7 циклов повторения, 81,5 килобайт)

Очевидно, что все вышеуказанные преобразования требуют расчетов колоссальной сложности. Для ускорения используется другой тип представления изображения – интегральное. Интегральное представление – это представление изображения в виде матрицы, где каждый элемент – сумма яркостей всех пикселей, находящихся левее и выше текущего, т.е. в элементе x,y хранится сумма яркости всех пикселей в области 0,0 – x,0 – x,y – 0,y. Это сводит время на расчет значения признака к константному значению.

Вернемся к обучению. Это наиболее длительная процедура, поскольку необходимо применить весь набор признаков ко множеству изображений для нахождения наиболее оптимальных значений признаков. От качества тренировки зависит эффективность распознавания, а потому необходимо как можно больше изображений. При обучении необходимо выделить признаки, которые будут выдавать правильный результат очень часто и те, которые будут выдавать случайный результат. Первые называют сильными признаками, а вторые – слабыми. Слабые признаки неэффективны для распознавания. Но есть возможность их использовать – их можно объединить для поучения сильного признака. Данная модификация называется AdaBoost.

Подводя итог, можно сказать, что основная концепция алгоритма Виолы-Джонса – быстрое выделение, но медленное обучение – позволяет применять его для работы в режиме реального времени.

Недостатки системы

Возможности распознавания лиц, слежения за конкретным человеком некоторые люди могут использовать в своих личных целях. Это подтверждают многочисленные российские форумы, на которых активно торгуют персональными данными россиян.

Данные моменты являются крупнейшим недостатком систем наблюдения, поскольку доступ к системным данным имеют около 16 тысяч пользователей. На данный момент можно приобрести данные о местоположении человека по вышкам сотовой связи, банковским счетам, с помощью государственных баз данных.

Таким образом, данные технологии представляют собой двигатель прогресса, который обеспечивает контроль и безопасность. С другой стороны, увеличивается возможность нарушения конфиденциальности персональных данных каждого гражданина.

Как работает распознавание лиц в бизнесе

Востребованность face recognition в финтехе, ретейле и других видах бизнеса напрямую связана с повышением доступности технологии. Механика проста: на всех предприятиях и во всех организациях стоят камеры видеонаблюдения, которые используются как инструменты для сбора данных и последующей аналитики. В мире системы наблюдения снимают за месяц терабайты видео в формате Full HD, то есть информации для обработки накапливается действительно много.

Необходимое ПО для анализа данных может «прошиваться» на устройство производителем. Камеры с видеоаналитикой «на борту» стоят обычно довольно дорого.

Альтернативный вариант — аналитика в облаке, то есть удалённом дата-центре, которая подключается к любой недорогой камере. Это на порядок дешевле плюс даёт гибкость — можно адаптировать решения под конкретный бизнес.

Популярность технологии распознавания лиц в разных сферах деятельности возрастает. К примеру, Сбербанк — один из лидеров в части анонсирования различных громких проектов face recognition, и поспорить Он узнает тебя из тысячи: банкомат определит клиента по глазам с ним в этом плане может разве что «Тинькофф». В 2017 году Сбербанк приобрёл Сбербанк инвестировал в технологию распознавания лиц 25,07% компании VisionLabs, создающей софт для распознавания лиц. За 2018 год финансовое учреждение успело протестировать face recognition в московском метро и даже поймать Благодаря системе распознавания лиц Сбербанка пойманы 42 преступника 42 преступника, протестировать Он узнает тебя из тысячи: банкомат определит клиента по глазам банкоматы с идентификацией лиц, чтобы злоумышленники не могли снимать деньги с чужих карт, а также объявить сбор биометрических данных (аудиозапись голоса, видеозапись лица) клиентов. В апреле этого года Сбербанк получил контроль над разработчиком систем распознавания голоса и лиц — «Центром речевых технологий» (ЦРТ).

Другое дело, что анонсировать, тестировать, пилотировать и покупать решения — не значит собственно внедрять. Что именно сейчас реально используется в Сбербанке (и используется ли), сказать с уверенностью на самом деле может только Герман Греф.

С розничной торговлей всё прозрачней. По сути, здесь есть три проблемы, которые распознавание лиц решает.

Во-первых, воровство. В магазинах орудуют мошенники, причём нередко одни и те же люди в одной и той же сети. Face recognition позволяет определять «дрейфующих воришек» и других людей, ранее нарушавших порядок. Как только однажды занесённый в базу нарушитель зайдёт в магазин, охрана получит уведомление в мессенджере или другим удобным способом.

Во-вторых, трудность работы с постоянными клиентами. Данных о покупках и днях рождения, чтобы персонализировать предложения для VIP-клиентов и фанатов бренда, попросту не хватает. Распознавание лиц можно интегрировать с CRM — то есть софтом, в который менеджеры заносят всю информацию по всем сделкам организации. В случаях с ворами и VIP распознавание лиц работает примерно одинаково: лицо заносится в чёрный или белый список, и при его повторном появлении система просигналит человеку с доступом. Пол и возраст определяются автоматически, а дополнительную информацию добавит ответственный сотрудник.

В-третьих, идентификация лиц в ретейле используется для таргетированной рекламы. К примеру, в некоторых магазинах X5 Retail Group установили Х5 включит компьютерное зрение камеры для распознавания выражения лица и возраста покупателей. Анализируя эти данные, система выводит на экран монитора в торговом зале товары, которые могут понравиться человеку. Ещё живая иллюстрация — кейс Lolli & Pops, большого кондитерского магазина в США. Система face recognition определяет Your future in-store loyalty program will be fed by facial recognition постоянных покупателей и посылает на их смартфоны уведомления с товарами, которые могут им понравиться (с учётом индивидуальных предпочтений и даже аллергии на продукты).

Ещё один яркий пример использования технологии в ретейле — магазины без продавцов и касс. Например, Alibaba Tao Cafe Amazon Go vs Alibaba Tao Cafe: Staffless Shop Showdown — это кафе и магазин самообслуживания, расположенный в Ханчжоу. Здесь продаются напитки, закуски, продукты, игрушки, рюкзаки и тому подобное. Tao Cafe открыт только для пользователей сайта Taobao.

Tao Cafe / syncedreview.com

Как работает технология распознавания лиц?

Технологически системы иногда могут сильно отличаться в плане распознавания лиц, но все они имеют примерно общие принципы работы.

Шаг 1: Обнаружение лица

Для начала камера обнаружит лицо человека, будь он один или находясь в толпе. Лицо лучше всего обнаруживается в тот момент, когда человек смотрит прямо в камеру, однако современные технологические достижения позволяют также обнаруживать лицо и в тех ситуациях, когда человек не смотрит прямо в камеру (конечно, в определенных пределах).

Шаг 2: Анализ лица

Затем снимается фотография лица и начинается его анализ. Большинство решений для распознавания лиц использует 2D-изображения вместо объемных 3D-изображений, поскольку они могут более просто сопоставлять 2D-фото с общедоступными фотографиями или фотографиями, имеющимися в базе данных. Каждое лицо составлено из различимых ориентиров или узловых точек. Каждое человеческое лицо имеет 80 узловых точек. Программы для распознавания лиц анализируют узловые точки, такие как расстояние между вашими глазами или форма ваших скул.

Шаг 3: Конвертация изображения в данные

После этого анализ вашего лица превращается в математическую формулу. Ваши черты лица становятся числовым кодом. Такой числовой код называется отпечатком лица (faceprint). Подобно уникальной структуре отпечатка большого пальца, каждый человек имеет свой собственный отпечаток лица.

Шаг 4: Поиск совпадений

Далее ваш код сравнивается с базой данных отпечатков лиц. В этой базе данных имеются фотографии с идентификаторами, которые можно сравнивать.

ФБР имеет доступ к более чем 641 миллиону фотографий, включая 21 государственную базу данных, такие как DMV. Другой пример базы данных, к которой многие имеют доступ, — это фотографии в Facebook. Любые фотографии, помеченные именем человека, становятся частью базы данных Facebook.

Затем технология определяет соответствия ваших точных данных тому, что представлено в базе данных. Результатом этого становится идентификация человека с предоставлением дополнительной информации (ФИО, адрес и т.п.).

Техника на грани фантастики

В ноябре прошлого года в Москве прошел международный форум AI Journey, где были представлены образцы ИИ на грани фантастики.

Сбербанк представил робота-курьера, который может доставлять корреспонденцию на другие этажи, пользуясь лифтом.

Российский квантовый центр показал систему, которая настраивает точное научное оборудование, что высвобождает время ученым для занятий именно наукой.

Искусственный интеллект, разработанный в Политехническом институте, поступил на службу в Санкт-Петербургский онкоцентр, где выдает диагнозы почти со стопроцентной точностью.

Сюда можно добавить беспилотные автомобили, а также системы по распознаванию лиц, которые работают во многих аэропортах мира.

Самообучающиеся нейросети, благодаря способности обрабатывать большой объём информации и выявлять в нём закономерности, выполняют определенные задачи лучше и быстрей человека:

ИИ проявляет себя в самых неожиданных ипостасях.

Летом прошлого года появилось сообщение о том, что команда из австралийского университета Флиндерс с помощью программы SAM (Search Algorithm for Ligands) синтезировала новую вакцину против птичьего гриппа, которая стала первым в мире лекарственным препаратом полностью разработанным искусственным интеллектом.

Национальный фонд естественных наук Китая (NSFC) создал интересную математическую модель, которая отбирает исследователей на роль рецензента заявок на финансирование.

В Канаде компания Advanced Symbolics разработала программу, направленную на выявление суицидальных наклонностей у пользователей соцсетей.

Исследователи Франкфуртского университета имени Гёте разработали математический алгоритм Beta Writer, который написал первую нучную работу.

Другой алгоритм, Generative Adversarial Network, написал картину «Портрет Эдмонда де Белами», которая на аукционе ушла с молотка за 28 миллионов рублей.

Из Канады в Россию

…интересно, как в документации будут называться селфи, если «Открытие» всё-таки интегрирует возможность самостоятельно снимать эталоны. Хочется какого-нибудь русского слова. Например, в Интернете пишут «себяка». Или «себяшка». Звучит, наверное, слишком смешно, чтобы использоваться в официальных документах, но почему бы и нет? Впрочем, не будем пока забегать вперёд.

Пилотные проекты были и раньше — например, ограниченно, на тестовом банкомате, селфи-идентификацию применял «Сбербанк», но «Открытие» первым внедряет технологию распознавания лиц на массовом рынке, на основании собственных исследований и LUNA, как уже говорилось, разработки российской компании VisionLabs. Хотя технически с помощью LUNA можно пройти идентификацию, «Открытие» в своём проекте использует программу не для входа в систему, а для денежных переводов — вместо ввода номера карты или телефона получателя можно просто загрузить его фотоснимок.

LUNA была разработана ещё в 2015 году, а в «Открытии» её закрытое тестирование началось с января 2017-го. На первых порах программа испытывалась непосредственно в банковских отделениях — в трёх московских филиалах установили систему предварительной идентификации клиента в момент, когда он получал талон электронной очереди. Технология на базе самообучающейся нейронной сети позволяла ускорить обслуживание: операционист получал данные о клиенте ещё до того, как тот давал свой паспорт. В идеале, паспорт вообще не нужно доставать — биометрии хватает, но это уже вопрос законодательства: по российским законам паспорт является обязательным элементом идентификации клиента в отделении. Вторым шагом стала разработка приложения с интеграцией LUNA.

Добавить комментарий