Факты о распознавании лиц с помощью искусственного интеллекта
Благодаря сервису Amazon Rekognition встраивать в приложения высокоточный анализ изображений и видео стало очень просто. Как и в случае прочих технологических достижений, важно понимать, как работает распознавание лиц и как его можно использовать. Давайте рассмотрим некоторые вопросы, часто задаваемые клиентами.
Что такое распознавание лиц?
Распознавание лиц – это система, предназначенная для идентификации людей на статичном изображении или видео. Эта технология существует уже несколько десятилетий, однако ее использование стало более заметно в последние несколько лет, так как теперь она используется в составе инновационных решений, например при распознавании фотографий людей и дополнительной аутентификации на мобильных устройствах. Чтобы оценить эти новые возможности, давайте рассмотрим принцип работы технологии распознавания лиц.
Возможности анализа лиц, подобные тем, что доступны в сервисе Amazon Rekognition, позволяют пользователям определить присутствие лиц на статичных изображениях или видео, а также определить их свойства. Например, Amazon Rekognition может анализировать такие атрибуты, как открытые или закрытые глаза, настроение и цвет волос. Обнаруженные свойства крайне полезны для клиентов, которым нужно упорядочить или осуществлять поиск среди миллионов изображений в течение нескольких секунд по меткам метаданных (например, «веселый», «очки», «возрастной диапазон») или чтобы определить конкретного человека (то есть при распознавании лиц по исходному изображению или уникальному идентификатору).
Как клиенты используют распознавание лиц?
Распознавание лиц используется во многих областях и индустриальных вертикалях. Сегодня эта технология помогает новостным агентствам определять знаменитостей на фотографиях при освещении важных событий, осуществляет дополнительную аутентификацию в мобильных приложениях, автоматически индексирует файлы изображений и видеофайлы для СМИ и компаний индустрии развлечений, а также позволяет правозащитным группам выявлять и спасать жертв работорговли.
Например, компания Marinus Analytics использует искусственный интеллект в сервисе Amazon Rekognition для разработки инструментов, таких как Traffic Jam, которые позволяют правозащитным агентствам выявлять жертв работорговли и определять их местоположение. Эксперты экономят ценное время за счет анализа изображений при автоматическом поиске среди миллионов записей в течение нескольких секунд. Ранее этот процесс требовал индивидуального анализа с привлечением специалистов.
Другой пример – финансовая компания Aella Credit, расположенная в Западной Африке и предлагающая банковские услуги через мобильное приложение лицам, не имеющим доступа к основным финансовым услугам на новых рынках. Благодаря функциям обнаружения и сравнения лиц сервиса Amazon Rekognition компания Aella Credit осуществляет проверку личности без вмешательства человека. Такой простой сценарий использования технологии распознавания лиц позволяет большему количеству людей получить доступ к финансовым услугам, чем когда-либо ранее. Другие примеры использования сервиса Amazon Rekognition клиентами можно найти на странице Клиенты Amazon Rekognition.
Как можно ответственно использовать распознавание лиц?
Технология распознавания лиц никогда не должна использоваться в нарушение прав человека, включая право на неприкосновенность частной жизни, или при принятии автономных решений в сценариях, требующих анализа с человеческим участием. Например, когда банк использует такие инструменты, как Amazon Rekognition, в финансовом приложении для проверки личности клиентов, он всегда должен явно описывать использование технологии и просить пользователя принять условия ее использования. В отношении вопросов общественной безопасности и правопорядка мы считаем, что государственная власть вправе сотрудничать с правоохранительными структурами для разработки политик приемлемого использования технологий распознавания лиц, которые бы защитили права граждан и позволили правоохранительным структурам обеспечивать общественную безопасность.
Во всех сценариях обеспечения общественной безопасности и правопорядка такие технологии, как Amazon Rekognition, должны использоваться только для сужения круга потенциальных совпадений. Ответы сервиса Amazon Rekognition позволят представителям органов власти быстро получить набор потенциальных лиц для дальнейшего анализа с участием человека. Учитывая важность сценариев обеспечения общественной безопасности, человеческая оценка необходима для более точного распознавания лиц, и при этом ПО для распознавания лиц не должно использоваться автономно.
Как говорил д-р Мэтт Вуд: «Машинное обучение – крайне важный инструмент для правоохранительных структур. Но пока мы следим за тем, чтобы он применялся правильно, мы не должны забывать про «духовку», так как «температура» может быть настроена неправильно, и «пицца» может сгореть. Однако, будет разумно, если правительственные структуры будут производить оценку и указывать необходимую «температуру» (или уровень доверия), которой должны соответствовать правоохранительные органы, чтобы помочь им в вопросах обеспечения общественной безопасности.
Как работает распознавание лиц в сервисе Amazon Rekognition?
Система распознавания лиц разработана на базе машинного обучения и компьютерного зрения. Инструкции по использованию: 1. Найдите часть входного изображения, содержащую лицо. 2. Извлеките область изображения, содержащую голову, и выровняйте область так, чтобы лицо находилось в «нормальном» вертикальном положении, выводя обрезанные изображения лица. 3. Преобразуйте каждое обрезанное изображение лица в «вектор лица» (технически это математическое представление изображения лица). Обратите внимание, что коллекции, искомые SearchFaces, представляют собой наборы векторов лиц, а не наборы изображений лиц. 4. Сравните исходный и целевой векторы лиц и верните оценку сходства системы для векторов лиц. Подробную информацию о вызовах API см. в документации для разработчиков.
Что такое оценка схожести и порог схожести?
Оценка схожести – это статистическая мера вероятности того, что два лица на изображении принадлежат одному и тому же человеку, при анализе в сервисе Amazon Rekognition. Например, изображение, которому была присвоена оценка схожести на уровне 95 %, означает, что среди всех проанализированных сервисом Rekogniton лиц, это изображение имело сходство на 95 % с искомым лицом. Более высокая оценка схожести означает более высокую вероятность того, что оба изображения принадлежат одному человеку. Таким образом, даже сходство на уровне 99 % не гарантирует положительного совпадения.
Это обусловлено тем, что Rekognition использует вероятностную систему, где детерминирование невозможно с абсолютной точностью и является предположением.
Именно здесь применяется порог схожести. Порог схожести – это самая низкая оценка схожести, которую приложение, использующее сервис Rekognition, готово принять в качестве возможного совпадения. Выбор пороговых значений оказывает важнейшее влияние на результаты поиска. Количество неверных идентификаций (ложных результатов), которые может себе позволить клиент, напрямую зависит от установленного порогового значения. Клиент может выбрать соответствующее значение на основании своих потребностей и сценариев использования приложения.
Мы рекомендуем устанавливать значение на уровне 99 % в сценариях использования, где важно получить высокоточное совпадение. Например, в сценариях обеспечения общественной безопасности и правопорядка первым этапом часто является сужение круга лиц, чтобы специалист мог в оперативном порядке проверить и рассмотреть возможные варианты на основании собственных суждений.
С другой стороны, многие сценарии использования не требуют анализа ответов сервиса Amazon Rekognition с участием человека. Например, аутентификация по второму фактору с помощью карточки сотрудника и лица с распознаванием сервисом Amazon Rekognition с высокой оценкой схожести (99 %). Или в приложениях личных фотоальбомов, где допускается несколько неверных совпадений, можно использовать более низкое пороговое значение – 80 %. Клиенты могут задать порог схожести в соответствии с требованиями и особенностями своего сценария использования.
Что такое API для распознавания знаменитостей? Чем этот интерфейс отличается от поиска по лицам?
Функция обнаружения знаменитостей позволяет определять потенциальных знаменитостей в различных сценах из фильмов и в жизни. Так как знаменитости часто исполняют различные роли (используют различный грим, парики и прочие средства, искажающие их внешность), эта функция сервиса Amazon Rekognition была обучена на предварительно размеченных данных для возврата наивысших по вероятности совпадений в рамках определенного списка знаменитостей. По существу, этот сценарий использования допускает большее количество ложных результатов, поэтому его не следует использовать в сценариях обеспечения общественной безопасности и правопорядка.
В то же время, функция поиска по лицам сервиса Rekognition возвращает точный процент сходства между двумя лицами, и ее можно оптимизировать для получения точных совпадений в сценариях обеспечения общественной безопасности и правопорядка, например для поиска пропавших детей и их воссоединения с родителями, авторизации доступа сотрудников в здание или выявления и спасения жертв работорговли.
Технологии, используемые этими двумя функциями, сценарии использования и состав клиентов отличаются коренным образом.
Безопасно ли распознавание лиц?
Да. Давайте рассмотрим некоторые распространенные заблуждения о технологии распознавания лиц и принципах ее работы.
Во-первых, некоторые считают, что человек может сопоставлять фотографии с лицами лучше, чем машины. Однако сотрудники Национального Института стандартов и технологий (NIST) недавно опубликовали результаты исследования технологий распознавания лиц, которые как минимум на два года старше моделей, используемых сервисом Amazon Rekognition, и сделали вывод, что даже устаревшие технологии способны распознавать лица лучше, чем человек.
Во-вторых, как и во всех вероятностных системах, само существование ложных результатов не означает, что технология распознавания лиц имеет фундаментальные недостатки. Скорее, это подчеркивает важность следования рекомендациям – в частности, настройки разумных пороговых значений схожести, соответствующих конкретному сценарию использования. Также одним из преимуществ данной технологии является непрерывное обучение и совершенствование, поэтому количество ложных результатов со временем будет снижаться.
Сегодня многие успешные клиенты, такие как Thorn, VidMob, Marinus Analytics и POPSUGAR, достигают великолепных результатов с помощью простой в использовании технологии распознавания лиц.
Как начать работу с технологией распознавания лиц?
Чтобы помочь вам начать работу с технологией распознавания лиц, AWS предлагает 10-минутные учебные пособия и подробную документацию с нормативным руководством.
Как сообщить о возможном нарушении Amazon Rekognition?
Если вы подозреваете, что Amazon Rekognition используется незаконно или с нарушениями, посягает на ваши права или права других людей, сообщите об этом, и AWS изучит эту проблему.
Подробнее об Amazon Rekognition