В конце 2012 года ФБР приступило к внедрению в США системы распознавания лиц нового поколения (по некоторым данным, называемой TrapWire, или просто «Машина») стоимостью в миллиард долларов, что встревожило одновременно правозащитников и простых смертных налогоплательщиков.
Сегодня подробно поговорим о реализованной методике распознавания лиц (вернее, о том самом «психосканере»), которая позволяет не только идентифицировать человека, но и достаточно точно предсказывать его намерения и эмоциональное состояние.
Технологичный камуфляж
Прежде чем погружаться с головой в природу самых последних FRS-методик, давайте посмотрим, насколько противоречивая ситуация сложилась с подобными технологиями на данный момент. Ситуация в этой сфере напоминает извечную борьбу-соревнование «снаряда и брони»: добившись достаточно высокой успешности детектирования лиц, внесенных в базу, силовые структуры США с каждым годом сталкиваются со все более возрастающим противодействием и постепенной адаптацией к подобным проактивным системам со стороны преступных элементов. Такая ответная «научная работа» приводит к появлению в открытом доступе вполне эффективных «ассиметричных методик», которые позволяют с наименьшими усилиями противодействовать удачному автоматическому распознаванию лиц в общественных местах.
Приведу пару фотографических иллюстраций, где показаны реальные примеры противодействия своей идентификации. Так, открытым проектом CV Dazzle используется специальная пудра и спецтехника ее нанесения на лицо. Для тестирования использовался открытый движок OpenCV. Зеленый квадрат показывает удачный захват и идентификацию лица, а красный — наоборот.
Для начала демонстрация возможностей движка:
Как видим, обученный OpenCV запросто справляется с задачей. Поэтому по-настоящему противостоять FRS-системе можно, не просто замазывая или как-то скрывая лицо, но понимая алгоритмические закономерности ее работы.
Попытки любителей «сбивать алгоритм» необычными прическами, частично перекрывающими лицо, чаще всего ничего не дают:
А вот если за дело берутся технари, атакуя FRS-движок уже на прикладном, алгоритмическом уровне, — результат ниже (эта же девушка):
Лозунг подобных проектов — максимальная естественность и зловещая эффективность. Ниже еще одна гиковая попытка затруднить работу FRS-системы. Впрочем, безуспешная:
А вот ниже еще один контрпример, после того как с этим же парнем поработали технари-программисты:
Интересно, что именно такого «кудрявого мальчика» — Джохара Царнаева, которого искали в том числе и подобным образом, — по словам начальника управления полиции Бостона Эдварда Дэвиса (Edward Davis), распознать так и не удалось: «против него оказались полностью бесполезны системы распознавания лиц ФБР».
Угроза над головой
Второе популярное направление — активное противодействие наблюдению за людьми с помощью дронов. Буквально недавно научно-исследовательское агентство DARPA и армия США рассекретили подробности о своей совместной разработке — системе видеонаблюдения ARGUS-IS с рекордным разрешением в 1,8 гигапиксела. Эта система была раскрыта в связи с приходом на ее место следующей, более совершенной версии.
Даже в этой «старой версии» можно наблюдать за любым конкретным человеком внутри целого города. В случае теракта, подобного Бостонскому, видеозапись всегда можно отмотать и посмотреть, кто конкретно и как его устроил. ARGUS-IS использовался не только в военных целях, но и просто над крупными американскими городами. Для американских спецслужб, видимо, особенно обидно, что развертывание подобной системы не успело охватить Бостон: по планам ARGUS-IS должен был появиться там только во второй половине 2013 года.
Но все-таки самое опасное «оружие» подобного дрона — это высокочувствительный тепловизор, который позволяет в режиме ночного видения контролировать ночную активность города в режиме нон-стоп, равно как и находить даже укрывшихся людей по их характерному тепловому излучению. Именно так и был обнаружен Джохар Царнаев с полицейского вертолета в частном дворе одного из домов, в лодке под брезентом. Посмотрите на полицейском видео, насколько хорошо на экране тепловизора виден человек, скрывающийся под брезентом, даже с высоты около 1 км.
Результат — в американской среде набирает популярность спецодежда, которая эффективно блокирует инфракрасный спектр излучения человеческого тела, делая подобную слежку с дронов гораздо менее эффективной.
На фотографии ниже хорошо видно в режиме FLIR, как достаточно эффективно подавляются естественные человеческие излучения:
Хоть стоимость подобной одежды довольно высока. Но на подходе принципиально новые метаматериалы, которые позволят создавать одежду с еще более экзотическими физическими свойствами.
Эмоции обнаженные
Впрочем, все это детские шалости по сравнению с надвигающейся на обывателя новой системой распознания лиц следующего поколения, которая будет развертываться на территории США на протяжении 2013 года. Чтобы понять, что же реализует система TrapWire (aka «Машина»), необходимо дать минимальную дозу теории.
Итак, есть такой в меру известный голливудский фильм «Теория лжи», он рассказывает о психологе-специалисте, который по микромимическим движениям лица определяет, лжет человек или нет. Как это часто случается, главный герой этого фильма имеет реального прототипа — в данном случае это американский психолог Пол Экман. Область исследований Пола — изучение человеческой микромимики и ее связь с мышлением. Главный итоговый вывод его теории — любой человек мыслит в буквальном смысле «всем телом», иначе говоря, его мысли можно считывать напрямик с тела.
История появления этого нового направления психологии отчасти повторяет историю появления эриксоновского гипноза, когда некий «обычный» человек, имеющий «дар от природы», удачно пересекается с пытливым ученым, который его научно исследует и вербализирует его подсознательные техники. В нашем случае Экман встретился с Силваном Томкинсом, который имел природную способность отличать правду от лжи, а также предугадывать чужие действия, просто наблюдая за лицом человека. Томкинс был феноменом, настоящим детектором лжи «во плоти и крови»! Например, посмотрев на фотографии разыскиваемых преступников, он мог сказать, в чем их обвиняют, существенно экономя полиции время на введение его в курс дела. Конечно, дело было вовсе не в каких-то мистических или парапсихологических возможностях — Томкинс обладал уникальной наблюдательностью и способностью улавливать мельчайшие движения лица, так называемые микромимику и микромоторику мышц лица.
Ученый Пол Экман «случайно встретился» с ним в начале 1960-х годов. Тогда молодой и никому не известный Силван Томкинс сколачивал себе состояние на ипподроме — он наблюдал в бинокль мельчайшие нюансы настроений и взаимоотношений у лошадей, участвовавших в скачках, что позволяло ему предсказывать лидера и каждый раз делать выигрышные ставки. Именно тогда ФБР свело психолога с юным самородком, сформулировав при этом задачу: именно Экман должен был поставить томкинсовскую эмпирику на научные рельсы.
Дальнейшие массовые исследования показали, что мимика не зависит от конкретной культуры, а только и исключительно от нашей животности, от видовой принадлежности. Экспериментаторы взяли анатомический атлас и изучили все мышцы лица, выделили движение каждой мышцы, ее значение, вручную разложив все человеческие эмоции на тысячи составляющих в проекции на мышцы человеческого лица. Результатом этой тяжелой исследовательской работы стала мимическая «азбука» (FACS). Сейчас в ней 43 основные мимические позиции, или «буквы». Их сочетания, которые и дают «слова», — различные эмоции. Самых главных, базовых эмоций, характерных для большинства людей, получилось около трех тысяч.
Таким образом, инвентаризировав и пронумеровав всевозможные сочетания и значения подсознательных напряжений лица, Экман изложил все это в своем фундаментальном пятисотстраничном труде, где детально описал нюансы движения глаз и губ, различные виды наморщивания кожи между глазами и щеками, изгибы носогубных складок и так далее.
Теперь эта методика — готовый рабочий инструмент. На данный момент в США всего около 300 сертифицированных в этой области специалистов, большая часть из которых трудоустроена в различных спецслужбах.
Заканчивая с теорией, напоследок хорошо бы оценить, насколько эта «методика работает». Сделать это легко на примере статистики американских фирм, которые занимаются прогностикой прочности браков.
Вот как это выглядит в реальной жизни. Жених и невеста записываются на прием к специалисту. Около часа с ними легко и непринужденно беседует специальный человек, который последовательно опрашивает их на предмет их жизненных взглядов в самых разных областях. Все это записывается на видео, после чего к анализу снятых крупным планом лиц приступает уже непосредственно специалист по мимике. По официальной статистике фирмы Джона Готдмана, одного из ведущих специалистов в этой области, на основе часового разговора мужа с женой он предсказывает с точностью до 95%, будут ли они по-прежнему женаты через 10 лет.
Специалист рассматривает в замедленной съемке лица партеров, присваивая всем промелькнувшим эмоциям-реакциям некий весовой коэффициент, который заносит в формулу и получает результат — развод или счастливая совместная жизнь до гроба. Будущим супругам на память вручается это видео, а также сценка с прогнозом специалиста в качестве финала-заключения записи.
Технология в массы
Как, вероятно, догадался читатель, данная технология была настолько формализована, что лишь время определяло, когда же на эту проблему «натравят» компьютерщиков. Это произошло в 1996 году благодаря стараниям FBI Biometrics. Примерно через 10 лет, в конце 2012 года, началось внедрение уже готовой и принципиально новой глобальной системы Next Generation Identification (NGI) на базе данной мимической теории.
Брюс Шидлер (Bruce Shidler), один их экспертов ФБР, констатирует, что с тех пор, когда Силван Томкинс наблюдал на ипподроме в бинокль за лошадьми, и за которым, в свою очередь, в силу его «феноменальной удачливости» наблюдало уже ФБР, прошло несколько десятков лет. В качестве итога изучения этого феномена можно констатировать, что созданы полностью автоматические компьютерные системы, которые способны не только быстро идентифицировать личность человека, но также эффективно предсказывать его поведение и намерения. И если в брачных прогностических конторах анализируются шаблоны верности и совместимости будущих супругов, то американская «Машина» способна перемалывать миллионы попадающих в ее поле зрения лиц, выявляя какие-то одной только ей известные шаблоны мышления людей.
Ради справедливости стоит добавить, что эта разработка базируется на проекте Future Attribute Screening Technology (FAST) и, кроме вышеописанного «сканера эмоций», также реализует когнитивную систему обнаружения заданных паттернов в поведении людей.
Прообраз этой второй составляющей — система Mind's Eye, разработанная учеными из университета Карнеги-Меллона по заказу DARPA. Сердцем Mind's Eye является система распознавания образов и интерпретации действий людей под названием Cognitive Engine. В нее заложены паттерны поведения, которые нужно искать в прямом потоке с видеокамер наблюдения. Например, если человек оставил сумку под скамейкой и ушел — это явная угроза террористического акта в ближайшие минуты. В случае обнаружения одного из подобных запрограммированных паттернов система будет обращать внимание ее оператора на конкретного человека и его действия.
Бонус: дополнительные 10 фактов по этой теме
1.
Данная система распознавания лиц много лет «обкатывалась» на базе американского Disneyland, где есть все необходимые условия для негласного тестирования ее эффективности. Американская часть интернета завалена недовольными воплями, суть которых сводится к странному вопросу: «Какого черта военные со своими технологиями делают в Диснейленде?»
2.
Газета Guardian рассказывает историю программиста, который, прогуливаясь на территории Диснейленда, подошел к автомату, который предложил ему купить совместную фотографию с его девушкой, но самое удивительное, что все поля для оплаты уже были заполнены его личными данными, и даже более того — данными его валидной кредитной карты. Программист уверяет, что он не пользовался своей картой и никак не идентифицировал себя ни в Диснейленде, ни в его окрестностях. Газета смогла установить связь военных (Department of Defense) с Disney Amusement Parks, где они совместно обкатывают некие совместные проекты.
3.
Исследователи из MTI выпустили программное обеспечение MindReader, которое предоставляет свободный доступ через API и уже сегодня может применяться на различных сайтах, в том числе для изучения общественного мнения (т. н. нейромаркетинг). Оценка выражения лица осуществляется за несколько секунд на базе видеопотока с веб-камеры.
4.
На фоне собственного прорыва правительство США юридически ограничило права и возможности научных агентств и частных компаний на исследования в области распознавания лиц.
5.
Система Пола Экмана утверждает, что люди испытывают лишь 6 эмоций, все остальное многообразие чувств есть лишь «сложное сочетание» этих базовых эмоций. Современная компьютерная база микромимических выражений (dictionary of FRSial expression measurements), используемая для автоматического распознания человеческой мимики (Facial Action Coding System), насчитывает более 7000 различных производных от этих 6 базовых эмоций.
6.
Технически на данный момент существует два принципиально разных метода машинной реализации распознавания микромимики. Во-первых, это разработка компании Machine Perception Technologies (MPT), базирующаяся на нейронных сетях. Во-вторых, это Cohn-Kanade AU-Coded FRSial Expression Database, которая основывается на искусственном интеллекте.
7.
Google нанял на работу лучшего ученика Пола Экмана, пока не разглашая, для какого проекта собирается задействовать его знания.
8.
Пол Экман входит в 100 самых цитируемых ученых мира, некоторые его книги были написаны в соавторстве с Далай-ламой. Многие его книги переведены на русский. В частности, описанная выше «теория микромимики» в научно-популярной форме изложена в его книге «Психология лжи. Обмани меня, если сможешь» или на видео.
9.
Джордж Оруэлл в известном романе «1984» предсказывает появление технологий скрининга (Telescreens), которые смогут информировать правительство о нежелательных и потенциально криминальных мыслях подданных (Thoughtcrime). Это приведет к тому, что специально созданное подразделение полиции (Thought Police, thinkpol) будет локализовывать и превентивно осуждать подобных преступных элементов.
10.
Эксперимент «по отраженной эмпатии» с провоцированием субъекта уже успешно моделируется в рамках TrapWire. Это работает так: например, ставится на центральной площади гигантский бюст любимого и бессменного национального лидера с призывом а-ля «Со мной навеки!», после чего система мониторит лица мимо проходящих и с вероятностью 95% детектирует подсознательную реакцию субъекта при попадании его взгляда на эту мотивационную чушку. Всех «отфильтрованных» граждан ночью вывозят в лес, отводят в сторонку и составляют акт о «нецензурном выражении матом в своем уме».
В связи со всем вышеизложенным интересно, готов ли ты, %username%, уже в скором будущем пожертвовать своей личной приватностью ради «важных задач государственной безопасности»?
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.