Распознавание отдельных черт лица как основа узнания целого лица

Ющенкова Д.В., бакалавр, студентка V курса Международного университета природы, общества и человека «Дубна»
Мещеряков Б.Г., профессор кафедры психологии Международного университета в г. Дубне, borlogic@yahoo.com

Совершенно обычные для человека способности к распознаванию, различению, узна­ванию лиц в научной литературе нередко характеризуются как феноменальные и удиви­тельные. Например, способность различать лица описывается как высшая точка (акме) человеческого визуального восприятия (Ellis, 1981); мы можем опознать выражение лица (например, улыбку) даже в том случае, если оно мелькнуло лишь на мгновение – на 20 мс (Simpson, Crandаll, 1972), и узнать своих одноклассников (даже если забыли их имя) с точ­ностью 90% спустя 35 лет после окончания школы (Bahrick et al., 1975). Эти способности получают самые восторженные оценки и с точки зрения потенциального количества вос­принимаемых и запоминаемых лиц, и с точки зрения разнообразия получаемой информа­ции о самом лице и его обладателе, и с точки зрения скорости ее обработки и прочности запоминания, и, наконец, с точки зрения важности этой информации для обеспечения са­мосохранения и социального благополучия. Примечательно, что в последнее время воз­рос интерес к малоразработанной проблеме адекватности восприятия индивидуально­психологических особенностей и экспрессивных состояний человека по выражению лица, в том числе на основе его фотоизображения (Барабанщиков, 2009).

Таким образом, исследования процессов и механизмов узнавания изображения лиц приобрели статус особых (special) «стимулов»; они признаются «особыми» для восприятия объектами не только с точки зрения их значения для общения и жизни в обществе и осо­бенно для общения между людьми, но и с точки зрения своеобразных механизмов их вос­приятия и дальнейшего сохранения в памяти. И хотя существование особых механизмов обработки информации о лицах находит оправдание на основе аргументации об их дли­тельной эволюционной истории и большой коммуникативной практики, это нисколько не снимает, а, напротив, повышает значимость вопроса о реальном, конкретном содержании и функции этих механизмов.

Большое внимание в литературе по опознанию лиц уделялось вопросам о механиз­мах, способах и стратегиях их опознания. Этот вопрос имеет не только теоретическое, но и разнообразное прикладное значение: например, с точки зрения организации процедур опознания личности в ходе розыскной работы правоохранительных органов, в том числе при составлении и использовании портретов разыскиваемых лиц; разработки алгоритмов и систем автоматического опознания лиц (подробнее см.: Zhao et al., 2003); оценки качества косметических лицевых операций; диагностики и понимания ряда нарушений психическо­го развития (аутизм, синдром Уильямса и др.) и т.д.

Среди множества аспектов исследований опознания лиц традиционно вызывает боль­шой интерес вопрос о том, какие характеристики (элементы, части) лиц являются более или менее важными. Этот вопрос изучается с применением разнообразных методических под­ходов. Один из самых популярных подходов к изучению информативности (или perceptual saliency) частей лиц основан на данных о распределении фиксаций глаз при наблюдении лиц взрослыми и детьми (например, Ярбус, 1965; Janik et al., 1978; Corenblum, Meissner, 2006).

Другим способом анализа рассматриваемого вопроса о важности разных частей лиц для узнавания являются эксперименты по узнаванию фотороботных лиц в зависимости от дозированных изменений тех или иных деталей лиц (например, Davies et al., 1977).

Тем не менее этот вопрос требует дополнительных исследований, поскольку лишь в небольшом количестве исследований собственно опознания1 применялись достаточно строгие методики, позволяющие одновременно получать данные о точности и времени ответов. И наоборот, в ряде исследований с использованием хронометрических методик испытуемые решали не вполне экологически валидные задачи. Например, в исследова­нии Я. Фрэйзера и Д. Паркера (Fraser, Parker, 1986) в быстрой последовательности предъ­являлись части схематических линейных рисунков лиц, а испытуемые должны были как можно быстрее определить, было ли лицо полным или в нем отсутствовала определенная часть.

Поэтому исследования дифференциального вклада внутренних деталей лиц в процес­сы опознания с использованием фотографий реальных людей и с совместной регистрацией показателей точности и скорости опознания сохраняют свою актуальность и новизну.

В настоящем исследовании применялась новая методика, в которой задача испытуе­мого состояла в определении, какому из ряда одновременно предъявляемых лиц принадле­жит предварительно демонстрируемая на ограниченное время (1 с) часть лица (глаза, нос или рот). Эту задачу (и методику) можно было бы назвать «задачей (методикой) опознания целого лица по его части». Методика позволяет оценивать как точность, так и скорость опо­знания, поскольку вместе с выбором лица регистрируется время реакции выбора. Кроме того, нас интересовало влияние на характеристики опознания процесса научения (т.е. из­менения характеристик решения данной задачи на протяжении пяти опытов).

В качестве основной гипотезы было предположение, что наиболее эффективной ча­стью лиц в отношении их опознания является область глаз. Эта гипотеза вполне оправдана, учитывая многочисленные предшествующие исследования узнавания, собственно опозна­ния и глазодвигательного поведения при рассматривании лиц, в общем подтверждавшие тезис о наибольшей важности именно области глаз (см., например, обзоры: Мещеряков, 2006; Ellis, 1975, 1981; Zhao et al., 2003).

1 Термин «опознание» (recognition) в отечественной и зарубежной литературе часто используется в широком смысле, включающем как процедуры узнавания (бинарная классификация с категориями «новый – старый»), так и процедуры множественной идентификации (отнесение стимула к одному из множества классов эквивалентности, как это принято в случае реакции выбора.) Под собственно опознанием мы понимаем именно процедуры идентификации. Это различение важно, поскольку по интересующему нас вопросу преобладают исследования узнавания.

Метод

Испытуемые.

Выборка состояла из 20 испытуемых: 10 мужчин и 10 женщин (средний возраст – 23,2 лет, диапазон – 18–56 лет). Большинство испытуемых были студенты Международного университета природы, общества и человека «Дубна», остальные – люди с разным предше­ствующим образованием, занятые в различных сферах деятельности и имеющие различные социальные статусы. Испытуемые имели нормальную или скорректированную до нормаль­ной остроту зрения. Кроме одного испытуемого, все были правшами.

Оборудование и материалы.

Для демонстрации фотографий использовался персональный компьютер с дисплеем, а для регистрации ответов испытуемых применялось стандартное устройство ввода типа «мышь».

Предъявление фотографий на экране управлялось с помощью компьютерной про­граммы2, которая позволяла варьировать длительность предъявления изображений и ин­тервалы между ними, а также регистрировать варианты ответов и время реакции.

Испытуемым предъявлялось восемь черно-белых полутоновых фотографий лиц (4 фо­тографии мужских лиц и 4 фотографии женских лиц) по частям (фрагментарно) и в целом, с нейтральным выражением лица, без явных эмоциональных признаков. Фотографирование мужских и женских лиц осуществлялось в одних и тех же условиях, приблизительно в одно и то же время суток, с помощью одного и того же фотоаппарата. Размеры предъявляемых частей лиц были примерно уравнены, при этом важно отметить, что область глаз не включа­ла верхнюю часть головы (прическу), а область рта не включала подбородок (см. рис 1).

Рис. 1. Примеры предъявляемых частей лиц (фотография экрана дисплея)

В каждой пробе сначала предъявлялась отдельная часть лица (область глаз, область носа или область рта), затем – восемь фотографий лиц, среди которых было одно лицо, ко­торому принадлежала предъявленная часть лица. Эти восемь фотографий предъявлялись по кругу на дисплее, в центре которого предъявлялась часть одного из этих лиц (рис. 2).

При среднем расстоянии от глаз испытуемого до экрана дисплея 50 см, угловые раз­меры фрагментов лиц составляли 6 угл. град. по горизонтали и 1 угл. град. по вертикали, а размеры фотографий лиц в целом 4 угл. град. по горизонтали и 1 угл. град. по вертика­ли. Расстояние от точки фиксации до середины каждого лица составляло примерно 5 угл. град.

2 Написана сотрудником лаборатории экспериментальной психологии университета «Дубна» Р. В. Соколовым. Автор выражает ему за это глубокую признательность.

Рис. 2. Расположение на дисплее компьютера восьми черно-белых полутоновых фотографий лиц

Задача испытуемого и инструкция.

В каждом опыте задача испытуемого состояла в том, чтобы правильно и быстро опре­делить принадлежность предъявленной части лица одному из восьми лиц, предъявленных в целом. Длительность предъявления каждой части лица была фиксированной и равной 1 с. По прошествии этого времени часть лица исчезала, и на экране немедленно появлялся на­бор из 8 полных лиц до момента осуществления реакции выбора нужного лица.

Инструкция формулировалась следующим образом: «Смотрите на фиксационную точ­ку в центре экрана. В каждой пробе сначала в центре экрана на короткое время будет предъ­явлен тот или иной фрагмент лица (область глаз, область носа и область рта). Сразу после его исчезновения на дисплее по кругу появятся восемь фотографий лиц в целом. Ваша задача за­ключается в том, чтобы как можно быстрее и правильно определить, какому из этих лиц при­надлежит ранее предъявленный фрагмент лица. Для этого необходимо «мышкой» навести курсор на фотографию лица, которому, по Вашему мнению, принадлежит фрагмент лица».

Время реакции испытуемого от момента предъявления набора полных лиц до клика мышью автоматически регистрировалось в памяти компьютерной программы. После осу­ществления реакции выбора лица исчезали с экрана и через случайно варьируемый интер­вал между пробами (3 с) предъявлялась следующая часть лица.

План эксперимента.

С каждым испытуемым проведено пять опытов с интервалами от одних до пяти суток между последовательными опытами (средний интервал – три дня).
В отдельном опыте в качестве независимой переменной выступал фрагмент лица (3 уровня), предъявляемый 64 раза в квазислучайной последовательности, обеспечиваю­щей равное количество предъявлений из набора восьми разных лиц. Дополнительно в ка­честве независимой переменной рассматривался пол испытуемых.

Таким образом, основными независимыми переменными были «фрагмент лица», «но­мер опыта» и «пол». Зависимыми переменными были процент правильных опознаний и вре­мя реакции.

Процедура опыта.

О целях исследования испытуемым сообщалось только то, что оно направлено на вы­яснение вопроса: «Какие признаки наиболее существенны в опознании человеческих лиц».

Перед каждым опытом экспериментатор показывал испытуемому бумажные фото­графии тех же лиц, которые затем использовались в опыте. Испытуемого не ограничивали во времени для ознакомления с лицами, но, как правило, на это уходило не более 2–3 минут. Далее испытуемому зачитывалась инструкция, и начинался сам опыт. В среднем длитель­ность одного опыта составляла примерно 35 минут.

Расположение на дисплее фотографий лиц в целом после каждого предъявления от­дельной части лица было случайным от пробы к пробе. Каждая часть одного и того же лица предъявлялась по восемь раз. В итоге количество оцениваемых в одном опыте стимулов (и проб) составляло 192 (3 части лица х 8 лиц х 8 повторов для каждой части лица). Порядок предъявления стимулов для каждого испытуемого был случайным.

Результаты и их обсуждение

Анализ данных по точности опознания лиц.

Для оценки того, насколько точность правильного опознания лиц отличается от слу­чайного угадывания (однородное распределение вероятностей), мы воспользовались крите­рием .2. Процедура вычисления основывалась на сравнении эмпирических и теоретических частот распределения ответов в матрицах смешения 8 х 8 для каждой части лица как в целом по всей выборке испытуемых, так и отдельно для мужчин и женщин. В табл. представлены полученные значения критерия .2.

Таблица. Точность опознания мужских и женских лиц в целом по частям лиц для всей выборки и подвыборок (d.f. = 49)

Примеч.: все значения критерия .2 являются высокозначимыми (p < 0,001).

Хотя все вычисленные значения .2 имеют высокий уровень значимости, но, безуслов­но, по этому показателю лидирует с подавляющим превосходством область глаз как для всей выборки, так и для подвыборок мужчин и женщин. Различия между областями носа и рта являются значительно меньшими по сравнению с их отличием от области глаз.

Следующий интересный факт касается половых различий. Для всех областей лиц зна­чения .2 у женщин выше, чем у мужчин: для области глаз на 8,7, для области носа – на 5,7 и для области рта – на 34,1%. Эти данные показывают превосходство женщин в способности опознания лиц в данных условиях. Кроме того, можно заметить, что у мужчин и женщин соотношение величин .2 для носа и рта являются противоположными: мужчины несколько лучше опознают лица на основе носа, а женщины – на основе рта.

Эти предварительные выводы могут быть проверены и дополнены более традици­онным статистическим анализом данных о процентах правильных ответов. Для этого проводился трехфакторный дисперсионный анализ с одной межсубъектной переменной «пол» и двумя внутрисубъектными переменными «часть лица» и «опыт» (5 уровней). Неуправляемая переменная «возраст» рассматривалась как ковариата.

Значимые эффекты были обнаружены для фактора «часть лица» (F = 11,421, d.f. = 2, p < 0,001) и фактора «опыт» (F = 13,095, d.f. = 4, p < 0,001). Различий в точности опознания лиц между испытуемыми мужского и женского пола обнаружено не было. Влияние кова­риаты «возраст» на точность опознания не является существенным.
Проверка значимости различий между частями лиц с помощью критерия множе­ственных сравнений Бонферрони обнаружила существенные различия между областью глаз и областью носа (p < 0,001), областью глаз и областью рта (p < 0,001). Различия между областью носа и областью рта не являются значимыми.

Таким образом, результаты дисперсионного анализа подтверждают основную гипоте­зу, свидетельствуя о том, что опознание лиц по области глаз существенно лучше (правиль­нее) по сравнению с опознанием лиц по другим частям лица.

Насколько значимым оказалось влияние научения на точность опознания (см. рис. 3)? Парные сравнения между разными парами последовательных опытов показали существен­ные различия для всех 10 пар опытов (в восьми случаях при p < 0,001, в одном случае при p < 0,01 и в одном случае при p < 0,05). В целом по трем частям лица зависимость меж­ду точностью опознания и номером опыта является скорее линейной (F = 27,862, d.f. = 1, p < 0,001), чем нелинейной.

Из всех возможных взаимодействий факторов значимым является лишь взаимо­действие факторов «часть лица» и «опыт» (F = 3,605, d.f. = 8, p < 0,001). На рис. 3 пред­ставлены зависимости процента правильных опознаний от номера опыта для трех частей лица.

Глядя на рисунок зависимости про­цента правильных ответов от номера опыта (рис. 3), можно увидеть большое отличие этой зависимости для области глаз по сравнению с изменением точности опознания лиц для области носа и области рта, которые практически одинаковы. Для уточнения этих выводов проводилось два дополнительных дисперсионных анализа: один для области глаз, другой для области носа и области рта.

Рис. 3. Зависимость точности опознания лиц от номера опыта для трех частей лица

Однофакторный дисперсионный анализ точности опознания для области глаз показал, что фактор «опыт» в целом не является значимым, хотя анализ парных раз­личий выявил более сложную картину: 1) процент правильных опознаний в первом опыте был существенно ниже, чем в последующих опытах; 2) во втором и третьем опытах точ­ность опознания хуже только по отношению к пятому опыту; 3) не обнаружено различий в точности опознания между вторым, третьим и четвертым опытами.

Двухфакторный дисперсионный анализ, проведенный для области носа и области рта, показал незначимость фактора «часть лица» и большую значимость фактора «опыт» (F = 11,981, d.f. = 4, p < 0,001), а также незначимость взаимодействия фактора «часть лица» и фактора «опыт». Парные сравнения между опытами выявили существенные различия между всеми опытами (в большинстве случаев p < 0,001 и в одном случае p < 0,01). Для зависимости точности опознания от номера опыта наиболее существенной оказалась ли­нейная функция (F = 21,247, d.f. = 1, p < 0,001).

Таким образом, хотя от опыта к опыту происходило более заметное улучшение опо­знания для наименее существенных частей лиц (рот и нос), но их отставание от области глаз не исчезло и было статистически значимым после пяти последовательных опытов. К сожалению, мы не нашли в литературе сравнимых данных по научению в задачах опо­знания лиц, но в одном из часто цитируемых исследований было показано, что интенсив­ная тренировка в таких задачах оказывается малоэффективной (Woodhead et al., 1979; см. также: Bond, McConkey, 1995). Вероятно, способность людей использовать информа­цию из области глаз для опознания лиц действительно находится вблизи максимально воз­можного («потолочного») уровня.

Анализ данных по времени реакции.

Для статистического анализа времени реакции использовался трехфакторный дис­персионный анализ, в котором внутрисубъектными факторами были «часть лица» и «опыт», а межсубъектным фактором – фактор «пол». Фактор «возраст» выступал как ковариата.

Зависимая переменная – время реакции (мс) – определялась как среднее значение, определяемое на основе медиан по времени реакции всех правильных ответов каждого ис­пытуемого в каждом опыте (использование медиан необходимо для устранения влияния случайных экстремальных значений).

Оба внутрисубъектных фактора оказывают значимое влияние. Фактор «часть лица» оказался более значимым (F = 12,166, d.f. = 2, p < 0,001), чем фактор «опыт» (F = 5,025,
d.f. = 4, p < 0,01). Опять-таки половые различия не были обнаружены. И ни одно из взаимо­действий (двойных и тройных) не было значимым.

На рис. 4 представлены зависимости времени реакции от номера опыта для трех ча­стей лица. В целом эта зависимость оценивается как линейная (F = 6,958, d.f. = 1, p = 0,017) и как квадратическая (F = 4,852, d.f. = 1, p = 0,042).

На рис. 4 видно, что время реакции для каждой части лица уменьшается от опыта к опыту. Парные сравнения (с по­мощью критерия Бонферрони) между уровнями фактора «опыт» обнаруживают существенные различия первого опыта от всех остальных опытов и второго опыта от всех остальных опытов, в то время как тре­тий, четвертый и пятый опыты существен­но не отличались друг от друга по времени реакции.

Парные сравнения между частями лиц показывают существенно более бы­стрые ответы для области глаз (p < 0,001) и практически одинаковое время реакции для области носа и области рта.

Следовательно, данные по времени реакции убедительно свидетельствуют о том, что опознание лица на основе области глаз происходит быстрее (среднее время 2,19 с), чем на основе области носа (среднее время 2,77 с) и области рта (среднее время 2,76 с), т. е. опознание лиц по области глаз происходит почти на 600 мс быстрее. Важно также отметить, что это пре­имущество для области глаз сохраняется с первого по пятый опыт у всех испытуемых незави­симо от пола. Следовательно, по хронометрическим данным мы вообще не видим уменьшения преимущества области глаз по сравнению с другими частями лиц по ходу процесса научения.

Таким образом, на основании полученных результатов можно сделать следующие вы­воды:

  1. Разные части лица вносят неодинаковый вклад в процесс опознания лиц. Из трех срав­нивавшихся частей лица наибольший вклад в процесс его опознания вносит область глаз.
  2. Опознание лиц на основе области глаз происходит значительно быстрее, чем на основе других частей лица.
  3. В процессе научения преимущество области глаз по сравнению с другими частями лиц не устраняется.
  4. Заметное влияние научения на скорость опознания на основе разных частей лиц обнаруживается только в первых двух опытах.

 

Литература
  1. Барабанщиков В. А. Восприятие выражений лица. М.: Институт психологии РАН. 2009. 448 с.
  2. Мещеряков Б. Г. Фейс-символы как психологические орудия // Культурно-историческая психология. 2006. № 1. С. 11–17.
  3. Ярбус А. Л. Роль движений глаз в процессе зрения. М.: Наука, 1965. 166 с.
  4. Bahrick H. P., Bahrick P. O., Wittlinger R. P. Fifty years of memory for names and faces: A cross-sectional approach // Journal of Experimental Psychology: General. 1975. Vol. 104(1). Р. 54–75.
  5. Bond N. W., McConkey K. M. Information Retrieval: Reconstructing Faces // Psychology and Policing / Eds. N. Brewer, С. Wilson. Hillsdale, New Jersey: Lawrence Erlbaum Associates, 1995. P. 101–117.
  6. Corenblum B., Meissner C. Recognition of faces of ingroup and outgroup children and adults er // Journal of Experimental Child Psychology. 2006. Vol. 93. P. 187.
  7. Davies G., Ellis H., Shepherd J. Cue saliency in faces as assessed by the «Photofit» technique // Perception. 1977. Vol. 6(3). P. 263–269.
  8. Ellis H. D. Recognizing faces // British Journal of Psychology. 1975. Vol. 66(4). P. 409–426.
  9. Ellis H. D. Theoretical aspects of face recognition // Perceiving and Remembering Faces / Eds. G. Davies, H. Ellis and J. Shepherd. London: Academic Press, 1981. P. 171–198.
  10. Fraser I., Parker D. Reaction time measures of feature saliency in a perceptual integration task // Fraser I., Parker D. Aspects of face processing / Eds. H. D. Ellis. New York: Springer Science & Business. 1986. P. 105–120.
  11. Janik S. W., Rodney A. W., Goldberg M. L., Dell’Osso L. F. Eyes as the center of focus in the visual examination of human faces // Perceptual and Motor Skills. 1978. Vol. 47(3. Pt. 1). P. 857–858.
  12. Simpson W. E., Crandall S. J. The perception of smiles // Psychonomic Science. 1972. Vol. 29(4-A). P. 197–200.
  13. Woodhead M. M., Baddeley A. D., Simmonds D. C. V. On Training People to Recognize Faces // Ergonomics. 1979. V. 22(3). P. 333–343.
  14. Zhao W., Chellappa R., Phillips P. J., Rosenfeld A. Face Recognition: A Literature Survey // ACM Computing Surveys. 2003. Vol. 35(4). P. 399–458.

http://psyjournals.ru/exp/2010/n3/32128_full.shtml

Добавить комментарий

Please log in using one of these methods to post your comment:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s