Новые боги. Как онлайн-платформы манипулируют нашим выбором и что вернет нам свободу

22
18
20
22
24
26
28
30

Прогноз станет еще точнее, если в статистическом анализе одновременно будет учитываться больше данных со смартфона. К примеру, лог-файлы содержат бесчисленное количество информации о звонках, и ее всю можно проанализировать. Взять хотя бы такие параметры, как продолжительность телефонных разговоров, количество входящих и исходящих звонков, количество различных людей, с которыми человек контактирует, или размер активной и пассивной социальной сети (под термином «активная социальная сеть» подразумеваются люди, с которыми человек регулярно общается). Эта информация представляет для нас интерес, поскольку многие хранят в памяти телефона номера, по которым уже давно не звонят.

Итак, теперь мы можем сопоставить и подвергнуть статистическому анализу все эти переменные одновременно и сделать предположения о характере человека или других его личностных качествах. В частности, мы можем применить статистический метод машинного обучения, чтобы объединить множество источников данных в одну статистическую модель. Здесь нужно вспомнить исследование Гокула Читтаранджана и отметить: несмотря на то что диагностика личности в его работе проходила несколько поверхностно, машинное обучение позволило значительно увеличить точность прогноза личностных характеристик, когда в единую статистическую модель подсчетов были собраны как оценки участников, так и данные, полученные со смартфона. После медианного разделения личностных переменных (например, разделения их на две группы по признаку экстраверсии/интроверсии)[289] точность предсказания характеристики достигла 75,9 %, а в случае черты «добросовестность» – 74,4 %. Иными словами, вероятность правильных прогнозов при оценке личностных черт на основе данных смартфона стала значительно выше, чем при подбрасывании монетки. Без медианного разделения, но с применением самых современных статистических методов и сбора со смартфона нескольких категорий данных (касающихся общения, прослушивания музыки, передвижений и так далее) у 624 участников исследования удалось достичь коэффициента корреляции 0,40[290].

Что же мы можем в итоге сказать о смартфоне как инструменте для диагностики личности? Психологи, говоря о научных работах, любят использовать образ трех слепцов из индийского фольклора, которые пытаются понять, что представляет собой легендарное животное – слон. Первый слепой ощупывает хобот и говорит, что он похож на змею. Второй, стоящий сбоку от слона, напротив, чувствует гигантскую стену. Третий, стоящий у хвоста, сообщает, что животное больше похоже на копье. Мораль сей басни такова: изучение отдельных элементов часто не позволяет увидеть картину целиком. Чтобы получить максимально точное представление о человеке, необходимо также изучить его поведение с разных сторон и как можно точнее зафиксировать интересующую нас переменную (в данном случае характер) с помощью психометрии. Исследование может быть успешным лишь в случае, если используются психометрически корректные и надежные опросники. Кроме того, рассматривая источники потенциальных ошибок в такой научной работе, нельзя не отметить, что не каждый респондент способен хорошо оценить свои личностные качества, поэтому вопрос, насколько полно тест отражает все аспекты внутреннего мира, остается дискуссионным.

В целом смартфоны – универсальный и мощный источник данных. Неудивительно, что они всё чаще задействуются в психологических исследованиях, а на основе лог-файлов ученым удается делать точные заключения по многочисленным психологическим переменным (таким как характер) и различным психопатологическим состояниям. Еще в 2012 году был опубликован «Манифест психологии смартфонов»[291], в котором предсказывались грядущие изменения в психологических исследованиях из-за широкого распространения смартфонов.

Если задуматься о том, сколько в современном телефоне датчиков, мы поймем, что, пожалуй, только начинаем осмыслять смартфоны как источник данных, особенно если учесть, как мало внимания им раньше уделяли психодиагностические исследования[292]. Например, психодиагностика могла бы рассмотреть, как переменные окружающей среды влияют на настроение человека, исходя из информации о яркости освещения или погоде. Допустим, если датчики фиксируют, что в помещении, где находится смартфон, светит солнце, участники исследования могут чувствовать себя бодрее[293].

Согласно устоявшимся в науке представлениям, большие данные можно охарактеризовать тремя V: объемом (volume), многообразием (variety) и скоростью (velocity). И один из ключевых вызовов для психоинформатики будущего – осмысленный подход к этим трем V.

Я и социальные сети

В начале главы я уже упомянул две работы, лежащие в основе психоинформатики. Помимо них, нельзя не упомянуть работу Михала Косински 2013 года[294]. Кстати, она сыграла важную роль в скандале с противозаконным использованием данных Cambridge Analytica: компанию обвинили в том, что она якобы манипулировала сознанием миллионов избирателей через соцсети во время кампании Leave.EU и президентских выборов в США (Хиллари Клинтон против Дональда Трампа). Я прочитал много публикаций об этом крупном скандале, в который была вовлечена компания Facebook Inc., и мне кажется, что всей правды мы никогда так и не узнаем. Несмотря на изложенные в книге «Mindf*ck» разоблачителя Кристофера Уайли доказательства[295], все еще невозможно подсчитать, сколько избирателей не пришло на выборы или проголосовало за выход Великобритании из ЕС из-за этих манипуляций (которые, безусловно, имели место)[296]; в английском языке это явление получило название «подавление избирателей» (voter suppression). По этой причине мне хотелось бы подробно разобрать, как с точки зрения психоинформатики на самом деле может выглядеть манипуляция пользователями через социальные сети.

Отправной точкой для моих дальнейших рассуждений станет научная работа Михала Косински и его коллег, в которой впервые были озвучены некоторые методы, позднее применявшиеся Cambridge Analytica. Здесь важно сразу отметить, что сам Косински не имел отношения к скандалу с незаконным использованием данных Cambridge Analytica. Тем не менее он, похоже, хорошо осознает далеко идущие последствия своего исследования. В интервью швейцарской газете Das Magazin Косински отметил: «Я лишь показал, что бомба замедленного действия существует»[297]. Но как именно она устроена?

Лично мне всегда легче понять научную работу в области психологии или нейронауки, если я ненадолго ставлю себя на место испытуемых, так что попробую «поучаствовать» в знаменитом эксперименте Косински. Итак, в качестве участника исследования со мной могло бы произойти следующее: сначала я бы получил сообщение в фейсбуке от рабочей группы Михала Косински с рекламой исследования под названием MyPersonality. Поскольку меня очень занимает тема личности, я бы с удовольствием принял участие в личностном тесте и заполнил бы онлайн-анкету. Хороший способ привлечь как можно больше людей – предложить им обратную связь, чтобы они узнали что-нибудь новое о себе. Звучит банально, но, если человек проходит анкету, значит, существуют и определенные критерии для оценки полученных результатов. Так что в качестве благодарности за участие в исследовании мне могли бы прислать разбор структуры моей личности. Например, сообщили бы, что я набрал 10 из 20 возможных баллов по параметру «экстраверсия». Поскольку не существует определенных границ «сильной экстраверсии» (или, наоборот, «сильной интроверсии»), группа ученых, с которой работаю я, в качестве обратной связи предпочитает отправлять участникам не только их результаты, но и данные по большим выборкам, которые позволят им сравнить свои результаты с результатами других людей.

Другой способ привлечь к исследованию побольше народа – заплатить каждому участнику. На мой взгляд, это худший вариант: не только потому, что он гораздо дороже, но и потому, что может пострадать качество данных. Вдруг кто-то примет участие в исследовании только «для галочки», чтобы заработать?

Для научного исследования Михала Косински удалось привлечь 58 466 человек: они не только заполнили онлайн-анкеты, но и позволили ученым соотнести эти данные с информацией из их профилей в фейсбуке. Такое количество респондентов заслуживает отдельного упоминания: многие исследования в области психологии сталкиваются с проблемой небольших выборок, которые часто состоят сплошь из жителей так называемых WEIRD-обществ (см. главу 2)[298]. Похоже, здесь нам наконец поможет психоинформатика: она позволяет работать с надежными выборками и привлекать разные группы людей[299].

После успешного сбора данных Михал Косински и его коллеги сосредоточились на изучении лайков, которые испытуемые ставят в фейсбуке, чтобы сделать прогнозы относительно их анкет. Ученые хотели определить, насколько хорошо отметки «Нравится» позволяют судить о социально-демографических переменных, таких как возраст и пол, и о психологических, вроде характера или уровня интеллекта. Почему именно лайки? Они содержат релевантную информацию о пользователях, поскольку люди обычно лайкают только то, что им действительно нравится. Таким образом пользователи фейсбука добровольно показывают операторам платформы, что им по душе, а что нет. Meta извлекла из этой информации немало прибыли. По схожему алгоритму работал Косински: на основании оставленных пользователями лайков его команда отбирала общие паттерны поведения, которые позволяли ученым строить гипотезы о характеристиках участников и относить их к той или иной категории. Приведу пример (не из исследования), который наглядно показывает, как может выглядеть отбор. Представим, что из комментария под постом в фейсбуке я узнал, что Нил Янг скоро выступит с концертами в Европе, а в другом комментарии прочел, что у Тейлор Свифт выходит новый альбом. Я бы лайкнул оба сообщения. На основании этого меня можно отнести в категорию «Любитель музыки». Такая категоризация, конечно, приводит к упрощению данных, но одновременно помогает лучше их отсортировать и проанализировать. Статистический анализ в работе Косински ожидаемо показал, что большее количество доступных для анализа лайков привело к повышению точности прогнозов по целевым переменным. Чем больше цифровых следов было доступно, тем легче авторам исследования было предсказать многочисленные психологические переменные. Но насколько точна эта информация?

Для начала отметим, что при проведении статистического анализа на одного пользователя в среднем приходилось около 170 лайков. Этого было достаточно для выявления дихотомических переменных – переменных из двух категорий, например пол (мужчина/женщина)[300]. В США политическая ориентация также была бы дихотомической переменной, так как, в отличие от Германии, там двухпартийная система (демократы против республиканцев). Еще один пример – употребление алкоголя (да/нет). Но вернемся к лайкам в фейсбуке и их предсказательной силе. Мужчину можно отличить от женщины на основе лайков с точностью 93 %. Также алгоритм смог правильно (85 %) классифицировать либералов и консерваторов. Точность определения сексуальной ориентации человека (гетеросексуал или гомосексуал) составила 88 % среди мужчин и 75 % среди женщин.

Как и в исследовании Гокула Читтаранджана, команда Косински попыталась описать структуру личности на основе данных смартфона. В лучшем случае предсказательная сила информации о лайках участников исследования составила 0,40 для показателя «экстраверсия» и 0,43 для личностной черты «открытость опыту». Здесь точность прогнозирования значительно снижается, так как речь идет не о дихотомических переменных, а о метрических конструктах. К метрическим конструктам относятся не только рост и вес человека, но и характер, который оценивается совокупностью целого ряда критериев.

Несмотря на более низкую предсказательную силу, все же удалось обнаружить умеренные корреляции между лайками и чертами личности. Чтобы вы могли лучше представить себе эти результаты, приведу конкретные примеры из работы Ву Ю Ю и ее коллег. Они пошли еще дальше и доказали, что информация о лайках позволяет описать характер участников исследования точнее, чем опросы друзей и партнеров[301]. Необходимо лишь достаточное количество лайков для анализа – и алгоритм справится на «отлично»!

В исследовании Ву Ю Ю и ее коллег экстраверты выделялись тем, что ставили больше лайков постам о вечеринках, танцах или, например, Снуки, звезде реалити-шоу в США. Люди с высокими показателями открытости ко всему новому с большей вероятностью ставили лайк публикациям о Сальвадоре Дали, о техниках медитации и о TED Talks, научных лекциях на ютубе, где эксперты излагают информацию по самым разнообразным темам примерно в течение 18 минут.

Думаю, интуитивно понятно, почему лайки обладают некоторой предсказательной силой при определении личностных качеств. Однако здесь снова необходимо отметить, что наблюдается лишь умеренная корреляция между тем, что человек лайкает, и чертами его личности, поэтому прогнозирование возможно только на групповом уровне. Как и в случае с исследованием Читтаранджана, о котором мы только что говорили, можно только предполагать, что лайки под постами на определенные темы указывают на чуть больший или чуть меньший уровень экстраверсии пользователя. Однако вероятность ошибочной психодиагностики на уровне отдельного человека все еще остается относительно высокой. Правда, рекламщиков это не тревожит, и я сейчас расскажу почему.

В последнее время появилось бесчисленное количество исследований, посвященных взаимосвязи между цифровыми следами пользователей фейсбука и их чертами личности. Теперь было бы полезно применить метааналитический подход. Метаанализ позволяет изучить корреляцию между рассматриваемыми переменными сразу во многих исследованиях по определенной теме.

В данном случае становится любопытно: насколько велика статистическая предсказательная сила различных цифровых следов в фейсбуке при определении характера человека?[302] Этот вопрос немного шире, чем работа Косински и его коллег, поскольку в ходе других исследований для прогнозирования личностных черт анализировались не только лайки. Научная литература по психоинформатике знает примеры, когда психологические переменные пытались определить по частоте публикаций и смены статусов и количествеу людей, с которыми общается пользователь. Это лишь несколько вариантов бесчисленных переменных.

Я был очень рад, когда мой итальянский коллега Давиде Маренго из Туринского университета получил стипендию и смог поработать в моей лаборатории в городе Ульм в течение нескольких месяцев. Поскольку зимние месяцы в Ульме всегда немного мрачные и очень туманные, у нас было достаточно времени, чтобы полностью сосредоточиться на наших исследовательских проектах.