Статья содержит описание нового междисциплинарного подхода к сбору индивидуальных психологических, поведенческих и языковых данных в социальных сетях. В описываемой
методологии личные данные пользователей социальных сетей (так называемые «цифровые
следы», “digital footprints”) собираются с помощью специальных программ и онлайн-приложений. Как правило, участники также заполняют психологические опросники, встроенные
в такие приложения. Психологические переменные могут сопоставляться с указанной доступной информацией о поведении пользователей в социальной сети. Все эти данные, получаемые на многотысячных выборках, могут не только анализироваться с помощью классических статистических методов, но и использоваться для построения предсказательных моделей
с помощью алгоритмов машинного обучения. Таким образом, психологические переменные
(например, личностные особенности, уровень субъективного благополучия и др.) и социально-демографические характеристики могут предсказываться только на основе открытых данных пользователей социальных сетей — текстов, подписок на сообщества и т.п., что является
совершенно новым способом получения информации о респондентах. В таких исследованиях, как правило, участвуют психологи, веб-программисты, а также специалисты по компьютерной лингвистике, анализу данных и машинному обучению. Обсуждаются преимущества
и ограничения этой методологии, описаны конкретные подходы к сбору и обработке данных.
Представлены некоторые результаты работы пионеров этого направления исследований —
участников британского (“Mypersonality.org”) и американского (“World Well-Being Project”)
проектов, наиболее масштабно использующих рассматриваемый подход.
SOCIAL NETWORKS AS A NEW ENVIRONMENT FOR INTERDISCIPLINARY STUDIES OF HUMAN BEHAVIOR
The paper describes a new approach to collecting individual psychological, behavioral and language
data from online social networks. Within this approach, personal data (“digital footprints”) are collected
by means of special programs and web-applications that are embedded in social networks interfaces
or otherwise connected with them. Usually, users provide additional information by answering
questions of online surveys embedded in such applications. Psychological variables can be then associated
with online behavioral data and other available information. The data of thousands of users
can be not only analyzed with traditional statistical methods, but can also be used to build predictive
models with machine learning algorithms. Thus, psychological characteristics (personality traits, wellbeing,
etc.) and demographical data can be predicted based on public user information — wall posts,
page likes, etc., which is a completely new approach to data collection. Such research projects usually
involve multidisciplinary teams of psychologists, web developers, computational linguists and data
scientists. Advantages and limitations of this methodology are discussed, as well as the methods of
data collection and processing and predictive models building. Key findings of the pioneers of this
research direction are presented. These are the findings of the British project “Mypersonality.org” and
the USA-based project “World Well-Being Project”. Both are employing the described methodology
quite massively