Представляем данные традиционного ежегодного исследования активной аудитории социальных сетей в России за октябрь 2020 года от Brand Analytics.
Как собирали данные
Традиционно у пользователей вызывает вопрос методология оценки, поэтому рассказываем, как анализировали данные. Brand Analytics собирает и индексирует все публичные сообщения социальных сетей на русском, татарском, украинском, казахском и некоторых других языках, а также данные их авторов. В рамках этого исследования были проанализированы более 2,5 млрд сообщений в соцмедиа за октябрь 2020 года от более чем 298 млн аккаунтов.
Для выделения данных по стране по каждой соцсети учтен процент гео-определения: количество сообщений, у которых имеются данные по географии, поделены на процент сообщений с геоданными. Аналогично для авторов.
Для определения географии: взяты данные из профилей авторов, геометок сообщений, а также текстов сообщений. Геословари для всех соцсетей уникализированы и расширены всеми вариантами написания топонимов, в том числе «пользовательскими».
Для определения пола: взяты данные из профилей авторов и дополнены данными по полу, полученными с помощью лингвистического анализа имени и фамилии автора.
Для определения возраста взяли данные из открытых профилей авторов.