Библиотека маркетолога

Нелукавые цифры: Росстат РФ как ресурс для решения широкого круга практических задач

Дмитрий Фролов research&trends

Трудно найти более известный источник информации, чем Росстат РФ (ранее, Госкомстат). Тем не менее, его возможности, как представляется, недооценены практиками. Отчасти это связано с предубеждением по отношению к возможностям госорганов, как таковых. Однако предвзятость рождает незнание, а незнание – нежелание разобраться. Получается замкнутый круг. Попробуем, если не разорвать его, то хотя бы «надорвать».

Материалы Росстата РФ находятся в открытом доступе на сайте www.gks.ru. Правда, это не все, чем богато главное статистическое ведомство нашей страны, а лишь его «видимая» часть. Детализированная информация находится на сайте www.multistat.ru, также принадлежащем Росстату, и предоставляется на платной основе. Тем не менее, того, что можно получить бесплатно, очень часто бывает достаточно для решения широкого круга практических задач.

Разумеется, нельзя претендовать на то, чтобы в одной небольшой заметке описать все или хотя бы значительную часть таких задач. Сделаем это здесь на примере лишь одного типа данных, касающихся демографических характеристик населения России.

Демографические параметры населения - это чуть ли не единственные хорошо наблюдаемые параметры, поэтому как бы разработчики различных метрик ни критиковали их использование, пол и возраст всегда будут актуальны. Кроме того, эти показатели удобно использовать для выявления тех или иных трендов и составления прогнозов. На сайте Росстата есть несколько срезов демографических показателей. Прежде всего, конечно, общие параметры: численность, разбивка населения по полу и возрасту, выделение городского и сельского населения, а также типы поселений.

Все это кажется просто и даже очевидно, но это не так. Скажем, население страны составляет все-таки свыше 140 миллионов человек, а не восемь миллионов, как это порой можно услышать в эфире популярных медиа. А сколько у нас городов миллионников? Да-да, тех самых, на которые так любят направлять свою рекламу бренд-менеджеры? Еще несколько лет назад их было девять, а теперь – 15. И, кстати, городов 500 тыс. + ненамного меньше - их 21. Доступные для бесплатного скачивания данные Росстата о численности населения всех российских городов 100 + на 1 января 2015 года здесь.

Анализ динамических рядов изменения демографических показателей может быть весьма полезен, например, когда надо упростить задачу и принять то или иное допущение. Так, как это следует из приведенного ниже графика, соотношение мужчин и женщин представляет собой довольно устойчивый комплекс, во всяком случае, на временных отрезках 5 – 10 лет. Значит, в соответствующих задачах можно не учитывать вариации этого параметра, что часто бывает весьма трудоемко.   

Средняя продолжительность жизни мужчин и женщин в России

Источник: Росстат РФ

Помимо констатации ситуации, Росстат составляет прогнозы, учитывая как оптимистические, так и пессимистические сценарии развития событий.

Средняя продолжительность жизни в России, прогноз

Источник: Росстат РФ

Как следует из диаграммы, во всех вариантах продолжительность жизни будет расти, а значит… А значит население будет стареть, если не будет в достаточном количестве рождаться маленькие россияне. Судя по всему, наши сограждане в этом смысле не проявляют сознательность: рождаемость падает.

Динамика изменения численности отдельных групп населения РФ

Ордината: численность, тыс. чел.

Источник: Росстат РФ

Тренд старения очевиден и совпадает с мировыми тенденциями. Однако, в целом, обвального падения численности населения в России нет. Почему? Да потому, что люди могут не только рождаться в стране, но и приезжать. Действительно, миграция сегодня стала важным фактором, который нельзя не учитывать, в т.ч. и в маркетинговых планах. Вот, взгляните.

Динамика общего прироста населения РФ и его составляющих

Источник: Росстат РФ

Возможность детального измерения размеров групп населения, как в возрастных, так и в географических срезах очень важна для составления выборок, особенно при использовании интернет-панелей. Экстраполирование данных – процесс тонкий, если сделать слишком грубое допущение или «неровно сшить» одну выборку с другой, легко можно получить искаженную генеральную совокупность, по которой, собственно, и формируются квоты панели. Пример того, что может произойти разобран нашей уже довольно старой статье. В случае, когда одна уважаемая исследовательская компания проводит измерения с ограничением по возрасту 15 – 54 года, а вторая, не менее уважаемая изучает 18 – 60+, оказывается, что такие, казалось бы, незначительные изменения в возрастных границах аудитории приводят к заметному перераспределению долей лидеров рынка. Открывающиеся возможности для манипуляций – как случайных, так и преднамеренных - не требуют комментариев. Между тем, исходные данные в Росстате есть, причем, возрастные группы можно при желании выделить с точностью до года.  

Работая с данными Росстата надо иметь в виду, что данные выкладываются в публичное поле не одномоментно, а по мере обработки. Это приводит к тому, что близкие по тематике таблицы, расположенные в разных отделах, могут иметь различную актуальность, различающуюся на 6 – 12 месяцев. Это дает возможность, с одной стороны, уточнить данные более старой таблицы, с другой может стать источником случайной погрешности, которая, впрочем, редко бывает значительной.

Что касается точности измерений, то она представляется достаточной для подавляющего класса задач, встающих перед маркетологами. Известная критика систематических погрешностей Всероссийских переписей, на наш взгляд, вполне компенсируется огромной незаметной работой сотрудников Росстата по обработке и досчету эмпирических данных, включая разного рода интерполяции. Заметим, что речь идет не о целенаправленных манипуляциях с данными, связанными с политическим или иным заказом, а о научно обоснованных методиках расчетов. Точность вообще не может быть самоцелью, фетишем, она должна быть контролируемой и соответствующей заданным стандартам. Что и происходит.