Медиаисследования: немного подробнее
Алексей Балабанов Из материалов журнала "Индустрия рекламы", //www.ir-magazine.ru
Лет пять назад термин "медиаисследования" был довольно экзотическим понятием у нас на рынке. Какие уж там исследования, если реклама подавалась по принципу: "Хочу минуту в "Поле чудес"!" Сейчас, пусть со скрипом, но ситуация меняется. Исследования становятся действительно востребованными не только по причине необходимости "красивой упаковки" для рекламного бюджета. Рынок постепенно делается все более прозрачным и требует понятной и приемлемой для всех системы координат. Но исследования не были бы исследованиями, если б все было просто.
Для начала есть смысл разделить исследования медиа на два вида:
-
1. Исследования популярности медиа (рейтинги и прочие медиаданные (МД), собственно и называемые медиаисследованиями (МИ).
МИ базируются в основном на социологических исследованиях, следовательно, их достоверность такая же, как и достоверность любого социологического исследования (зависит от объема выборки, репрезентативности последней, методики исследования etc.).
2. Мониторинг (и не только) рекламы в медиа.
Мониторинг - фиксирование выходов + измерение объемов + оценка затрат по официальным прайс-листам.
Многие МИ невозможны без точного мониторинга
TV - реальное время выхода передачи может отличаться на часы. Особенно это актуально в нашей стране, где имеют место быть: 10 часовых поясов, волюнтаризм местных ретрансляторов, обрезка рекламы. Поэтому опрос "смотрел - не смотрел" должен четко коррелировать с реальным временем выхода передачи (рекламы).
Пресса - региональные варианты центральных изданий заметно отличаются от центральных. К примеру, "Аргументы и факты" или "Комсомольская правда" имеют свои вкладыши почти в каждом регионе.
Радио - сеть, отнюдь не значит полная ретрансляция, даже наоборот. На местах выбирают "коронку" из центрального вещания, а остальное заполняют тем, что нравится местной редакции (и это правильно).
ПАНЕЛЬ (panel)
Группа людей, отобранная для проведения исследования. Суть панельного исследования состоит в том, чтобы непрерывно получать в течение некоторого периода времени информацию от каждого из членов панели. При помощи панельных исследований изучается теле- и радиоаудитория. Информация может собираться при помощи дневников, а в случае измерения телевизионной аудитории при помощи специальных приборов - people meter.
Когда, кого, как долго
Если классифицировать медиаисследования, то существует ряд "полочек", по которым их можно разложить. Итак, полка номер один - периодичность. Есть разовые, волновые и непрерывные исследования. Первые проводятся только один раз, и все. Волновые, соответственно, - "волнами", обычно с равными промежутками времени между волнами и с периодичностью, как правило, не чаще раза в квартал. Непрерывные же проводятся постоянно в течение длительного промежутка времени (годы). Исследования любой периодичности имеют свои четкие границы применимости, но об этом дальше.
Следующая полочка - способ получения данных, то есть тот метод, с помощью которого добыта информация. Они бывают опросные, когда респондента опрашивают способом интервью, дневников, анкет. В любом случае в опросе так или иначе принимает участие интервьюер. Другой тип - аппаратные. Здесь все происходит автоматически. Человек полностью исключен из процесса опроса, респондент взаимодействует с прибором, который и снимает данные о его поведении.
Опросные методы проще и дешевле. Мы, кстати, сами порой применяем их, даже не догадываясь об этом. Когда вы спрашиваете знакомых: "Ты смотрел XXX?" или "Ты читал вчера YYY?", то, собственно, занимаетесь, по сути, тем же, что и КОМКОН с Gallup, только они действуют в куда больших масштабах.
Но опросные методы имеют один недостаток - человеческий фактор. Мы ведь часто после вопроса: "Ты читал вчера YYY?" говорим: "А зря, почитай!", что уже является давлением на респондента. Кроме того, людям свойственно работать медленно, ошибаться, быть подверженными смене настроений, иметь различные моральные качества, наконец. Все это не может не влиять на получаемые исходные данные. Аппаратные методы, так называемые "пиплметры", очень дороги. Прибор стоит порядка 800 USD, а то и больше, его надо обслуживать, а главное - снимать с него данные.
Проще всего это делать по телефону. Но это тоже проблема. Телефонизация-то у нас хоть и массовая, но не поголовная. Кроме того, респондентов очень трудно контролировать. Включил я телевизор, убрал звук в ноль и... заснул, а прибор продолжает фиксировать, что я смотрю телевизор, пока он не отключится сам или я не проснусь. Если я спал часов пять, то математики это отловят и "сделают мне козу". Если же прикорнул на часок во время тягучей слезливой мелодрамы - то фигушки.
Все эти недостатки компенсируются одним неоспоримым достоинством - данные получаются очень быстро (даже в момент просмотра передачи) и с очень высокой точностью (в принципе, можно разложить аудиторию ролика хоть по секундам).
Еще одна важная "полочка" в классификации - длительность отношений с респондентом. Медиаисследования бывают: панельные (респондент опрашивается регулярно в течение какого-то срока) и с переменным составом респондентов (в выборке каждый раз участвуют новые люди).
Эта позиция характерна в основном для непрерывных (реже волновых) исследований. Характерным примером панельных медиаисследований может служить TV-метрическая панель Gallup Media. Пример исследования с переменным составом респондентов - телевизионные измерения ФОМ (сейчас они не проводятся).
Основным достоинством панельных МИ является дешевизна. Панель существует очень долго, время жизни респондента в ней может быть от нескольких месяцев до нескольких лет. На подбор респондента в панель мы тратимся только один раз, тогда как при полном обновлении выборки мы каждый раз должны тратиться на подбор респондентов. Почему? Об этом - чуть позже.
Кроме того, в панельных исследованиях респондент обучается выполнять свои обязанности в панели (регистрация в пиплметрии, заполнение дневников etc.) достаточно быстро. Значит, меньше расходы на контроль. При переменном составе респондентов присутствие интервьюера почти всегда обязательно.
Как водится, недостатки - продолжение достоинств. "Старый" респондент частенько начинает "халтурить" (например, заполняет дневник раз в два-три дня или за всех членов домохозяйства дневники заполняет один человек). С этим приходится бороться. Кроме того, панель несколько сложнее поддерживать с точки зрения репрезентативности.
PEOPLE METER
Прибор, позволяющий регистрировать просмотр телевизора каждым из членов телевизионной панели. Приборы устанавливаются на каждый телеприемник в семье, принимающей участие в исследовании. Они круглосуточно фиксируют просмотр телеканалов. У прибора есть пульт дистанционного управления, на котором для каждого члена семьи выделена отдельная кнопка. Участники исследования нажимают свою кнопку каждый раз, когда входят и выходят из комнаты, где находится включенный телевизор.
Правильный выбор
Репрезентативность. Что это за штука и с чем ее едят? Если вы хотите, чтобы данные действительно отражали медиапредпочтения ВСЕГО населения, то совсем недостаточно опросить просто домохозяек или старушек у подъездов. Логично предположить, что старушки и их юные внуки смотрят несколько разные телепередачи и читают не одни и те же газеты.
Значит, нужно выяснить мнение всех социально-демографических групп населения.
Старая восточная мудрость гласит: "Чтобы узнать вкус дыни, не обязательно есть ее целиком", что совершенно справедливо и для социологии. Но... при этом надо знать, как отрезать кусочек.
На примере с дыней. Если мы отрежем кусочек вдоль "экватора" дыни, то ничего не сможем узнать о вкусе возле "полюсов". А вот если мы вырежем ломтик в меридиональном направлении, то весь спектр вкуса будет к нашим услугам. Осталось только не спеша попробовать и написать отчет. Социолог скажет, что такой ломтик был репрезентативен относительно "меридионального распределения вкуса дыни", т.е. в ломтике представлены все пояса вкуса в той же пропорции, что и в самой дыне.
Точно так же и в социологии. Нам нужна выборка, в которой все группы населения представлены пропорционально их распределению в генеральной совокупности (в нашем случае генеральная совокупность - это все те, кого мы хотим исследовать).
Важно! Генеральная совокупность (ГС) обязательно (!!!) должна описываться в заголовке любого исследования в явном виде. Например, "все население региона старше 13 лет" или "городское население региона старше 10 лет". Если этого нет, мы не знаем границ применимости полученных цифр.
Таким образом, если у нас в ГС 12% неработающих женщин, то и в выборке обязано быть 12%, если в ГС водителей автобусов 0,8%, то и в выборке должно быть столько же.
Отсюда следует интересный вывод: "Ни одна выборка не является абсолютно репрезентативной!" Не думаю, что где-нибудь существует выборка, репрезентативная по цвету глаз респондентов или по форме ушей. Это просто никому не нужно. А вот репрезентативность по наличию домашних животных не помешала бы. Поэтому всегда указывают, относительно каких параметров репрезентативна выборка.
Важно! В описании выборки любого исследования обязательно (!!!) должна присутствовать фраза: "...выборка, репрезентативная по..." (далее - набор социально-демографических параметров).
Как отделить просо от пшена
Ну вот, с репрезентативностью разобрались. Теперь о том, как ее добиться. Есть два основных способа: абсолютно случайная выборка и квотная выборка.
Представьте себе корзину, в которой равномерно перемешаны шарики трех разных цветов и самых разных размеров. Нам нужно узнать средний размер шариков каждого цвета. Мы зачерпываем горсть шариков (это и будет случайная выборка). Сортируем по цвету, измеряем размер каждого и вычисляем средние по цветам. Но это только в том случае, если шарики очень хорошо перемешаны. Если нет - возможны проблемы.
Та же история, но мы знаем процентное содержание шариков каждого цвета (квоту) в корзине.
Мы можем наугад отобрать по № 1, № 2, № 3 (пропорционально их квотам) шариков каждого цвета (это и есть квотная выборка), измерить и получить среднее по цветам. Так, конечно, надежнее, нет нужды думать о степени перемешанности по цвету. Только нужно знать квоту каждого цвета.
Но это все теория. Дело в том, что люди все-таки не шарики в ведре, поэтому в реальной жизни очень трудно добиться абсолютной случайности. Поток пешеходов на улицах имеет довольно строгую закономерность, в зависимости от времени суток, конкретной точки, погодных условий и еще кучи факторов. Расселение жильцов по квартирам тоже довольно закономерно. Случайную выборку получить крайне трудно. Приходится сильно исхитряться.
Наиболее применяем на практике комбинированный метод - случайная, квотная выборка. Это когда сначала делают случайную выборку, потом проверяют в ней квотность, а затем компенсируют нарушения квотности тем или иным способом. Об этих способах придется говорить отдельно, поскольку это очень тонкое место, а главное, сильно влияющее на результаты исследований.
Птак, описание выборки мы теперь можем представить так: случайная, квотная выборка, репрезентативная по... (набор социально-демографических параметров).
О социально-демографических параметрах мы поговорим в следующий раз. А пока, в заключение, небольшое замечание относительно экономики.
Уже сейчас ясно, что только для построения сколько-нибудь обширной выборки необходимо приложить достаточно много усилий. Если же говорить о построении панели, то усилий еще больше (поддержание, контроль, компенсация естественной убыли). А по электронным СМИ можно проводить только панельные исследования (если вы хотите, чтобы информация имела хоть какую-нибудь практическую ценность). Таким образом, очевидно, почему получение медиаданных - удовольствие не из дешевых.
ДНЕВНИК (diary)
Метод исследования, при котором респонденты в течение некоторого времени (от недели и дольше) заполняют специальные дневники. В дневниках может фиксироваться информация о просмотре телепрограмм или прослушивании радиостанций и т.п.
Глобальный передел
Итак, если исходить из того, что нам необходимо получить репрезентативную выборку, то не мешало бы определиться с параметрами, если мы говорим об исследованиях СМИ. В порядке убывания значимости их можно расположить в следующем порядке:
- Пол.
- Возраст.
- Социальное положение.
- Образование.
- Душевой доход.
Предвидя критику, сразу оговорюсь. Душевой доход поставлен на последнее место не потому, что имеет наименьшую значимость, а потому, что данные по доходам не всегда корректны. Что можно поделать с категоричным нежеланием российских граждан делиться информацией о доходах. Респонденты частенько врут, и врут безбожно, самое забавное, что как в ту, так и в другую сторону. Но это еще не все. Есть и объективные трудности. Во-первых, необходимо знать не просто доход, а долю общего дохода домохозяйства, приходящуюся на каждого его (домохозяйства) члена, или душевой доход. Когда речь идет о панели, эта проблема разрешима. А вот когда исследование разовое, да в нем еще принимает участие только один из членов домохозяйства, то ошибка в определении душевого дохода обычно очень существенна. Вот почему разовые исследования так часто расходятся с панельными именно в данных по доходам. Естественно, рекламистам важно знать эту характеристику как можно точнее, но ничего не поделаешь, приходится смириться. Во-вторых, наше общество чрезвычайно социально мобильно. Если сегодня человек работает на достаточно денежной работе, то завтра может ее потерять или устроиться на еще более денежную. Сообщить это интервьюеру зачастую забывают, пока интервьюер не заметит изменений в быте домохозяйства. Но это все относится только к дневниковой панели. Для пиплметрической же панели это вообще почти невозможно отследить.
Теперь пара слов об остальных параметрах. Пол и возраст - очевидно. Социальное положение важно прежде всего потому, что определяет круг общения, который зачастую сильно влияет на медиапредпочтения. Образование, само собой, опять же определяет медиапредпочтения, но в меньшей степени, чем круг общения. Таким образом, мы получили ранжированный список социально-демографических параметров.
Детальная проработка
Помимо параметров нам нужно определиться с социально-демографическими характеристиками аудитории. Это те же самые характеристики аудитории, что и для генеральной совокупности, но разложенные по параметрам.
Покажем это на примере рейтинга, но сперва повторим его определение (на всякий случай, вдруг кто не знает, в частности, не читал № 02(04) 16-31 января 2002 "Индустрии рекламы").
Рейтинг - отношение числа людей, ответивших положительно на вопрос о просмотре передачи (чтении газеты и пр.), к объему выборки, выраженное в процентах.
Иными словами, если мы опросили 1000 человек и 253 сказали нам, что вчера смотрели программу "Время", то рейтинг вчерашнего "Времени" - 253/1000 = 25,3%.
А вот теперь рейтинг того же "Времени" среди мужчин - 152/480 = 31,7% (если, к примеру, мужчин в популяции 48%, а ответили положительно, допустим, 152).
Рейтинг среди женщин соответственно - 101/520 = 19,4%.
По аналогии мы можем определить все социально-демографические характеристики данной передачи. Для чего это нужно - чуть позже. А пока небольшое лирическое отступление.
Часто можно встретить такое определение рейтинга "Рейтинг - отношение числа смотревших передачу к объему генеральной совокупности". Так вот, это неверное определение. Судите сами, подобным образом можно определить рейтинг только путем референдума (всенародного опроса).
А его вряд ли под силу провести даже самой крупной компании. Кроме того, подобное определение как бы исподволь внушает нам, что рейтинг является характеристикой всей генеральной совокупности.
Фигушки! Рейтинг характеризует только нашу выборку, а в каких взаимоотношениях он находится с генеральной совокупностью, зависит от того, насколько наша выборка репрезентирует ГС, от методики исследования, объема выборки и т.д.
Зачем это нужно?
Продолжаем разговор. Для чего нужны социально-демографические характеристики аудитории? Да в первую очередь для нас, рекламистов. Если вы сможете формализовать вашу целевую аудиторию (например, домохозяйки 20-50 лет), то сможете вычислить рейтинг (и не только) в этой целевой аудитории, а следовательно, узнать, сколько же человек контактировало с рекламой. Как? Очень просто. Рейтинг в целевой группе (ЦГ) надо умножить на объем ЦГ. Получится число людей из ЦГ, смотревших данную передачу. Это называется проекцией рейтинга на население (в данном примере на ЦГ). Выражается эта величина обычно в тысячах человек и обозначается (OOO's).
И вот тут начинаются тонкости. Если мы возьмем ЦГ "мужчины и женщины в возрасте 16-20 лет, с высшим образованием", то, сами понимаете, рейтинг будет равен нулю. Не бывает таких (есть, конечно, вундеркинды, но их очень мало, и вряд ли они попали в выборку). К чему я клоню? К тому, что на очень мелких ЦГ медиаданные становятся некорректными. Тут самое время сказать о точности. Есть одно негласное, хотя абсолютно верное правило: "Нельзя опираться на мнение менее чем 70 человек!" Это очень удобное правило. Им крайне легко пользоваться. Видим рейтинг в 0,75%, знаем, что выборка 1000 человек, и прямо с порога этому исследователю говорим: ерунда, мол, это, а не рейтинг. Мало того, что положительно ответили только 7 человек, так ты еще где-то половинку человека разыскал - помер, что ли, во время просмотра? Откуда взялось это правило? Вообще говоря, его можно доказать с помощью методов теории вероятности. Но, позвольте, я делать этого не буду. Желающие возьмут учебник и... Теперь о половинке человека. Такое частенько случается с медиаметристами. И происходит это от особенностей расчетов, проводимых при получении медиахарактеристик. Эти особенности мы рассмотрим в следующей статье.
Так, на выборке в 1000 корректны рейтинги только более 7%. Все, что ниже, - "плюс минус два крокодила", как говорится. Очень, кстати, верное замечание. Но теория вероятности - наука хитрая. И математики уже давно (конец XIX в.) исхитрились мерить этих крокодилов. Называют они их, правда, "доверительным интервалом". Не углубляясь в подробности, скажу, что доверительный интервал расширяется (крокодилы больше) и при уменьшении рейтинга, и при уменьшении объема выборки. Да, такие рейтинги тоже несут некоторую информацию, однако доверять им можно только с некоторой оглядкой. Иными словами, если в волновом исследовании с выборкой 1000 у нас от волны к волне получается рейтинг издания около 0,75%, то, скорее всего, это именно так, если с этим изданием ничего серьезного не происходило. При этом смешно говорить, что рейтинг вырос с 0,75 до 0,76. Это все в пределах точности измерений.
Отсюда один интересный момент. Чем сильнее мы ограничиваем целевую группу пересечением социально-демографических параметров, тем менее точны в этой ЦГ рейтинги. Действительно, объем выборки в каждой социально-демографической группе меньше, чем во всей выборке, а в пересечении групп - еще меньше. Значит, в группе, представленной в выборке менее чем 70 респондентами, рейтинги никакого смысла не имеют.
Теперь мы можем сделать описание выборки, например, так: "В исследовании использована случайная, квотная выборка, репрезентативная по полу и возрасту. Объем выборки 1500 человек" и далее "Генеральная совокупность - все городское население Тверской области (города с населением более 100 000 человек)". Надеюсь, всем понятен смысл этого описания? В нем четко обозначены основные параметры исследования, позволяющие судить, подходят результаты этого исследования для решения наших задач или нет.
Такое исследование совершенно бесполезно для Белоруссии или Литвы (по географическому признаку), рекламному агентству из города Выдропужска (20 000 человек) для планирования рекламных кампаний в своем городе - тоже, а вот для кампаний, рассчитанных на всю область - вполне!