Глава 9. Измерение и шкалирование: методы несравнительного шкалирования
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

После изучения материала этой главы вы должны уметь...

1. Дать характеристику методов несравнительного шкалирования; различать непрерывные и

детализированные рейтинговые шкалы и объяснить шкалы Лайкерта, семантического

дифференциала и Стэпела.

2. Комментировать решения, связанные с составлением детализированных рейтинговых шкал

по числу категорий шкал, в зависимости от сбалансированности или несбалансированно-

сти шкал, четности или нечетности количества категорий, принужденности или неприну-

жденности выбора, степени вербального описания и вида шкалы.

3. Комментировать критерии для оценки шкалы и характеризовать способы определения на-

дежности, достоверности и применимости.

4. Дать характеристику особенностей использования несравнительных шкал в международ-

ных исследованиях.

5. Понимать этические аспекты разработки несравнительных шкал.

6. Обсуждать использование Internet и компьютеров при применении непрерывного и дета-

лизированного рейтингового шкалирования.

КРАТКИЙ ОБЗОР

Как указывалось в главе 8, методы шкалирования разделяются на сравнительные и несрав-

нительные. Сравнительные методы — попарного сравнения, упорядочения, постоянной сум-

мы и Q-сортировки — обсуждались в предыдущей главе. В данной главе рассматривается метод

несравнительного шкалирования, включающий непрерывные и детализированные рейтинго-

вые шкалы, в том числе следующие известные детализированные шкалы: шкала Лайкерта, се-

мантический дифференциал, шкала Стэпела. Мы рассмотрим также разработку многомерных

рейтинговых шкал. Продемонстрированы техника проверки надежности и достоверности ме-

тодов шкалирования, процесс выбора исследователем необходимого метода. Представлены

также шкалы, полученные с помощью математических методов. Обсуждаются факторы, свя-

занные с применением несравнительных шкал на международных рынках, Определен ряд эти-

ческих проблем, связанных с созданием рейтинговых шкал. Глава завершается обсуждением

возможностей использования Internet и компьютеров при разработке интервальных и пунк-

тирных рейтинговых шкал. Глава начинается с рассмотрения некоторых примеров методов не-

сравнительного шкалирования.

I ПРИМЕР. Измерение эмоциональных пиков

РЕАС Media Research, компания из Торонто, разработала компьютер для упрощения ре- ;

1 гистрации эмоций участников фокус-группы (Program Evaluation Analysis Computer —

j РЕАС). Это портативный прибор с набором клавиш или циферблатом, регистрирующим от-

338 Часть II. Разработка плана исследования

веты от негативных до нейтральных и положительных. При просмотре рекламных шоу рес-

понденты нажимают соответствующие клавиши. Прибор позволяет записывать непрерыв-

ные и неискаженные оценки эмоциональных реакций членов фокус-группы. Прибор ис-

пользовался для измерения реакций на серию рекламных роликов McDonalds, и исследова-

тели обнаружили, что матери и их дочери по-разному реагировали на различные образы из

рекламы. Поскольку McDonalds пытается разрабатывать ролики как "срез жизни", которые

положительно воспринимаются всеми сегментами рынка, исследователи использовали

РЕАС, чтобы определить, на какие сегменты влияют отдельные аспекты рекламных роли-

ков. Для кампании отобрали ролики с наибольшей эмоциональной привлекательностью для

большинства сегментов [ I ].

\ ПРИМЕР: Нью-йоркский транспорт

Компания New York City Transit (NYCT), вопреки бытующему мнению, не имеет постоян-

ных пассажиров. Многие люди, если у них есть выбор, не пользуются автобусными маршру-

тами или линиями метро, входящими в состав данной компании. Для выявления способов

увеличения привлекательности общественного транспорта маркетологи провели специаль-

ное исследование.

При проведении телефонного опроса респондентов просили оценить различные аспекты

данной системы общественного транспорта по пятибалльной шкале Лайкерта. Ее выбрали

благодаря легкости применения при телефонных опросах и возможности респондентов дос-

таточно просто оценивать степень своего согласия (1 — абсолютно не согласен, 5 — полно-

стью согласен).

Результаты показали, что личная безопасность имеет наибольшее значение при исполь-

зовании метро. Жители Нью-Йорка боялись использовать станции метро, находящиеся по

соседству. Особенно пассажиров волновал недостаток средств связи с персоналом или поли-

цией при возникновении проблем. NYCT отреагировала на запросы пассажиров усилением

полицейской охраны, созданием отличительных знаков сотрудников NYCT, увеличением

освещенности, изменением расположения стен, колонн и лестниц для улучшения видимо-

сти на станциях.

Телефонные исследования также показали, что чистота станций метро и вагонов напря-

мую связана с ощущением безопасности. В ответ NYCT увеличила усилия по поддержанию

чистоты. Бездомных и нищих у входа в метро и на станциях попросили уйти, в некоторых

случаях их отправили в специальные приюты.

Мероприятия, проведенные по результатам маркетинговых исследований, помогли

NYCT улучшить отношение к общественному транспорту. Увеличение числа пассажиров в

течение пятилетнего периода также является следствием этих усилий [2].

ПРИМЕР. Супермаркеты

В исследовании сферы услуг, проведенном Gallup Organization, участников попросили по

десятибалльной шкале Лайкерта оценить качество предлагаемых услуг. 1 означает наихуд-

шее, а 10— наилучшее качество. Примерно половина респондентов оценили супермаркеты

восьмеркой и более высоким баллом. Хорошую оценку получила также работа ресторанов и

банков. Гостиницы, универмаги, страховые компании, фирмы по ремонту автомобилей и

авиалинии оказались в середине рейтинга. Наихудшие оценки получили местные админи-

страции, общественный транспорт и услуги, связанные с недвижимостью. Следовательно,

согласно общественному мнению, местные администрации, общественный транспорт и

агентства по недвижимости должны улучшить качество представляемых услуг для избирате-

лей и покупателей [3].

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 339

Пример РЕАС иллюстрирует измерение эмоций с помощью непрерывной рейтинговой

шкалы, в исследованиях NYCT и Gallup для измерения ощущений применяется детализиро-

ванная рейтинговая шкала.

МЕТОДЫ НЕСРАВНИТЕЛЬНОГО ШКАЛИРОВАНИЯ

Несравнительное шкалирование (noncomparative scale)

Один из методов шкалирования, когда рассматриваемый объект оценивается независимо от

других объектов в исследуемой группе.

При использовании несравнительных шкал {noncomparative scale) респонденты применяют

любые стандарты оценки, с их точки зрения наиболее подходящие. Они не сравнивают оцени-

ваемый объект ни с каким другим объектом или определенным стандартом, например

"идеальной торговой маркой". Респонденты оценивают отдельный объект, и поэтому несрав-

нительные шкалы еще иногда называют монадическими, или однопредметньши (monadic). Не-

сравнительные методы включают непрерывные (или графические) и детализированные рей-

тинговые шкалы, представленные в табл. 9.1 и обсуждаемые в этой главе.

НЕПРЕРЫВНАЯ РЕЙТИНГОВАЯ ШКАЛА

При использовании непрерывной рейтинговой шкалы (continuous rating scale), называемой

также графической шкалой, респонденты оценивают объекты, ставя отметки в соответствующей

точке отрезка, соединяющего крайние значения критерия. Таким образом респондентов не ог-

раничивают в выборе оценок из используемых исследователем.

Непрерывная рейтинговая шкала (continuous rating scale)

При использовании данной измерительной шкалы респонденты оценивают объекты, ставя

отметки в соответствующей точке отрезка, соединяющего крайние значения критерия. Шка-

ла может иметь различные формы.

Таблица 9.1. Основные виды несравнительных шкал

Шкала Основные характеристики Примеры Преимущества Недостатки

Отметки на непрерывной

линии

Непрерывная

рейтинговая

шкала

Детализированные рейтинговые шкалы

Шкала Лайкер- Степень согласия от 1

та (абсолютно не согласен)

до 5 (полностью согласен)

Семантический Семибалльная шкала с би-

дифференциал полярными метками

Шкала Стэпела Униполярная десятибалль-

ная шкала без точки нача-

ла отсчета

Реакция на телеви- Легко составляются Сложность подсчета бал-

зионные рекламные лов без компьютера

ролики

Измерение отноше- Легко составляют- Занимает больше времени

ний ся, обрабатываются

и понимаются

Имидж компании, Гибкость Может дать противоречи-

марки, продукта вые данные в случае ис-

пользования интервальных

данных

Измерение отноше- Легко составляют- Запутана и сложна в при-

ний и образов ся, осуществляются менении

по телефону

Форма непрерывной шкалы может существенно изменяться. Например, линия может быть

вертикальной или горизонтальной; баллы — в форме чисел или коротких характеристик; при

340 Часть II. Разработка плана исследования

использовании чисел для оценки допустимы много или несколько баллов. Рассмотрим три ви-

да непрерывных рейтинговых шкал.

После оценки респондента исследователь разделяет линию на любое количество категорий

и присваивает баллы в зависимости от той категории, куда попала отметка оценки. В примере с

исследовательским проектом "Выбор универмага" респондент выражает негативное отношение

к Sears. Эти данные обычно рассматриваются как интервальные.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

Непрерывные рейтинговые шкалы

Как бы Вы оценили универмаг Sears

i Вариант I

Вероятно наихудший I

Вариант 2

Вероятно наихудший 1

01020304050607080

Вариант 3

Очень плохой Средний Очень хороший

Вероятно наихудший -- —I— —Вероятно наилучший

О 10 20 30 40 50 60 70 80

-Вероятно наилучший

-Вероятно наилучший

Врезка 9.1. Практика маркетинговых исследований

Система RATE

Сравнительно новым инструментом исследования является анализатор восприятия,

позволяющий осуществлять немедленную оценку "непосредственной реакции". Группе из

400 респондентов представляют рекламные телевизионные и радиоролики. Измерительный

прибор состоит из шкалы со ста делениями. Такая шкала выдается каждому участнику, и он

должен постоянно вводить свою реакцию на тестируемый материал. Когда опрашиваемый

отмечает деление на шкале, информация передается на компьютер, сводящий ежесекундно

поступающие данные по реакциям в графики. Одновременно с поступлением на компьютер

данные выводятся на монитор, позволяя исследователю сразу увидеть реакцию респонден-

тов. Данные также записываются в отдельный файл для последующего анализа. Полученные

оценки можно сгруппировать по категориям, таким как возраст, доход, пол или использо-

вание продукта.

Преимущество непрерывных шкал — легкость их построения [4]. Однако расчеты по ним

громоздки и ненадежны. Более того, непрерывные шкалы дают ограниченное количество но-

вой информации. Поэтому их использование в маркетинговых исследованиях ограничено.

Однако в последнее время с ростом популярности личного опроса с помощью компьютера и

других технологий непрерывные шкалы стали использоваться чаще, как описано во врезке 9.1.

"Практика маркетинговых исследований" [5].

ДЕТАЛИЗИРОВАННЫЕ РЕЙТИНГОВЫЕ ШКАЛЫ

Детализированная рейтинговая шкала (itemized rating scale)

Измерительная шкала, содержащая числа и/или краткое описание, связанное с каждой ка-

тегорией отношения к объекту исследования. Расположение категорий на шкале определен-

ным образом упорядочено.

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 341

При использовании детализированной рейтинговой шкалы (itemized rating scales) респонден-

там предлагается шкала, на которой отмечены числа или краткие описания, связанные с опре-

деленной категорией отношения к объекту исследования, Категории определенным образом

расположены по шкале; респондентов просят выбрать отдельную категорию, наилучшим об-

разом описывающую оцениваемый объект. Детализированные рейтинговые шкалы широко

используются в маркетинговых исследованиях и формируют основные компоненты более

сложных шкал, таких как многомерные рейтинговые шкалы. Ниже описываются наиболее

распространенные детализированные рейтинговые шкалы: шкала Лайкерта, семантический

дифференциал, шкала Стэпела, а затем рассматриваются основные сопутствующие проблемы,

связанные с использованием детализированных рейтинговых шкал.

Шкала Лайкерта

Названная в честь своего разработчика, Ренсиса Лайкерта (Rensis Likert), шкала Лайкерта

(Likert scale) широко распространена. При ее применении от респондентов требуется опреде-

лить степень согласия или несогласия для каждого набора утверждений о рассматриваемых

объектах [6]. Обычно каждый пункт шкалы имеет пять категорий для ответа от "абсолютного

несогласия" до "полного согласия". В контексте исследовательского проекта "Выбор универ-

мага" проиллюстрировано применение шкалы Лайкерта для оценки отношения к Sears.

Для проведения анализа каждому утверждению присваивается количество баллов от —2 до

+2, или от 1 до 5. Анализируются оценки по отдельным пунктам (профильный анализ) или

общая (итоговая) оценка, рассчитанная для каждого респондента суммированием оценок по

отдельным пунктам. Предположим, что в примере с универмагом шкала Лайкерта использует-

ся для измерения отношения покупателей к Sears и J.C.Penney. В рамках профильного анализа

сравнивается два магазина по средним оценкам респодентов для каждого пункта, такого как

качество товаров, торговое обслуживание и ассортимент. Методика итоговой оценки наиболее

распространена, поэтому шкалу Лайкерта часто называют итоговой шкалой (summated scale) [7].

При этом подходе для определения общего количества баллов, постааченного каждым респон-

дентом для каждого магазина, важно использовать последовательную процедуру оценки, чтобы

высокий (или низкий) балл последовательно соответствовал благоприятному ответу. Для этого

присваиваемые отрицательным ответам баллы должны подсчитываться после "переворачива-

ния" шкалы. Необходимо отметить, что при отрицательном утверждении согласие отражает

неблагоприятный ответ, а при позитивном — благоприятный. Соответственно "полному со-

гласию" с положительным утверждением и "полному несогласию" с негативным утверждени-

ем присваивается по пять баллов [8]. В представленной ниже шкале, при условии, что большее

количество баллов свидетельствует о более благоприятном отношении респондентов к объекту

исследования, баллы, поставленные за вопросы 2, 4, 5 и 7, должны трансформироваться в про-

тивоположные. Респондент в примере со сквозным проектом проставил всего 22 балла. Под-

считывается общее количество баллов, проставленных каждым респондентом каждому уни-

вермагу. Респондент наиболее благоприятно относится к универмагу, набравшему наибольшее

количество баллов. Процедура разработки итоговых шкал Лайкерта описывается в разделе, по-

священном многомерным шкалам.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

( Шкала Лайкерта

, Инструкция

I Ниже перечислены различные мнения о Sears. Определите, пожалуйста, насколько вы со-

I гласны или не согласны с каждым из них, используя следующую шкалу:

I 1 — абсолютно не согласен

I 2 — не согласен

| 3 — затрудняюсь ответить

I 4 — согласен

I 5 — полностью согласен

342 Часть II. Разработка плана исследования

Абсолютно Несогласен Затрудняюсь Согласен. Полностью

не согласен ответить согласен

1. Sears продает товары 1 2Х 3 4 5

высокого качества

2 . В Sears плохое торге- 1 2Х 3 4 ' )

вое обслуживание

3. Мне нравится делать 1 2 ЗХ 4 5

покупки в Sears

4. В Sears ограничен- 1 2 3 4Х 5

ный ассортимент това-

ров по отдельным кате-

гориям

5. Кредитная политика 1 2 3 4Х 5

Sears ужасна

6 . Sears — место, где IX 2 3 4 5

американцы делают

покупки

7. Мне не нравится 1 2 3 4Х 5

реклама Sears

8. Sears предлагает ши- 1 2 3 4Х 5

рокий ассортимент

продукции

9 . Sears устанавливает 1 2Х 3 4 5

разумные цены

Шкала Лайкерта имеет несколько преимуществ. Ее легко составлять и использовать. Рес-

понденты быстро схватывают принцип ее заполнения, что позволяет использовать ее по поч-

те, телефону или при личных опросах. Основной недостатк данной шкалы — больший про-

межуток времени, требуемый для ее заполнения, по сравнению с другими детализирован-

ными шкалами, поскольку респондентам приходится читать каждое утверждение.

Следующий пример демонстрирует другой способ применения шкалы Лайкерта в маркетин-

говом исследовании.

ПРИМЕР. Удовлетворенность работой

В ходе маркетингового исследования проверялась гипотеза о том, что внутреннее

удовлетворение от работы, получаемое продавцами, имеет положительную корреляцию со

временем, в течение которого они работают в компании. Внутреннее удовлетворение от

работы измерялось по стандартной шкале Лайкерта [9]. Рассмотрим один из пунктов из-

мерения этого удовлетворения.

Абсолютно Несогласен Затрудняюсь Согласен Полностью

не согласен ответить согласен

Во время работы у меня

| возникает чувство дос- 1 2 3 4 5

! тижения цели

1 Полученные эмпирические данные подтвердили гипотезу. Был сделан вывод, что ме-

неджеры по продажам должны уделять больше внимания процессу подбора, тренировки и

поощрения продавцов для увеличения внутренней удовлетворенности от исполняемой ра-

i боты и, следовательно, уменьшения текучести кадров.

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 343

Семантический дифференциал

Семантический дифференциал, семантическая дифференциальная шкала

(semantic differencial)

Семибалльная ш<ала с противоположными отметками в крайних точках.

Семантическая дифференциальная шкала, или семантический дифференциал (semantic

differential)— семибалльная шкала с крайними точками, являющимися противоположными

отметками. Как правило, респонденты оценивают объекты по нескольким пунктам с помощью

семибалльных шкал, ограниченных по краям противоположными прилагательными, такими

как "холодный" или "теплый" [10]. Применение этой шкалы иллюстрирует пример оценки

респондентами Sears по пяти характеристикам.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

( Семантический дифференциал

Инструкция

\ Эта часть исследования определяет значение каждого универмага для вас их оценкой с по-

! мощью рядов шкал, ограниченных противоположными прилагательными. Используя знак

"X", обозначьте то место на шкале между противоположными по значению прилагательны-

| ми, которое наилучшим образом описывает ваше мнение о магазине.

Пожалуйста, сделайте отметки на каждой шкале, не пропуская ни одной.

Форма

Sears это:

Мощный :-:-:-;-:Х:-:-: Слабый

Ненадежный :-:-:-:-:-:Х:-: Надежный

Современный :-:-:-:-:-:-:Х: Старомодный

I Холодный ;-:-:-:-:-;Х:-: Теплый

! Заботливый :-:Х:-:-:-:-:-: Безразличный

Респонденты делают отметки на шкале в тех местах, которые лучше всего отражают их мне-

ние об оцениваемом объекте [11]. Таким образом, в нашем примере Sears был оценен как сла-

бый, надежный, очень старомодный, теплый и заботливый. Негативное прилагательное или

фраза могут стоять как справа, так и слева шкалы. Это позволяет контролировать склонность

некоторых опрашиваемых, относящихся слишком позитивно или негативно к рассматривае-

мому объекту, ставить отметки только с правой или левой стороны без чтения описаний к

пунктам. Ранее автор описал методы выбора категорий шкалы и составление семантической

дифференциальной шкалы. На основе этого материала автор разработал семантическую диф-

ференциальную шкалу для измерения представлений о людях и продуктах (врезка 9.2.

"Практика маркетинговых исследований"). [12]

Отдельные пункты семантического дифференциала могут принимать значения от —3 до

+3 или от 1 до 7. Полученные данные обычно анализируются с помощью профильного ана-

лиза, когда для каждой рейтинговой шкалы рассчитываются средние или медианные значе-

ния и затем сравниваются с помощью построения графиков или статистического анализа.

Это помогает определять общие черты различия и сходства объектов. Для оценки различий

между сегментами респондентов исследователь сравнивает средние ответы различных сег-

ментов. Хотя среднее значение часто используется как итоговое, вопрос обработки получен-

ных данных как интервальных значений, остается дискуссионным [13]. С другой стороны, в

тех случаях, когда исследователю необходимо сделать общее сравнение объектов, например

при определении предпочтений магазинов, баллы по отдельным пунктам суммируются для

получения общей оценки объекта.

344 Часть II. Разработка плана исследования

Врезка 9.2. Практика маркетинговых исследований

Семантическая дифференциальная шкала для

1. Грубый :-:-:-:-:-:-:-:

2. Восхищающий х-:-:-:-:-:-:

3. Неудобный :-:-:-:-:-:-:-:

4. Доминирующий :-:-:-:-:-:-:-:

5. Бережливый I-:-:-;-:-:-:-:

6. Приятный :-:-:-;-:-:-:-:

7. Современный :-:-:-:-:-:->:

8. Организованный :-:-:-:-:-:-:-:

9. Рациональный :-:-:-:-:-:-:-:

10. Ранний :-:-:-:-:-:-:-:

11. Формальный :-:-:-:-:-:-:-;

12. Консервативный ;-:-:-:-:-:-:-:

13. Комплексный :-:-:-:-:->:-:

14. Бесцветный :-»:-:-:-:-:

15. Скромный >:-:-:-:-:-:-:

измерения представлений о людях и продуктах

Утонченный

Спокойный

Удобный

Второстепенный

Расточительный

Неприятный

Несовременный

Неорганизованный

Эмоциональный

Зрелый

Неформальный

Либеральный

Простой

Красочный

Тщеславный

Универсальность семантической дифференциальной шкалы сделала ее очень популяр-

ной в маркетинговых исследованиях. Она широко используется для сравнения торговых ма-

рок, продуктов, имиджа компаний, используется для разработки стратегий рекламы и про-

движения, а также для разработки новых видов продуктов [14]. Существует несколько видов

основной шкалы.

Шкала Стэпела

Шкала Стэпела (Stapel scale), названная именем ее создателя (Jan Stapel), исключительно по-

пулярная десятибалльная шкала, использующая значения от —5 до 5 без нейтральной (нулевой)

точки [15]. Шкала обычно изображается вертикально. Респондентов просят определить, насколь-

ко верно или неверно каждый термин описывает объект, выбирая соответствующее число на шка-

ле ответов. Чем выше число, тем ближе термин по описанию к объекту, как это показано в приме-

ре "Выбор универмага". В этом примере Sears оценивается как магазин, предлагающий товары не

очень высокого качества с посредственным торговым обслуживанием.

Шкала Стэпела (Stapel scale)

Шкала, предназначенная для измерения отношений и состоящая из одной характеристики в

середине шкалы с диапазоном противоположных числовых значений.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

Инструкция

Пожалуйста, оцените, насколько точно каждое слово или фраза описывает каждый универ-

маг. Выберите одно из положительных чисел, если вы считаете, что фраза довольно точно

описывает магазин. Чем точнее, по вашему мнению, фраза описывает магазин, тем большее

положительное число вы должны выбрать. Выбирайте отрицательные числа для оценки

фраз, неправильно, по вашему мнению, описывающих универмаги. Чем менее точно фраза

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 345

описывает магазин, тем меньшее число вам следует выбрать. Вы можете выбирать любое

число от +5, если фраза наиболее точно описывает магазин, до -5, если фраза описывает ма-

газин абсолютно неточно.

Форма

Sears

+5 +5

+4 +4

+3 +3

+2 +2

+1 +1

Высокое качество Плохой сервис

_] _1

-2 -2

-3 -3

-4 -4

-5 -5

Данные, полученные с помощью шкалы Стэпела, анализируются аналогично данным се-

мантической дифференциальной шкалы. Преимущество шкалы Стэпела в том. что нет необхо-

димости предварительно тестировать прилагательные или фразы для подтверждения их бипо-

лярности. Шкала может использоваться и при телефонных опросах. Однако, по мнению неко-

торых исследователей, шкала Стэпела довольно запутана и трудна в применении. Из трех

детализированных рейтинговых шкал шкала Стэпела используется реже всего. В то же время

данная шкала заслуживает большего внимания, поскольку ее недостатки преувеличены [16].

ПРОБЛЕМЫ РАЗРАБОТКИ НЕСРАВНИТЕЛЬНЫХ

ДЕТАЛИЗИРОВАННЫХ РЕЙТИНГОВЫХ ШКАЛ

Из вышеизложенного материала можно сделать вывод, что несравнительные детализиро-

ванные рейтинговые шкалы необязательно должны использоваться в формате, установленном

раз и навсегда, напротив, они могут принимать много различных форм. При составлении шкал

такого вида исследователь должен ответить на следующие основные вопросы.

1. Количество используемых в шкале категорий.

2. Сбалансированность или несбалансированность шкалы.

3. Четное или нечетное количество категорий.

4. Допустимость неопределенного ответа.

5. Характер и степень вербального описания.

6. Формат шкалы,

Количество категорий в шкале

При выборе количества категорий шкалы принимаются во внимание два противоречивых

фактора. Чем больше количество категорий в шкале, тем больше степень дифферениируемости

между объектами. С другой стороны, большинство респондентов способны справиться всего с

несколькими категориями при опросе. Традиционно считается, что количество категорий

должно равняться семи, плюс-минус две: между пятью и девятью [17]. Хотя следует отметить,

что не существует единственного оптимального числа категорий. В каждом случае при выборе

их количества нужно принимать во внимание целый ряд различных факторов.

346 Часть II. Разработка плана исследования

Если респонденты заинтересованы в процессе оценки и достаточно осведомлены об объекте

оценки, то можно применять больше категорий. С другой стороны, если респонденты не очень

осведомлены о характеристиках объекта или не заинтересованы в выполнении задания, следует

использовать меньшее количество категорий. Важна также природа рассматриваемых объектов.

Для некоторых объектов невозможно выделить много характеристик, поэтому более эффектив-

ным будет небольшое количество категорий. Другой важный фактор — способ сбора данных.

При использовании телефонных интервью слишком много категорий приводят опрашиваемых

в замешательство. Ограничения в размерах анкеты могут ограничивать количество категорий

при проведении почтовых опросов.

Методы анализа данных также влияют на выбор количества категорий. В случаях, когда не-

сколько пунктов шкалы суммируются для получения общего балла для каждого респондента,

лучше всего использовать пять категорий. Этот же принцип используется и при необходимости

масштабных обобщений или сравнений групп. Если существует заинтересованность в индиви-

дуальных ответах или данные анализируются с помощью сложных статистических методик,

следует использовать семь и больше категорий. Величина коэффициента корреляции и обще-

принятая мера связи между переменными (глава 17) зависят от количества категорий. Коэф-

фициент корреляции уменьшается с уменьшением числа категорий. Это, в свою очередь, влия-

ет на весь статистический анализ, базирующийся на коэффициенте корреляции [18].

Сбалансированность или несбалансированность шкалы

В сбалансированной шкале (balanced scale) количество благоприятных и неблагоприятных

категорий одинаково; в несбалансированной шкале их количество различно [19]. Примеры

сбалансированной и несбалансированной шкал показаны на рис. 9.1. В общем, для получения

объективных данных шкалы должны быть сбалансированы. Однако, если велика вероятность

смешения распределения в положительную или отрицательную сторону, для исследования

больше подходит шкала с большим числом категорий в сторону предполагаемого смещения.

При использовании несбалансированной шкалы сущность и степень несбалансированности

должны приниматься во внимание при анализе данных.

Сбалансированная шкала (balanced scale)

Шкала с равным количеством благоприятных и неблагоприятных категорий.

Сбалансированная шкала Несбалансированная шкала

Косметическое средство Косметическое средство

Jovan Musk for Men Jovan Musk for Men

Превосходное Превосходное

Очень хорошее Очень хорошее

Хорошее Довольно хорошее

Плохое Хорошее

Очень плохое Очень плохое

Одно их худших Плохое

Рис, 9.1. Сбалансированные и несбалансированные шкалы

Четное или нечетное количество категорий

При нечетном количестве категорий центральное положение в шкале отображает нейтраль-

ность характеристики или безразличие респондента. Наличие, обозначение и размещение ней-

Глава 9, Измерение и шкалирование: методы несравнительного шкалирования 347

тральной категории может существенно влиять на ответ. Шкала Лайкерта, например, сбалан-

сирована, имеет нечетное количество категорий и нейтральную категорию [20].

Использование шкалы с четным или нечетным количеством категорий зависит также от

возможности нейтрального отношения респондента к отдельному пункту опроса. Если воз-

можно нейтральное или безразличное отношение по крайней мере одного респондента, следует

использовать шкалу с нечетным количеством категорий. Если, с другой стороны, исследователь

хочет заставить респондента выразить отрицательное либо положительное мнение или сам со-

ставитель опроса убежден, что по данному вопросу не может быть нейтрального мнения, то

лучше применять шкалу с четным количеством категорий. Вопрос о целесообразности давле-

ния на опрашиваемого остается открытым.

Шкалы с обязательными и добровольными ответами

Рейтинговая шкала с обязательными ответами (forced rating scale)

Шкала, принуждающая респондента выразить определенное мнение, так как пункты "не оп-

ределился" и "не знаю" отсутствуют.

При использовании рейтинговых шкал с обязательными ответами (forced rating scale) рес-

понденты обязательно должны выражать свое мнение, так как ответ "не определился" отсутст-

вует, В этом случае респонденты, не имеющие определенного мнения, могут сделать отметку в

середине шкалы. Если существенная часть респондентов не имеют определенного мнения по

заданной теме, большое количество серединных оценок исказит измерение общей тенденции и

вариации. В ситуациях, когда респонденты могут не выражать определенного мнения, напри-

мер, просто сопротивляясь принудительности ответа, точность данных можно улучшить с по-

мощью шкалы с добровольными ответами, включающей категорию "не определился" [21].

Характер и степень вербального описания

Характер и степень вербального описания, используемые для обозначения категорий шка-

лы, могут значительно повлиять на ответы. Категории шкалы могут иметь вербальные, число-

вые или даже графические описания. Кроме того, исследователь должен определить, выделять

отметками каждую категорию шкалы, только некоторые категории или отмечать только край-

ние точки. Удивительно, но словесное описание каждой категории шкалы может не увеличить

точности или надежности данных. Аргументом в пользу большого числа отметок или разметки

всех категорий может служить уменьшаемая в этом случае неопределенность шкалы. Описания

категорий должны размешаться как можно ближе к категориям ответов.

Сила характеристик, используемых в шкале, может повлиять на распределение ответов.

При сильном акцентировании на негативном или позитивном отношении (I — абсолютно не

согласен, 7 — полностью согласен), респонденты склонны реже выражать свое мнения через

крайние точки шкалы. Это приводит к менее вариативному и более компактному распределе-

нию ответов. Слабые акценты (1 — в общем согласен, 7 — в общем не согласен), напротив, дают

более равномерное и рассеянное распределение. Для получения сбалансированных или равных

интервальных шкал разработаны специальные процедуры присвоения количественных значе-

ний категориальным описаниям [22].

Форма шкалы

Существует несколько вариантов формы шкал. Шкалы можно представлять вертикально

или горизонтально. Категории могут отображаться прямоугольниками, размечаться линиями

или делениями на последовательном ряде, иметь или не иметь числовых значений. Исполь-

зуемые числовые значения могут быть положительными, отрицательными или и теми, и дру-

гими. Некоторые возможные конфигурации шкал представлены на рис. 9.2.

348 Часть II. Разработка плана исследования

Для оценки мягкости моющего средства Cheer могут быть использованы различные шка-

лы. Далее представлены некоторые примеры;

1.

2.

3.

4.

5.

Моющее средство Cheer.

Очень жесткое

Очень жесткое ! 2

D Очень жесткое

D

П

D Ни жесткое, ни мягкое

а

а

D Очень мягкое

Очень же- Жесткое Немного

сткое жесткое

-3 -2 -1

Очень же-

сткое

Очень мягкое

3 4 5 6 7 Очень мягкое

Ни жесткое, Немного Мягкое Очень мягкое

ни мягкое мягкое

0 +1 +2 +3

Ни жесткое, Очень мягкое

ни мягкое

Рис. 9.2. Формы рейтинговых шкал

Шкала термометра и шкала выражения лица — две уникальные в своем роде шкалы, при-

меняемые в маркетинговых исследованиях. При использовании шкалы термометра чем выше

температура, тем более положительную оценку она означает, Точно так же и улыбающиеся ро-

жицы отражают позитивное отношение. Эти шкалы особенно полезны при опросе детей [23].

Примеры данных шкал приведены на рис. 9.3, в табл. 9.2 обобщен процесс принятия шести

решений, необходимых для составления рейтинговой шкалы.

Таблица 9.2. Процесс принятия решения при составлении детализированной рейтинго-

вой шкалы

1. Число категорий Хотя не существует единственного оптимального числа, наиболее распространено

количество от пяти до девяти категорий

2. Сбалансирован-ность и не- В общем, для получения объективных данных необходимо сбалансировать шкалу

сбалансированность

3. Четное или нечетное число Если возможен нейтральный или безразличный ответ по крайней мере от некоторых

категорий респондентов, следует использовать нечетное количество категорий

4. Обязательность выражения В ситуациях, когда от респондентов не ожидается ответа на определенный вопрос,

определенного мнения точность данных можно улучшить, используя шкалу с неопределенными ответами

5. Вербальное описание Существует ряд причин для разметки всех или большинства категорий. Описания ка-

тегорий нужно как можно ближе располагать к категориям ответов

6. Форма Следует протестировать несколько вариантов, чтобы выбрать наилучший

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 349

Шкала термометра

Инструкция

Пожалуйста, определите, насколько вам нравятся гамбургеры McDonald's, закрашивая изо-

бражение термометра шариковой ручкой. Начните снизу и закрашивайте до отметки, которая

наилучшим образом отражает ваше отношение к гамбургерам McDonald's

Форма

Очень

нравятся

Совсем

не нравятся

Шкала "выражениелица"

Инструкция

Пожалуйста, определите, насколько вам нравится кукла Barbie, указав выражение лица, которое

наилучшим образом отражает ваше отношение. Если кукла вам не нравится, выберите выраже-

ние лица 1. Если она вам очень нравится, выберите выражение лица под номером 5.

Форма

Рис. 9.3. Некоторые особенные формы рейтинговых шкал

Многомерные шкалы

Разработка многомерных шкал требует специальной подготовки [24]. На рис. 9.4 изображен

алгоритм для построения многомерных шкал. Измеряемая характеристика часто называется кон-

струкцией (construct). Разработка шкалы начинается с теоретического представления о том, что со-

бой представляет данная конструкция, что необходимо не только для составления шкалы, но и

для интерпретации результатов. Следующий шаг заключается в предложении маркетологом пер-

воначального варианта всех возможных пунктов шкалы. Обычно это делается на базе теоретиче-

ских положений, анализа вторичных данных и результатов качественного исследования. Из этого

"котла" маркетолог отбирает ограниченное количество потенциальных пунктов шкалы. Для отбо-

ра используется определенный качественный критерий. Количество пунктов все еще достаточно

велико для составления шкалы. Поэтому в дальнейшем их количество уменьшается.

Затем проводится сбор информации из достаточно большой предварительной выборки рес-

пондентов с использованием шкалы с сокращенным числом пунктов. Данные анализируются с

помощью таких методов, как корреляция, факторный анализ, кластерный анализ, дискрими-

нантный анализ и статистические критерии, обсуждаемые в этой книге. По результатам этого

статистического анализа устраняются еще несколько пунктов, после чего остаются пункты, не-

посредственно используемые при составлении шкалы (в следующем разделе). На основе этих

оценок разрабатывается окончательный набор пунктов шкалы. Как видно из рис. 9.4, процесс

разработки содержит последовательность действий, отдельные элементы которой повторяются

несколько раз [25].

350 Часть II. Разработка плана исследования

Общий исходный набор элементов;

теория, вторичные данные, качественное исследование

Выберите ограниченный набор измеряемых характеристик,

исходя из результатов качественного анализа

Разработайте окончательный вариант шкалы

Оцените надежность, достоверность

и применимость шкалы

Подготовьте окончательный вариант шкалы

Рис. 9.4, Разработка многомерной шкалы

Ниже представлен пример шкалы, разработанной для промышленного маркетингового ис-

следования.

РРИМЕР. Технические параметры продуктовой линии

Приведенная многомерная шкала измеряет техническую сложность продуктовой

линии (26].

1. Технически сложная

2. Низкий уровень ин-

женерной разработки

3. Быстро изменяющаяся 1

4. Несложная

5. Массовая

!

1

1

1

1

1

2

2

2

1

!

3

!

3

<

4

4

-1

4

4

5

5

5

5

5

6

6

6

6

6

7

7

7

7

7

Технически несложная

Высокий уровень инже-

нерной разработки

Медленно изменяющаяся

Сложная

Единичная

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 351

6. Уникальная

7. Сложная

1 2 3 4 5 6 7 Распространенная

1 2 3 4 5 6 7 Простая

Пункты 1, 3, 6 и 7 при подсчете баллов переворачиваются. Шкала применяется в про-

мышленном маркетинге для измерения технической сложности продуктовых линий и

предлагает возможные варианты улучшения ее технических характеристик.

Оценка шкалы

При использовании многомерной шкалы нужно проверить ее точность и примени-

мость [27]. Как показано на рис. 9,5, этот процесс включает оценку надежности, достоверности

и обобщенности шкалы. Среди различных подходов к оценке надежности отметим следующие:

двойное тестирование, проверка надежности с помощью альтернативных форм и проверка

внутренней согласованности. Достоверность можно оценить через рассмотрение достоверности

содержания, достоверности критерия и конструкции.

Конвергенция

Рис. 9.5. Оценка шкалы

Дискриминант Номологичность

Перед оценкой надежности и достоверности следует рассмотреть точность измерения как

основу оценки шкалы.

Точность измерения

Ошибка измерения (measurement error)

Отклонение информации, которую ищет маркетолог, от информации, получаемой с помо-

щью заданного процесса измерения.

Модель истинной оценки (true score model)

Математическая модель, дающая представление о точности измерений.

Как уже указывалось в главе 8, измеряя некий объект, мы с помошью чисел (показателей)

определяем его отдельные характеристики. Показатель является не истинным значением ха-

352 Часть II. Разработка плана исследования

рактеристики, а результатом наблюдения. Действие различных факторов может вызвать ошибку

измерения (measurement error), которая проявляется в отклонении показателя, т.е. полученного

значения характеристики, от ее истинного значения (рис. 9.6). Модель истинной оценки (true

score model) содержит основы для понимания точности измерения. Согласно этой модели,

X0=XT+Xs+XRTj&

X Q__ измеренное фактическое значение

Х т_ истинное значение характеристики

AV_ систематическая ошибка

X R_ случайная ошибка

Систематическая ошибка (systematic error)

Систематическая ошибка постоянно влияет на измерение, отображает действие стабильных

факторов, влияющих на полученный результат при каждом отдельном измерении.

Случайная ошибка (random error)

Ошибка измерения, появляющаяся вследствие случайных изменений или различий между

респондентами или условиями, в которых проводится опрос.

Примечательно, что общая ошибка измерения включает систематическую ошибку

(systematic error) — X s_ и случайную ошибку — Х„. Влияние систематической ошибки на про-

цесс измерения носит постоянный характер. Она отображает действие стабильных факторов,

влияющих на полученный результат при каждом отдельном измерении, например механиче-

ские факторы (рис. 9.6). Случайная ошибка (random variable), напротив, непостоянна. Она ото-

бражает действие временных факторов, их разному влиянию на результат при каждом отдель-

ном измерении. К таким факторам относятся индивидуальные и ситуационные факторы. Раз-

граничение между систематической и случайной ошибкой очень важно для понимания

надежности и достоверности.

1. Относительно стабильные характеристики индивида, влияющие на оценку при тесте,

как, например, интеллект, уровень образования,

2. Краткосрочные или временные факторы, такие как здоровье, эмоции, усталость

3. Ситуационные факторы, такие как присутствие других людей, шум и факторы, отвле-

кающие внимание.

4. Набор пунктов шкалы: добавление, удаление или изменения в пунктах шкалы,

5. Неясность шкалы, инструкций или самих пунктов.

6. Механические факторы, такие как плохое качество печати, перенасыщенность пунктами

в анкете, плохой дизайн.

7. Различия между интервьюерами.

Рис. 9.6. Потенциальные источники ошибки в измерении

Надежность

Надежность (reliability) характеризуется тем, насколько устойчивые результаты дает приме-

нение шкалы при повторных измерениях [28]. Систематические источники ошибок не влияют

на надежность, они постоянно воздействуют на измерение и не приводят к противоречивости

ее результатов. Случайная ошибка, напротив, может приводить к противоречивым результатам

и соответственно — к уменьшению надежности. Надежность, таким образом, можно опреде-

лить как степень отсутствия при измерении случайной ошибки — Х к. Если X R = 0, измерение

абсолютно надежное.

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 353

Надежность (reliability)

Насколько применение шкалы дает согласующиеся результаты при повторных измерениях

характеристик объекта.

Надежность оценивается определением доли систематической вариации в шкале. Это осу-

ществляется установлением связи между оценками, полученными при использовании различ-

ных методик расчета. Если связь достаточно сильна, шкала дает согласующиеся и, следователь-

но, достаточно надежные результаты. К методам оценки надежности относятся повторное тес-

тирование, метод альтернативных форм и внутренней согласованности.

Повторное тестирование надежности (test-retest reliability)

Метод оценки надежности, при котором идентичные опросы при как можно более сходных

условиях проводятся дважды.

Повторное тестирование надежности. При повторном тестировании надежности (testretest

reliability) опрос респондентов проводится дважды с помощью двух идентичных шкал и

при как можно более сходных условиях. Интервал между тестированиями обычно составляет

от двух до четырех недель. Степень схожести результатов двух измерений определяется ко-

эффициентом корреляции (подробности — в главе 17). Чем выше коэффициент корреля-

ции, тем выше надежность.

С определением надежности при применении метода повторного тестирования связано не-

сколько проблем. Во-первых, данный метод сильно зависит от промежутка времени между тес-

тированиями. При прочих равных условиях, чем дольше интервал, тем ниже надежность. Во-

вторых, первоначальное измерение может изменить рассматриваемые характеристики. Напри-

мер, измерение отношений респондентов к молоку с низкой жирностью может заставить оп-

рашиваемых задуматься о его полезности для здоровья и в результате привести к повышению

оценки данного продукта. В-третьих, иногда невозможно провести повторное тестирование

(например, при измерении первоначальной реакции на новый продукт). В-четвертых, первое

измерение может иметь эффект автоматического переноса высказанного мнения на второе и

последующие измерения. В-пятых, измеряемые характеристики могут изменяться за промежу-

ток времени между опросами. Например, благоприятная информация об объекте может улуч-

шить отношение к объекту. Наконец, коэффициент корреляции может быть завышен из-за ав-

токорреляции отдельных пунктов шкалы.

Из-за перечисленных выше недостатков метод двойного тестирования применяется в соче-

тании с другими подходами, одним из них которых является метод альтернативных форм [29].

Проверка надежности с помощью альтернативных форм (alternative-forms reliability)

Метод проверки надежности, при котором составляются две формы шкалы, эквивалентные

по своей сути, а затем одна и та же группа респондентов опрашивается дважды.

Проверка надежности с помощью альтернативных форм. При проверке надежности с помо-

щью альтернативных форм (alternative-forms reliability) составляются две эквивалентные по сути

формы шкалы. Одни и те же респонденты опрашиваются дважды, обычно с перерывом от двух

до четырех недель. Для проверки надежности рассчитывается корреляция между результатами

по двум шкалам [30|.

С данным подходом связано две основные проблемы. Во-первых, составление двух шкал

отнимает достаточно много времени и требует дополнительных финансовых ресурсов. Во-

вторых, существуют сложности с составлением двух эквивалентных шкал. Формы должны быть

эквивалентны по содержанию. В строгом смысле это означает, что альтернативные шкалы

должны иметь одинаковые средние, вариации и внутренними корреляциями. Даже при со-

блюдении этих двух условий формы не всегда эквивалентны по содержанию. Таким образом

низкий коэффициент корреляции будет свидетельствовать либо о ненадежности шкалы, либо

о неэквивалентности форм.

354 Часть II. Разработка плана исследования

Проверка надежности через тестирование внутренней согласованности

(internal consistency reliability)

Метод оценки внутренней согласованности набора пунктов, при котором подсчитывается

сумма количества баллов для получения общего итога.

Проверка надежности через тестирование внутренней согласованности. Для проверки на-

дежности итоговой шкалы, в которой результаты по отдельным пунктам суммируются для по-

лучения общего балла, применяется проверка надежности через тестирование внутренней согла-

сованности (internal consistency reliability). В подобных шкалах отдельные пункты измеряют ка-

кой-либо аспект конструкции, рассматриваемой с помощью всей шкалы, поэтому результаты

по пунктам должны согласовываться между собой. Данная методика проверки согласованности

фокусируется на внутренней согласованности набора пунктов, составляющих шкалу.

Проверка надежности делением данных на половины (split-half reliability)

Метод проверки внутренней согласованности, при котором пункты, составляющие шкалу, раз-

деляются на половины с последующим расчетом коэффициента корреляции между ними.

Наиболее простой способ измерения внутренней согласованности — это проверка надежно-

сти делением данных на половины (split-half reliability). Пункты шкалы разделяются на две поло-

вины и затем рассчитывается корреляция между ними. Высокое значение корреляции между

половинами свидетельствует о высокой внутренней согласованности. Пункты шкалы разбива-

ются на две части в зависимости от четности, нечетности или случайным образом. Проблема в

том, что результаты будут зависеть от выбора способа разбивки. Популярное решение этой про-

блемы — расчет коэффициента "альфа".

Коэффициент "альфа" (coefficient alpha)

Показатель внутренней согласованности, рассчитывающийся как средняя всех возможных

половинных коэффициентов различных разделений шкалы.

Коэффициент "альфа" (coefficient alpha), или альфа Кронбаха (Cronbach's alpha) является

средним из всех возможных половинных коэффициентов при различных делениях шкалы. Ко-

эффициент принимает значения от 0 до 1, при значении коэффициента 0,6 и меньше внут-

ренняя согласованность неудовлетворительная. Важное свойство коэффициента "альфа" — это

увеличение его значения при увеличении количества пунктов шкалы. Таким образом, коэф-

фициент может быть искусственно завышен за счет чрезмерно большого количества пунк-

тов [31]. Коэффициент ''альфа" дополняет коэффициент "бета", который оценивает наличие

несогласованных пунктов в процессе усреднения с помощью коэффициента альфа.

Некоторые многомерные шкалы включают несколько наборов пунктов для измерения раз-

личных аспектов многомерной конструкции. Например, имидж магазина является многомер-

ной конструкцией, включающей качество товаров, разнообразие и ассортимент продукции,

политику возврата и урегулирования конфликтов, торговое обслуживание, цены, удобство рас-

положения, внешний вид магазина, политику оплаты и продажи в рассрочку. Следовательно,

шкала, разработанная для оценки имиджа магазина, включает пункты для измерения каждого

из этих показателей. Поскольку измеряемые показатели в некоторой степени не зависят один

от другого, расчет внутренней согласованности даст недостоверные результаты. Если же для

измерения одного показателя используется несколько пунктов, возможен расчет коэффициен-

та согласованности для отдельного показателя, как в случае с совокупностью эмоциональных кри-

териев Бюмонта (Beaumont emotion battery)-

• ПРИМЕР. Критерии Бюмонта

Совокупность эмоциональных критериев Бюмонта разработана Beaumont Organization,

\ Ltd. для измерения эмоциональных реакций на рекламу. Респонденты оценивали про-

\ смотренные рекламные ролики по совокупности показателей, описывающих восемь ос-

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 355

новных видов эмоций: одобрение, страх, удивление, печаль, отвращение, злость, ожида-

ние и удовольствие. По каждой из основных эмоций с помощью коэффициента "альфа"

Кронбаха измерялась внутренняя согласованность. Для перечисленных эмоций коэффи-

циенты составили соответственно 0,73, 0,66, 0,63, 0,75, 0,72, 0,81, 0,79 и 0,85. Эти резуль-

таты показывают удовлетворительную внутреннюю согласованность для совокупности

критериев Бюмонта [32].

Достоверность

Достоверность (validity)

Насколько различия между оценками, полученными по шкале, отражают истинные различия

между измеряемыми характеристиками объектов, а не обусловлены случайными и систе-

матическими ошибками.

Достоверность (validity) шкалы можно определить как степень, в которой различия между

оценками, полученными по шкале, отражают истинные различия между измеряемыми харак-

теристиками объектов, а не обусловлены случайными и систематическими ошибками. Полная

достоверность предусматривает отсутствие ошибок измерения (Х 0= Х-^ X R= О, X S= 0). Исследо-

ватели оценивают содержательную достоверность, критериальную и конструкционную [33].

Содержательная достоверность (content validity)

Тип достоверности, иногда называемый лицевой достоверностью (face validity), для опреде-

ления которого проводится субъективная систематическая оценка того, насколько хорошо

содержание шкалы соответствует поставленной цели измерения.

Содержательная достоверность. Содержательная достоверность (content validity), иногда

называемая лицевой достоверностью (face validity), субъективная систематическая оценка то-

го, насколько хорошо содержание шкалы соответствует поставленной цели измерения. Ис-

следователь, или кто-либо еше, проверяет, насколько пункты шкалы адекватно покрывают

всю область измерений. Таким образом, шкала, разработанная для измерения имиджа ма-

газина, считается неадекватной, если будет опущена одна из существенных характеристик

объекта (качество, разнообразие, ассортимент предлагаемой продукции). Учитывая субъек-

тивную природу данного показателя, оценки содержательной достоверности будет недоста-

точно при измерении достоверности шкалы, однако она помогает правильно интерпретиро-

вать полученные результаты. Более того, формальную оценку можно получить с помощью

проверки достоверности критерия.

Критериальная достоверность (criterion validity)

Тип достоверности, отражающий соответствие используемой шкалы переменным, которые

выбраны как значимые.

Критериальная достоверность. Критериальная достоверность (criterion validity) отражает,

насколько используемая шкала соответствуют выбранным значимым критериальным пере-

менным. Последние могут включать демографические и психологические характеристики, из-

мерения отношений и поведений, оценки, полученные на основании использования других

шкал. В зависимости от временных рамок критериальная достоверность может принимать две

формы — текущую или прогнозную достоверность.

Текущая достоверность определяется, когда данные, полученные на основе использования

шкалы, и сведения о критериальных переменных собираются одновременно. Для оценки те-

кущей достоверности разработаны краткие формы для определения характеристик личности,

как, например, совокупность критериев Бюмонта. Данные по исходным опросам и по кратким

формам обрабатываются параллельно и затем сравниваются.

356 Часть II. Разработка плана исследования

Для оценки прогнозной достоверности исследователь собирает данные оценок по шкале в

один период времени, а по критериальным переменным — в другой. Например, отношение к

различным маркам сухих завтраков может использоваться для прогноза будущих объемов про-

даж сухих завтраков представителям сканернои панели. У членов панели получают информа-

цию об их отношении к продукту, а затем их будущие закупки проверяются по данным иссле-

дования. Прогнозные и фактические данные по покупкам сравниваются для оценки прогноз-

ной достоверности шкалы отношения.

Конструктивная достоверность (construct validity)

Тип достоверности, оценка которого предполагает ответ на вопрос, конструкцию или ха-

рактеристику чего именно измеряет шкала. При оценке конструктивной достоверности пы-

таются ответить на теоретические вопросы: почему шкала эффективна и какие дедуктивные

выводы можно сделать из лежащей в ее основе теории.

Конструктивная достоверность. Конструктивная достоверность (construct validity) связана с

ответом на вопрос, конструкцию или характеристику чего именно измеряет шкала. При оценке

конструктивной достоверности исследователь попытается ответить на теоретические вопросы:

почему должна использоваться эта шкала и какие выводы можно сделать из лежащей в ее осно-

ве теории. Таким образом, для оценки конструктивной достоверности необходима основатель-

ная теоретическая разработка сути конструкций и их соотношения с другими конструкциями.

Конструктивная достоверность наиболее сложна в определении. Как показано на рис. 9.5, дос-

товерность конструкции включает конвергенционную, дискриминантную и помологическую

достоверности.

Конвергенционная достоверность (convergent validity)

Способ оценки конструктивной достоверности; измеряет, насколько шкала положительно

коррелирует с другими измерителями той же конструкции.

Дискриминантная достоверность (discriminant validity)

Один из вариантов конструктивной достоверности, показывающий, насколько значения не

коррелируют с другими конструкциями, от которых они предположительно отличаются.

Помологическая достоверность (nomological validity)

Один из вариантов оценки достоверности, определяемый степенью корреляции значений

конструкций, вытекающих из теории.

Конвергенцнонная (сходящаяся) достоверность (convergent validity) — степень, в которой

шкала положительно коррелирует с другими измерителями той же конструкции. При этом не

обязательно получить все значения с помощью методов обычного шкалирования. Дискрнмн-

нантная достоверность (discriminant validity) показывает, насколько значения шкалы не корре-

лируют с другими конструкциями, от которых они предположительно отличаются. Это связано

с уменьшением корреляции между различающимися конструкциями. Дискриминантную дос-

товерность также иногда называют дифференцированной. Помологическая достоверность

(nomological validity) определяется степенью корреляции значений конструкций, вытекающих

из теории. Маркетологом формулируется теоретическая модель с последующими выводами и

проверкой. В результате составляется номологическая сеть из нескольких систематически

взаимосвязанных конструкций, Иллюстрация конструктивной достоверности приведена ниже

в контексте оценки многомерной шкалы [34].

ПРИМЕР. Будь честен с самим собой

Следующие положения помогут оценить достоверность многомерной шкалы само-

оценки.

• Высокая корреляция с другими шкалами самооценки и с результатами опроса друзей

(конвергенционная достоверность).

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 357

Низкая корреляция с несвязанными конструкциями приверженности к определен-

ным торговым маркам или поиском разнообразия (дискриминантная достоверность).

Торговые марки, которые соответствуют самооценке индивида, предпочитаются

им больше, как это теоретически возможно и постулируются (помологическая

достоверность).

Высокий уровень надежности.

Примечательно, что высокий уровень надежности в этом примере приведен как доказатель-

ство конструкционной достоверности.

Взаимосвязь между надежностью и достоверностью

Механизм взаимосвязи между надежностью и достоверностью понятнее при рассмотрении

его с помощью модели истинной оценки. Если измерение абсолютно достоверно, то оно одно-

временно абсолютно надежно. В этом случае Х 0 = Х т, X R = Q,X S = 0. Таким образом, достовер-

ность подразумевает надежность. Если измерение ненадежно, оно не может быть достоверным,

так как даже минимально Х 0 = Х т + Х к. Кроме того, может быть систематическая ошибка, тогда

X s # 0. Ненадежность подразумевает недостоверность. Если измерение абсолютно надежно, оно

может быть как достоверным, так и недостоверным из-за систематической ошибки (Х д = Х т +

Х к). В то время как недостаток надежности отрицательно сказывается на достоверности, надеж-

ность не обязательно подразумевает достоверность. Надежность — необходимое, но недоста-

точное условие достоверности.

Обобщаемость

Обобщаемость (generalizability)

Насколько исследование, основанное на выборке, можно обобщить для использования в

рамках генеральной совокупности в целом.

Обобщаемость (generalizability) отражает, насколько полученные в результате конкретного

исследования данные можно перенести на генеральную совокупность. Набор всех используе-

мых исследователем условий измерений, который маркетолог хочет применить ко всей гене-

ральной совокупности, называется полным множеством обобщения. Эти условия включают

категории, пункты, интервьюеров, способы наблюдения и т.д. Исследователь может обобщить

шкалу, использованную при индивидуальном опросе, для использования в других моделях

сбора данных, таких, например, как телефонные и почтовые опросы. Обобщаемость может

также анализироваться с точки зрения перехода от выборки объектов к генеральной совокупно-

сти объектов, от выборки количества измерений к генеральной совокупности количества изме-

рений, от выборки наблюдателей к генеральной совокупности наблюдателей и т.д. [35].

МЕТОДЫ ШКАЛИРОВАНИЯ

Кроме теоретических аспектов, оценки надежности и достоверности, при выборе методов

шкалирования для конкретного маркетингового исследования следует также принимать во

внимание некоторые практические факторы [36]. Среди них отметим следующие: характер

получаемых данных (номинальные, порядковые, интервальные или относительные), воз-

можности респондентов, характеристики рассматриваемых объектов, метод обработки, кон-

текст и затраты.

Как правило, метод шкалирования, который в данной ситуации даст наибольшее количест-

во информации, позволяет использовать наибольшее число методов статистического анализа.

Также, независимо от вида выбранной шкалы и степени ее соответствия задаче измерения ин-

тересующей характеристики, необходимо использовать несколько шкал. Это даст более точный

358 Часть II. Разработка плана исследования

результат, чем шкала из одного пункта. Во многих ситуациях желательно использовать не-

сколько методов шкалирования или получить дополнительные измерения с помощью матема-

тически обоснованных шкал.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ШКАЛИРОВАНИЯ

Все рассмотренные в этой главе шкалы требуют от респондентов прямой оценки различных

характеристик объекта. При выборе математического метода шкалирования исследователь сам

имеет возможность сделать вывод об оценке респондентами характеристик рассматриваемых

объектов, исходя из обших суждений опрашиваемых об объекте. Многомерное шкалирование

и совместный анализ — два популярных математических метода шкалирования. Детально они

рассматриваются в главе 21.

МЕЖДУНАРОДНЫЕ МАРКЕТИНГОВЫЕ

ИССЛЕДОВАНИЯ

При разработке шкалы и формата ответов следует учитывать уровень образованности и гра-

мотности респондентов [37]. Одним из подходов является разработка мультикультурных или

независимых от культурных особенностей шкал. Из рассмотренных нами методов шкалирова-

ния семантическая дифференциальная шкала наиболее соответствует данному подходу. Она

прошла проверку в нескольких странах и везде давала схожие результаты.

ПРИМЕР. Копируя Xerox

Xerox — это марка, позитивно воспринимаемая в бывшем СССР еше с 1960-х годов. Сам

процесс копирования документов часто называется ксерокопированием, т.е. термин про-

изошел от названия компании. Это была марка, отождествляемая с качеством. Однако после

преобразования Советского Союза в Союз Независимых Государств объемы продаж Xerox

стали падать. Менеджеры первоначально связали это с сильной конкуренцией со стороны

Canon, Ricoh Co., Mitsubishi Electric Corp., Minolta Camera Co. Первые попытки сделать продукт

более конкурентным не привели к желаемым результатам. Впоследствии было проведено

маркетинговое исследование для оценки имиджа Xerox и ее конкурентов. Для этого ис-

пользовались семантические дифференциальные шкалы, так как они считаются мульти-

культурными. Биполярные обозначения аккуратно протестировали на соответствие значе-

ния в русском контексте.

В результате исследования маркетологи выявили что реальная проблема заключалась в

негативном восприятии Xerox русскими покупателями. Что было не так? Проблема была

не в Xerox, а в нескольких независимых производителях копировальных машин, неза-

конно используюших торговую марку Xerox. С распадом Советского Союза зашита торго-

вых марок практически перестала существовать, и случаи нарушения авторских прав по-

стоянно росли. Среди прочих действий Xerox провела большую кампанию по телевиде-

нию и радио, в местных периодических изданиях. В кампании ставился акцент на

[ лидирующих позициях Xerox в странах СНГ, где требования к качеству были очень высо-

1 кими. Это был шаг к устранению неадекватного восприятия Xerox русскими потребите-

I лями. Кроме того, Xerox зарегистрировала свою торговую марку в каждом новом государ-

| стве, на которые распался СССР [38].

Альтернативный поход к разработке мультикультурных шкал, использованных в России, —

это создание шкал, учитывающих сложившиеся культурные нормы, как основу для сопостав-

ления. Среди форматов ответов наиболее удобны вербальные рейтинговые шкалы. Даже менее

образованные респонденты хорошо понимают и дают ответы на основе вербальных шкал. Осо-

бенное внимание следует уделить разработке эквивалентных словесных описаний на различ-

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 359

ных языках и в различных культурах. Крайние точки шкалы особенно уязвимы для интерпре-

тации. В некоторых культурах единица рассматривается как лучшая оценка, в то время как в

других странах она интерпретирует как наихудшая. Поэтому важно, чтобы вербальные описа-

ния и крайние точки шкалы соответствовали культурным особенностям.

Наконец, в международном маркетинговом исследовании критически важно установить

эквивалентность шкал и измерений для получения данных из различных стран. Эта комплекс-

ная тема рассматривается в главе 23.

ЭТИКА МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЙ

На маркетологе лежит этическая ответственность за использование шкал, которые

должны обладать достаточной надежностью, достоверностью и применимостью. Выводы,

сделанные на основе использования шкал, не имеющих достаточной надежности, досто-

верности или обобщаемое™ относительно целевой совокупности, могут привести к этиче-

ским проблемам, поскольку клиент склонен рассматривать результаты исследования как

заслуживающие доверия. Кроме того, исследователь не должен адаптировать шкалы для

смещения результатов в каком-либо направлении. Это легко сделать, изменяя словесные

утверждения (шкалы Лайкерта), описания или другие аспекты шкалы. Рассмотрим опи-

сания шкалы. Описания, используемые в рамках шкалы, могут влиять на результаты

оценки, например, создавать позитивное мнение о торговой марке и клиенте или нега-

тивный имидж конкурентов. Для завышения оценки торговой марки клиента респонден-

тов могут попросить выразить мнение о ней по нескольким пунктам по семибалльной

шкале с крайними описаниями "наихудший" и "хороший". В этом случае респонденты

неохотно ставят оценку "наихудший". На самом деле те респонденты, которые оценивают

товар как средний, в итоге поставят ему хорошую оценку. Попробуйте сами. Как вы оце-

ните автомобили BMW по следующим характеристикам?

Надежность Ужасная 1 2 3 4 5 6 7 Хорошая

Эксплуатационное^ Очень низкая 1 2 3 4 5 6 7 Хорошая

Качество Одно и з наихудших 1 2 3 4 5 6 7 Хорошее

Престиж Очень низкий 1 2 3 4 5 6 7 Хороший

Вы положительно оценили автомобили BMW] С помощью этой же методики можно сме-

стить оценку конкурирующих торговых марок, используя не слишком негативное описание

(в некоторой степени плохой) с сильным позитивным описанием (наилучший).

Таким образом, подчеркивается важность использования сбалансированных шкал со срав-

нительными позитивными и отрицательными описаниями. Когда данный аспект не учитыва-

ется, возможно смещение результатов, и они должны рассматриваться соответственно. Иссле-

дователь несет ответственность как перед клиентом, так и перед респондентами за примени-

мость и полезность шкалы, что проиллюстрировано на следующем примере.

I ПРИМЕР. Этическая шкала для измерения этики

Важность этики общеизвестна. Что вы скажете об измерении этики маркетинговых

исследований? Для подобных измерений группа исследователей обратилась к принци-

пам этики (подробности — в главе 24) и разработала шкалу для оценки этики. В резуль-

тате было получено 29 биполярных семибалльных шкал типа: "справедливо" -

"несправедливо" и "эффективно" — "неэффективно". Тестирование шкал с помощью

различных этических сценариев показало, что их надежность (расчет коэффициента

"альфа" Кронбаха) довольно высока, как и степень конструктивной достоверности.

Разработанные шкалы использовались в разных контекстах при исследовании этиче-

ских вопросов маркетинга [39].

360 Часть II. Разработка плана исследования

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА

Непрерывные рейтинговые шкалы можно легко разместить в Internet. Курсор может пере-

мешаться по непрерывной шкале на экране, чтобы отметить категорию, наилучшим образом

описывающую мнение респондента, Более того, данные оценки могут автоматически рассчи-

тываться компьютером, увеличивая скорость и точность обработки данных.

Так же могут применяться в Internet и три вида детализированных шкал. Более того, с по-

мощью Internet можно осуществлять поиск и размещать шкалы, подобные используемым дру-

гими исследователями. Возможно шкалы, используемые другими маркетологами, уже прошли

тестирование на надежность и достоверность. Поэтому, прежде чем составлять новую шкалу,

следует рассмотреть схожие шкалы, используемые другими исследователями, и применять их,

если они удовлетворяют целям измерения. Отдел исследования шкал (Office of Scale Research)

Университета Северного Иллинойса, известный благодаря выпуску книги Marketing Scales

Handbook ("Руководство по шкшзам в маркетинге") разместил свои технические отчеты в Internet

(www.siu.edu/departments/coba/mktg/osr).

ПРИМЕР. Исследование безопасности и конфиденциальности Internet проект

HERMES

Исследовательский проект HERMES Бизнес-школы Мичиганского университета охва-

тывает аспекты безопасности и конфиденциальности при работе в Internet.

Опрос содержит несколько вопросов относительно личного мнения респондентов о сте-

пени риска при совершении сделок в Internet. При ответе на каждый вопрос респондент с

помощью кнопочного меню может выбрать количество очков от одного до семи. После отве-

та на все вопросы респондента просят подтвердить свои ответы.

Несмотря на некоторые ограничения, использование семибалльной шкалы оказалось

эффективным при измерении отношения респондентов к безопасности сделок в Internet,

включая восприятие риска.

При разработке и тестировании непрерывных и детализированных рейтинговых шкал,

особенно многомерных, полезно использовать компьютеры. Модуль EZWRITER, подклю-

ченный к компьютеру системы интервьюирования C-SURVENT, использует определенный

алгоритм для разработки шкалы. EZWRITER, разработанный Computers for Marketing

Corporation (CfMC), способен адаптировать шкалы для печатных опросов или телефонных ин-

тервью на компьютерных экранах, что без автоматизации заняло бы много времени. Для со-

ставления детализированных рейтинговых шкал существует ряд других программ.

ATTITUDE SCALES компании Persimmon Software создает несколько рейтинговых шкал для

измерения отношений в маркетинговых и социологических опросах. Некоторые из про-

граммных продуктов для разработки опросов, обсуждаемых в главе 10, могут конструировать

сравнительные и несравнительные шкалы.

В центре внимания Burke

Каждое исследование, проводимое Burke, направлено на удовлетворение индивидуаль-

| ной потребности клиента, и поэтому использование шкал существенно различается. Компа-

| ния применяет практически все описанные в данной главе шкалы, но особенно популярна

шкала Лайкерта. В своих фирменных исследованиях для различных клиентов компания ис-

пользует определенный протокол и набор шкал. Рассмотрим шкалы, разработанные для

оценки постоянства клиентов и составления стратегического плана, направленного на раз-

витие приоритетных направлений компании. Согласно протоколу Burke необходимо ис-

пользовать следующие три критерия для разработки комплексного измерителя, известного

как Коэффициент уверенности в клиентах™ (Secure Customer Index™):

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 361

Общая удовлетворенность

4 — Очень удовлетворен

3 — Частично удовлетворен

2 — Частично неудовлетворен

1 — Очень неудовлетворен

Готовность порекомендовать

5 ~ Обязательно порекомендую

4 — Наверное, порекомендую

3 — Возможно, порекомендую, а возможно — нет

2 — Вероятно, не порекомендую

1 — Точно не порекомендую

Вероятность повторного обращения

5 — Обязательно воспользуюсь еще раз

4 — Вероятно, воспользуюсь еще раз

3 — Возможно воспользуюсь, а возможно, и не воспользуюсь еще раз

2 — Вероятно, больше не воспользуюсь

1 — Точно больше не воспользуюсь

Коэффициент уверенности в клиентах™ включает процент клиентов, которые "очень

удовлетворены", "обязательно порекомендуют" и "обязательно воспользуются продуктом

или услугами еще раз".

Удовлетворение

потребителей

Повторные

покупки

Обязательно

воспользуюсь

еще раз

Рекомендации

потребителей

Burke обнаружила, что коэффициент уверенности в клиентах™, более дифференцирую-

щий, чем обший вопрос удовлстворенности. Burke также отметила высокую корреляцию

между коэффициентом уверенности в клиентах™ и фактическими показателями эффектив-

ности деятельности, такими как рентабельность, доля рынка и коэффициент постоянных

клиентов. Например, при изучении коммерческих закупок компьютерного оборудования и

программного обеспечения Burke обнаружила, что коэффициент постоянных клиентов воз-

растает с увеличением "уверенности":

Уровень уверенности Коэффициент постоянных клиентов (%)

Уверенный 88

Благоприятный 57

Безразличный 30

Неудовлетворительный 25

Кроме коэффициента уверенности в клиентах™ Burke также собирает данные по множе-

ству характеристик. И в этом случае используется шкала Лайкерта.

362 Часть II. Разработка плана исследования

РЕЗЮМЕ

При несравнительном шкалировании характеристики каждого объекта измеряются

(шкалируются) независимо от других объектов группы. Полученные данные обрабатываются

как интервальные или рейтинговые. Несравнительные рейтинговые шкалы могут быть непре-

рывными или детализированными. Шкала Лайкерта, семантическая дифференциальная шка-

ла и шкала Стэпела — разновидности детализированных рейтинговых шкал. При использова-

нии несравнительных детализированных рейтинговых шкал исследователю следует принять

решение о количестве используемых категорий, сбалансированности или несбалансированно-

сти шкалы, четном или нечетном количестве категорий, допустимости неопределенного ответа,

характера и степени вербального описания и формата.

Многомерные шкалы состоят из нескольких характеристик (пунктов), измеряемых рейтин-

говыми шкалами. Эти шкалы должны оцениваться с точки зрения надежности и достоверно-

сти. Надежность связана с тем, насколько устойчивы результаты при повторных исследовани-

ях. Различные подходы к оценке надежности включают повторное тестирование, метод альтер-

нативных форм и совместимости. Достоверность, или точность измерения, можно оценить с

помощью содержательной, критериальной и конструкционной достоверности.

Выбор конкретного метода шкалирования в данной ситуации должен базироваться на тео-

ретических или практических аргументах. В общем, используемый метод шкалирования дол-

жен давать максимально возможный уровень информации. Также следует применять различ-

ные методы измерений.

В международных маркетинговых исследованиях особое внимание должно уделяться опре-

делению эквивалентных вербальных описаний на различных языках и в различных культур-

ных средах. Исследователь несет ответственность перед клиентом и респондентами за приме-

нимость и полезность шкал. Internet и компьютеры — полезные инструменты при разработке и

тестировании непрерывных и пунктирных рейтинговых шкал, особенно многомерных.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ

детализированная рейтинговая шкала

(itemized rating scale)

дискриминантная достоверность

(discriminant validity)

достоверность (validity)

конвергенционная достоверность

(convergent validity)

конструктивная достоверность (construct

validity)

коэффициент "альфа" (coefficient alpha),

критериальная достоверность (criterion

validity)

модель истинной оценки (true score

model)

надежность (reliability)

непрерывная рейтинговая шкала

(continuous rating scale)

несравнитсльное шкалирование

(noncomparative scale)

помологическая достоверность

(nomological validity)

обобщаемость (generalizability)

ошибка измерения (measurement error)

повторное тестирование надежности (testretest

reliability)

проверка надежности делением данных на

половины (split-half reliability)

проверка надежности через тестирование

внутренней согласованности (internal

consistency reliability)

рейтинговая шкала с принудительными

ответами (forced rating scale)

сбалансированная шкала (balanced scale)

семантическая дифференциальная шкала,

семантический дифференциал (semantic

differential)

систематическая ошибка (systematic error)

случайная ошибка (random variable)

содержательная достоверность (content

validity)

шкала Лайкерта (Likert scale)

шкала Стэпела (Stapel scale)

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 363

УПРАЖНЕНИЯ

Вопросы

1. Что такое семантическая дифференциальная шкала? Для каких целей она используется?

2. Опишите шкалу Лайкерта.

3. В чем различия между шкалой Стэпела и семантическим дифференциалом? Какая шкала

более популярна?

4. Перечислите основные решения, которые нужно принять при составлении детализирован-

ной рейтинговой шкалы.

5. Сколько категорий должно использоваться в детализированной шкале и почему?

6. В чем различие между сбалансированной и несбалансированной шкалами?

7. Четное или нечетное количество категорий следует использовать в детализированной рей-

тинговой шкале?

8. В чем разница между шкалами с допустимым и недопустимым неопределенным ответом?

9. Каким образом природа объекта или вербальное описание влияют на ответы в детализиро-

ванной рейтинговой шкале?

10. Опишите многомерные шкалы.

11. Опишите модель истинной оценки.

12. Что такое надежность?

13. В чем различие между оценкой надежности с помощью повторного тестирования и альтер-

нативных форм?

14. Поясните смысл оценки надежности с помощью внутренней согласованности.

15. Что такое достоверность?

16. Что такое критериальная достоверность? Как она оценивается?

17. Как вы оценили бы конструктивную достоверность многомерной шкалы?

18. Как соотносятся надежность и достоверность?

19. Опишите ваш процесс выбора методов шкалирования.

Задачи

1. Разработайте шкалу Лайкерта, семантический дифференциал и шкалу Стэпела для измере-

ния лояльного отношения покупателей к магазину.

2. Разработайте многомерную шкалу для измерения отношений студентов к интернационализа-

ции курса менеджмента. Как будет оцениваться надежность и достоверность этой шкалы?

3. Разработайте шкалу Лайкерта для измерения отношений студентов к Internet как источнику

обшей информации. Проверьте вашу шкалу на небольшой выборке из десяти студентов и

усовершенствуйте ее.

4. Следующая шкала недавно использовалась в исследовании отношения к новым технологи-

ям. Пожалуйста, выскажите, насколько вы согласны или не согласны со следующими утвержде-

ниями с точки зрения описания вашего отношения к новым технологиям. Используйте шкалу от

единицы до пяти, где 1 — абсолютно не согласен, 5 — полностью согласен.

Я — человек, избегающий новых технологий.

Я — фанатик новых технологий и в курсе всех последних новинок.

При появлении новых технологий я придерживаюсь стратегии "поживем— увидим",

пока они не будут проверены.

364 Часть II. Разработка плана исследования

Я — хороший советчик для тех, кто хочет купить что-то, произведенное на основе новой

технологии.

a) Каким образом вы подсчитали бы баллы для измерения отношения к новой технологии?

b) Разработайте эквивалентную семантическую дифференциальную шкалу для измерения

отношения к новым технологиям.

c) Разработайте эквивалентную шкалу Стэпела для измерения отношения к новым тех-

нологиям.

d) Какая из шкал наиболее удобна для проведения телефонного опроса?

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ

INTERNET И КОМПЬЮТЕРА

1. Разработайте шкалу Лайкерта для измерения полезности Web-страницы Ford Motor Company.

Зайдите на страницу www. ford, com и оцените ее по разработанным вами шкалам.

2. Разработайте семантическую дифференциальную шкалу для измерения восприятия услуг

экспресс-доставки отправлений FedEx и сравните ее с предложенной UPS. Необходимую

информацию можно получить на страницах этих компаний (www.fedex.com и

www.ups .com).

3. Посетите в Internet сайт, посвященный шкалированию (www.siu.edu/departments/coba/

mktg/osr). Найдите один пример использования шкалы Лайкерта и один пример семанти-

ческого дифференциала. Напишите отчет, описывающий ситуацию, в которой эти шкалы

использовались.

4. Посетите Internet страницы двух компаний, специализирующихся на маркетинговых ис-

следованиях. Проанализируйте по одному исследованию каждой фирмы, чтобы критиче-

ски оценить используемые детализированные шкалы.

5. Найдите в Internet два примера шкалы Лайкерта, семантической дифференциальной

шкалы и шкалы Стэпеля. Напишите отчет, описывающий контекст, в котором приме-

няются эти шкалы.

КОММЕНТАРИИ

1. Chuck Ross, "TVB, Nielsen Examining TV Sweeps Alternatives", Advertising Age, May 12, 1997,

p. 10, 8; Douglas M. Stayman, David A. Aaker, "Continuous Measurement of Self-Report of

Emotional Response", Psychology & Marketing, May—June 1993, p. 199-214.

2. Heidi Toliver, "A Tale of Four Cities: How Paris, London, Florence and New York Measure — and

React - to What Riders Want", Mass TransitXXII, March-April 1996, p. 22-30,107.

3. Patrick Dalton, "What Would You Do?", Bank Marketing, February 1996, p. 12, 49; "Americans

Voice Opinions on the Services Industry", Marketing News, November 20, 1987, p. 18,

4. Ian P. Murphy, "RAMS Helps Best Western Tout Worldwide Positioning", Marketing News,

January 6, 1996, p. 25.

5. ORTEK Data Systems, Inc.

6. G. Albaum, "The Likert Scale Revisited — An Alternate Version", Journal of the Market Research

Society, April 1997, p. 331-348; C.J. Brody, J. Dietz, "On the Dimensionality of 2-Question

Format Likert Attitude Scales", Social Science Research, June 1997, p. 197—204; Rensis Liken,

"A Technique for the Measurement of Attitudes", Archives of Psychology 140 (1932).

7. См. статью Jennifer L. Aaker, "Dimensions of Brand Personality", Journal of Marketing Research,

August 1997, p. 347-356.

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 365

8. Joel Herche, Brian Engelland, "Reversed-Polarity Items and Scale Unidimensionality", Journal of

the Academy of Marketing Science, Fall 1996, p. 366—374.

9. John P. Walsh, Shu-Fen Tseng, "The Effects of Job Characteristics on Active Effort at Work",

Work & Occupations, February 1998, p. 74—96; George H. Lucas, Jr., A. Parasuraman, Robert A.

Davis, Ben M. Enis, "An Empirical Study of Salesforce Turnover", Journal of Marketing, July

1987, p. 34-59.

10. T.A. Chandler, C.J. Spies, "Semantic Differentia] Comparisons of Attributions and Dimensions

Among Respondents From 7 Nations", Psychological Reports (3 pt 1), December 1996, p. 747—758.

11. R. Millar, C. Brotherton, "Measuring the Effects of Career Interviews on Young People —

A Preliminary Study", Psychological Reports (3 pt 2), December 1996, p. 1207-1215.

12. Naresh K. Malhotra, "A Scale to Measure Self-Concepts, Person Concepts and Product Concepts",

Journal of Marketing Research, November 1981, p. 456-464. См. также статью Jennifer L. Aaker,

"Dimensions of Brand Personality", Journal of Marketing Research, August 1997, p. 347—56.

13. Тем не менее существует незначительная разница в результатах в зависимости от того, яв-

ляются данные порядковыми или интервальными. См. статьи M.D. Garcia-pena et al.,

"Development and Validation of an Inventory for Measuring Job Satisfaction among Family

Physicians", Psychological Reports, August 1996, p. 291-301; John Gaiton, "Measurement Scales

and Statistics: Resurgence of an Old Misconception", Psychological Bulletin 87 (1980), p. 564—567.

14. Timothy H. Reisenwitz, G. Joseph Wimbish, Jr., "Over-the-Counter Pharmaceuticals: Exploratory

Research of Consumer Preferences Toward Solid Oral Dosage Forms", Health Marketing Quarterly,

1996, p. 47-61; S. Malhotra, S. Van Auken, S.C. Lonial, "Adjective Profiles in Television Copy

Testing", Journal of Advertising Research, August 1981, p. 21—25.

15. Jan Stapel, "About 35 Years of Market Research in the Netherlands", Markonderzock

Kwartaalschrift, 1969, p. 3-7.

16. Robert F. Devellis, Scale Development: Theories and Applications (Thousand Oaks, CA: Sage

Publications, 1991); Michael J. Etzel, Terrell G. Williams, John C. Rogers, Douglas J, Lincoln, "The

Comparability of Three Stapel Scale Fonns in a Marketing Setting", in Ronald F, Bush, Shelby

D. Hunt (eds.), Marketing Theory: Philosophy of Science Perspectives (Chicago: American Marketing

Association, 1982), p. 303-306.

17. A.M. Coleman, C.E. Norris, C.C. Peterson, "Comparing Rating Scales of Different Lengths —

Equivalence of Scores from 5-Point and 7-Point Scales", Psychological Reports, April 1997, p. 355-

362; Madhubalan Viswanathan, Mark Bergen, Terry Childers, "Does a Single Response Category in

a Scale Completely Capture a Response?", Psychology & Marketing, August 1996, p, 457—479; Eli

P. Cox III, "The Optimal Number of Response Alternatives for a Scale: A Review", Journal of

Marketing Research, November 1980, p, 407—422.

18. D.F. Alwin, "Feeling Thermometers versus 7-Point Scales— Which Are Better", Sociological

Methods & Research, February 1997, p. 318—340; M.M.Givon, Z. Shapira, "Response to Rating

Scales: A Theoretical Model and Its Application to the Number of Categories Problem", Journal of

Marketing Research, November 1984, p. 410—419; D.E. Stem, Jr., S. Noazin, "The Effects of

Number of Objects and Scale Positions on Graphic Position Scale Reliability", in R.F. Lusch et al.,

1985 AMA Educators' Proceedings (Chicago: American Marketing Association, 1985, p. 370—372.

19. D. Watson, "Correcting for Acquiescent Response Bias in the Absence of a Balanced Scale — An

Application to Class-Consciousness", Sociological Methods & Research, August 1992, p. 52—88;

H. Schuman, S. Presser, Questions and Answers in Attitude Surveys (New York: Academic Press,

1981), p. 179-201.

20. G.J. Spagna, "Questionnaires: Which Approach Do You Use?", Journal of Advertising Research,

February-March 1984, p. 67-70.

21. Kathy A. Hanisch, "The Job Descriptive Index Revisited: Questions about the Question Mark",

Journal of Applied Psychology, June 1992, p. 377—382; K.C. Schneider, "Uninformed Response Rate

in Survey Research", Journal of Business Research, April 1985, p. 153—162.

366 Часть II. Разработка плана исследования

22. K.M. Gannon, T.M. Ostrom, "How Meaning is Given to Rating Scales— The Effects of Response

Language on Category Activation", Journal of Experimental Social Psychology, July 1996, p. 337—360;

H.H. Friedman, J.R. Lecfer, "Label versus Position in Rating Scales", Journal of the Academy of

Markeling Science, Spring 1981, p. 88—92.

23. D.F. Alwin, "Feeling Thermometers versus 7-Point Scales— Which Are Better", Sociological

Methods & Research, February 1997, p. 318-340.

24. Последние исследования построения многомерных шкал приведены в статье Jennifer L. Aaker,

"Dimensions of Brand Personality", Journal of Marketing Research, August 1997, p. 347—256.

25. Например, см. статью Anusom Singhapakdi, Scott J. Vitell, Kumar C. Rallapalli, Kenneth

L. Kraft, "The Perceived Role of Ethics and Social Responsibility: A Scale Development", Journal of

Business Ethics, November 1996, p. 1131-1140.

26. Stephania H. Davis, "Smart Products for Smart Marketing", Telephony, March 2, 1998, p. 66; Erin

Anderson, Wujin Chu, Barton Weitz, "Industrial Purchasing: An Empirical Exploration of the

Buyclass Framework", Journal of Marketing, July 1987, p. 71—86.

27. K. Kim, Gary L. Frazier, "Measurement of Distributor Commitment in Industrial Channels of

Distribution", Journal of Business Research, October 1997, p. 139-154; Eric A. Greenleaf,

"Improving Rating Scale Measures by Detecting and Correcting Bias Components in Some

Response Styles", Journal Marketing Research, May 1992, p, 176—188.

28. E.J. Wilson, "Research Design Effects on the Reliability of Rating Scales in Marketing — An Update

on Churchill and Peter", Advances in Consumer Research 22 (1995), p. 360—365; William D,

Perreault, Jr., Laurence E. Leigh, "Reliability of Nominal Data Based on Qualitative Judgments",

Journal of Marketing Research, May 1989, p. 135—148; J. Paul Peter, "Reliability: A Review of

Psychometric Basics and Recent Marketing Practices", Journal of Marketing Research, February

1979, p. 6-17.

29. Simon S.K. Lam, K.S. Woo, "Measuring Service Quality: A Test-Retest Reliability Investigation of

SERVQUAL", Journal of the Market Research Society, April 1997, p. 381-396.

30. David Armstrong, Ann Gosling, John Weinman, Theresa Marteau, "The Place of Inter-Rater

Reliability in Qualitative Research: An Empirical Study", Sociology: The Journal of the British

Sociological Association, August 1997, p. 597—606; M.N. Segal, "Alternate Form Conjoint

Reliability", Journal of Advertising Research, April 1984, p. 31—38.

31. Robert A. Peterson, "A Meta-Analysis of Chronbach's Coefficient Alpha", Journal of Consumer

Research, September 1994, p. 381—391; L,J Cronbach, "Coefficient Alpha and the Internal Structure

ofTests", Psychometrika 16 (1951), p. 297-334.

32. David M. ZeitHn, Richard A. Westwood, "Measuring Emotional Response", Journal of Advertising

Research, October—November 1986, p. 34—44.

33. D.G. McTavish, "Scale Validity— A Computer Content-Analysis Approach", Social Science

Computer Review, Winter 1997, p. 379—393; Peter J. Paul, "Construct Validity: A Review of Basic

Issues and Marketing Practices", Journal of Marketing Research, May 1981, p. 133-135.

34. Более подробно о проблеме достоверности см. в статье M. Joseph Sirgy, Dhruv Grewal, Tamara

F. Mangleburg, Jae-ok Park et al., "Assessing the Predictive Validity of Two Methods of Measuring

Self-image Congruence", Journal of the Academy of Marketing Science, Summer 1997, p. 229—241;

Rosann L, Spiro, Barton A. Weitz, "Adaptive Selling: Conceptualization, Measurement, and

Nomological Validity", Journal of Marketing Research, February 1990, p. 61-69.

35. Обсуждение обобщаемости и ее применения в маркетинговых исследованиях приведено в

статьях Shuzo Abe, Richard P. Bagozzi, Pradip Sadarangani, "Ал Investigation of Construct

Validity and Generalizability of the Self-Concept: Self-Consciousness in Japan and the United

States", Journal of International Consumer Marketing, March—April 1996, p. 97—123; Joseph O.

Rentz, "Generalizability Theory: A Comprehensive Method for Assessing and Improving the

Dependability of Marketing Measures'", Journal of Marketing Research, February 1987, p. 19—28.

Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 367

36. Timothy R. Hinkin, "A Review of Scale Development Practices in the Study of Organizations",

Journal of Management, May 1995, p. 967—SS.

37. Michael R. Mullen, George R. Milne, Nicholas M. Didow, "Determining Cross-Cultural Metric

Equivalence in Survey Research: A New Statistical Test", Advances in International Marketing,

August 1996, p. 145-157; E. Gencturk, T.L. Childers, R.W. Ruekert, "International Marketing

Involvement— The Construct, Dimensionality, and Measurement", Journal of Internationa!

Marketing, April 1995, p. 11-37.

38. Alan L. Unikel, "Imitation Might Be Flattering, but Beware of Trademark Infringement",

Marketing News, September 11, 1997, p. 20—21; Betsy McKay, "Xerox Fights Trademark Battle",

Advertising Age International, April 27, 1992, p. 1—39.

39. Scott J. Vitell, Foo Nin Ho, "Ethical Decision Making in Marketing; A Synthesis and Evaluation of

Scales Measuring the Various Components of Decision Making in Ethical Situations", Journal of

Business Ethics, May 1997, p. 699-717; R.E. Reidenbach, D.P. Robin, "Some Initial Steps toward

Improving the Measurement of Ethical Evaluations of Marketing Activities", Journal of Business

Ethics, July 1988, p, 871—879; R. Eric Reidenbach, Donald P. Robin, "A Response to On Measuring

Ethical Judgments", Journal of Business Ethics, February 1995, p. 159—162.

368 Часть II. Разработка плана исследования

 

Дата: 2019-02-25, просмотров: 545.