Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

После изучения материала этой главы вы должны уметь...

1. Описывать значимость предварительного анализа данных, понимать, что можно получить

из такого анализа.

2. Обсуждать анализ данных, опирающийся на распределение частот значений переменной,

включающий анализ центра распределения, изменчивости и формы кривой.

3. Объяснять анализ данных, связанный с кросс-табуляцией и имеющими к нему отношение

статистиками: хи-квадратом, фи-коэффициентом, коэффициентом сопряженности,

V-коэффициентом Крамера и коэффициентом "лямбда".

4. Описывать анализ данных, связанный с параметрической проверкой гипотез для одной

выборки, двух независимых выборок и парных выборок.

5. Объяснять анализ данных, связанный с непараметрической проверкой гипотез для одной

выборки, двух независимых выборок и парных выборок.

КРАТКИЙ ОБЗОР

Эта глава посвящена базовому анализу данных, включающему изучение распределения час-

тот значений переменной (вариационных рядов), кросс-табуляцию (построение таблиц сопря-

женности) и проверку гипотез. Сначала мы рассмотрим распределение частот и объясним, как

с его помощью определить количество выбросов, пропущенных и экстремальных значений

данных, а также выявим центральную тенденцию в значениях изучаемых данных, их вариа-

цию и форму кривой распределения. Затем введем понятие проверки гипотез и опишем общую

процедуру проверки. Процедуры проверки гипотез делятся на проверку связей и проверку раз-

личий. Мы также рассмотрим использование кросс-табуляции для установления связи между

двумя или тремя переменными. Хотя природу связи можно увидеть из таблиц, статистики по-

зволяют определить значимость и силу связи. И наконец, мы познакомим вас с методами ста-

тистической проверки гипотез, связанных с различиями в одной или двух выборках.

Многие маркетинговые исследовательские проекты не выходят за рамки базового анализа

данных. Полученные по итогам исследования результаты часто отображают с помощью таблиц

и графиков, как будет показано в главе 22.

; СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

I Анализ исходных данных

В проекте "Выбор универмага" маркетологи сначала провели базовый анализ полученных

!ими данных, а затем на его основе —многомерный статистический анализ. Анализ данных

начался с построения вариационного ряда и вычисления описательных статистик для каж- ;

дои переменной. В дополнение к выявлению возможных проблем при обработке данных 1

(см. главу 14) полученная информация позволила хорошо "прощупать" данные, чтобы оп-

552 Часть til. Сбор, подготовка и анализ данных

ределить, каким образом они в дальнейшем будут анализированться. Например, следует ли

для целей анализа рассматривать переменные как имеющие категориальный характер, и ес-

ли да, то сколько категорий представлено в каждой переменной? Чтобы установить связи

между переменными, необходимо выполнить несколько операций кросс-табуляции для

двух и трех переменных. Для изучения влияния независимых переменных с двумя катего-

риями на метрические зависимые переменные маркетологи задействовали /-критерий и

другие процедуры проверки гипотез.

Результаты базового анализа данных ценны сами по себе и, кроме того, показывают на-

правление для последующего многомерного анализа. Чтобы читатель понял особенности ста-

тистических методов, мы приведем ряд примеров применения кросс-табуляции, критерия хи-

квадрат и проверки гипотез.

ПРИМЕР. Рекламная битва полов

При сравнении телевизионных роликов в Австралии, Мексике и Соединенных Штатах

Америки анализировалась роль пола в рекламе. Маркетологи выявили, что рекламные ро-

лики разных стран отличаются степенью участия в них мужчин и женщин. Для анализа

данных маркетологи применили кросс-табуляцию и статистическую проверку с использо-

ванием критерия хи-квадрат. В результате они получили следующие характеристики мекси-

канской рекламы.

Участники рекламы, %

Рекламируемый товар, который используют Женщины Мужчины

Женщины 25,0 4,0

Мужчины 6,8 11,8

Оба пола 68,2 84,2

Х2= 19,73, /><0,001

Отсюда следует, что в мексиканской рекламе женщины появляются для рекламы това-

ров, используемых женщинами или лицами обеих полов, но редко рекламируют товары для

мужчины. Мужчины рекламируют изделия, которыми пользуются и мужчины, и женщи-

ны. Эти различия в рекламе характерны также и для рекламных роликов США, хотя и в

меньшей степени, а вот в австралийской рекламе таких различий нет [1].

ПРИМЕР. Анализ воспринимаемого риска для различных видов продаж

Маркетологи сравнили продажи 12 видов товаров по каталогу и через розничную торго-

вую сеть. Результаты анализа показали, что следует отклонить выдвинутую гипотезу о том,

что нет сушественной разницы степени воспринимаемого потребителями риска для этих

двух видов продаж. Для проверки гипотезы были вычислены 12 (по одному для каждого то-

вара) /-критериев парных наблюдений. Средние значения степени риска (в баллах) для не-

которых из товаров в обоих видах продаж даны в приведенной ниже таблице, причем наи-

высший балл отвечает наибольшему риску.

Средние значения степени воспринимаемого риска (в баллах) для двух видов продаж

Общий воспринимаемый риск, в баллах

Продажа через магазины

ТоваР Про&ха по каталогу ^зничной торговли

Музыкальная высококачественная аппаратура 48,89 41,98"

Музыкальные альбомы 32,65 28,74'

Парадные туфли 58,60 50,80*

Телевизор с экраном 13 дюймов 48,53 40,91*

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 553

Спортивные носки 35,22

Карманный калькулятор 49,62

Фотоаппарат 35 мм 48,13

Духи 34,85

30,22*

42,00*

39,52*

29,79* 1

'Уровень значимости 0,01.

Из данных таблицы видно, что степень воспринимаемого риска при продаже товаров по

каталогу (при уровне статистической значимости р < 0,01) выше по сравнению с риском при

продаже товаров через магазины розничной торговли [2].

Пример, касающийся универсального магазина, показывает роль базового анализа данных

при использовании его в сочетании с методами многомерного анализа, в то время как два дру-

гих примера показывают, что этот анализ полезен и сам по себе. Использование кросс-

табуляции и критерия хи-квадрат в примере, связанном с телевизионной рекламой, и парного

(-критерия в примере с продажей товаров по каталогу позволяют маркетологам сделать вполне

конкретные выводы.

Статистические понятия, обсуждаемые в этой главе, проиллюстрированы на примере, по-

казывающим использование респондентами Internet для личных (не связанных с профессио-

нальной деятельностью) целей. Табл. 15.1 содержит данные о 30 респондентах, включающие

пол (1 — мужчина, 2 — женщина), степень знакомства с Internet (1 — почти незнаком, 7 — хо-

рошо знаком), использование Internet (в часах в неделю), отношение к Internet и Internet-

технологиям (измеренные по семибалльной шкале: 1 — неблагосклонное, 7 — благосклонное),

использование Internet для приобретения товаров или банковских операций (1 — да, 2 — нет).

На первом этапе анализа следует изучить распределение частот значений или вариационный

ряд соответствующих переменных.

Таблица 15.1. Данные об использовании Internet

На Рес-

пондента

1

\

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Лол

1,00

2,00

2,00

2,00

1,00

2,00

2,00

2,00

2,00

1.00

2,00

2,00

1,00

1,00

1,00

2,00

1,00

Знакомство

с Internet

7,00

2,00

3,00

3,00

7,00

4,00

2,00

3,00

3,00

9,00

4,00

5,00

6,00

6,00

0,00

4,00

6,00

Использование

Internet

14,00

2,00

3,00

3,00

13,00

6,00

2,00

6,00

6,00

15,00

3,00

4,00

9,00

8,00

5,00

3 ОС

9,00

Отношение

к internet

7,00

3,00

4,00

7,00

7,00

5,00

4,00

5,00

6,00

7,00

4 ОС

6,00

6,00

3,00

5,00

4 00

5,00

Отношение

к Internet-

технологиям

6,00

3,00

3,00

5,00

7,00

4,00

5,00

4,00

4,00

6,00

3,00

4 СО

5,00

2,00

4,00

;>, оо

3,00

Использование

для покупок

1,00

2,00

1,00

1,00

1,00

1,00

2,00

2,00

1,00

1,00

2,00

2,00

2,00

2,00

юо

2,00

1,00

Использование

для банковских

операций

1,00

2,00

2,00

; со

.,00

2,00

2,00

200

2,00

2,00

2,00

Г 00

,00

'' ОН

2,00

? 00

1,00

554 Часть III. Сбор, подготовка и анализ данных

Окончание табл. 15.1

№ Рес-

пондента

18

19

20

? 1

22

23

24

25

26

27

28

29

30

Пол

1,00

! ,00

2.00

1,00

100

2,00

1,00

2,00

100

200

2,00

1,00

1,00

Знакомство

с Internet

4,00

7,00

6,00

6,00

5,00

3,00

7,00

6. СО

6 ОС

5.00

4,00

4,00

3,00

Использование

Internet

4,00

14,00

6,00

9,00

5,00

2.00

15,00

6.00

13,00

4.00

2,00

4,00

3,00

Отношение

к Internet

5,00

6,00

6,00

4,00

5,00

400

6,00

5,00

6.00

5,00

3,00

5,00

7,00

Отношение

к Internet-

технологиям

4,00

6,00

4,00

2,00

4.00

2,00

6,00

3,00

6,00

5,00

2,00

3,00

5,00

Использование

для покупок

1,00

1,00

2,00

2,00

2,00

2,00

1,00

! ,00

1,00

1,00

2.00

1,00

1,00

Использование

для банковских

операций

2,00

1,00

2,00

2,00

I.OO

2.30

1,00

2,00

100

1,00

2.00

2,00

2,00

ВАРИАЦИОННЫЙ РЯД

При проведении маркетинговых исследований часто необходимо получить информацию об

одной переменной. Например;

• Какое количество потребителей определенной марки товара можно считать лояльными ей?

• Каково соотношение между разными группами потребителей товара: много исполь-

зующими, средне, слабо и не пользователями?

• Какое количество потребителей хорошо осведомлены о предлагаемом новом товаре?

Сколько потребителей поверхностно знакомы, сколько— что-то слышали, а сколько во-

обше ничего не знают о данной торговой марке? Какова средняя степень осведомленности

о товаре? Сильно ли различается степень осведомленность потребителей о новом товаре?

• Что представляет собой кривая распределения дохода для приверженцев данной мар-

ки товара? Смещено ли данное распределение в сторону группы потребителей с низ-

кими доходами?

Ответы на подобные вопросы можно получить, изучив распределение частот значений пере-

менной, или вариационный ряд (frequency distribution). При таком анализе рассматривается одна

переменная.

Вариационный ряд, распределение частот значений переменной

(frequency distribution).

Математическое распределение, цель которого - подсчет ответов, связанных с различными

значениями одной переменной (частот), и дальнейшее выражение их в процентном виде

(частости).

Целью построения вариационного ряда является подсчет ответов респондентов, в которых

приводятся различные значения переменной. Относительную частоту различных значений пе-

ременной выражают в процентах и называют частостямк. Подсчет распределения частот зна-

чений переменной дает возможность построить таблицу, с указанием частоты, частости и на-

копленных частостей для всех значений этой переменной.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 555

В табл. 15.2 представлено распределение частот осведомленности об Internet. Первая колон-

ка содержит отметки, присвоенные различным категориям переменной, а вторая — коды, при-

своенные каждому значению переменной.

Таблица 15.2. Распределение частот осведомленности об Internet

Отметка значения Значение Частоты {N) Частости Достоверные частости Накопленные частости

1

Плохо осведомлены

Хорошо осведомлены

2

1

2

"

4

5

6

7

9

Итого

3

0

а

б

е

3

8

4

1

30

4

0,0

6,7

20,0

20,0

10,0

26,7

13,3

3,3

100,0

5

0,0

6,9

20,7

20,7

10,3

27,6

13,8

Пропуск

100,0

6

0,0

6,9

27,6

48,3

58,6

86,2

100,0

Обратите внимание, что код 9 присвоен пропущенным значениям. В третьей колонке при-

ведено количество ответивших респондентов. Например, три респондента отметили в анкете

галочкой значение 5, указав, что они что-то слышали об Internet. В четвертой колонке приведен

процент респондентов, отметивших в анкете галочкой данное значение. В следуюшей колонке

показаны проценты, подсчитанные с учетом пропущенных значений. Если пропущенных зна-

чений нет, то колонки 4 и 5 идентичны. В последней колонке представлены накопленные час-

тости после корректировки пропущенных случаев (ответов респондентов). Как видно, из 30

респондентов, участвующих в опросе, 10% отметили значение 5. Если исключить одного рес-

пондента с пропущенным значением, то частость увеличится до 10,3%. Накопленная частость,

относящаяся к значению 5, равна 58,6. Другими словами, 58,6% респондентов с достоверными

ответами показали значение осведомленности 5 или меньше.

3 4 5 t

Знакомство с Internet

Рис. 15.1. Гистограмма распределения частот

556 Часть III. Сбор, подготовка и анализ данных

Вариационный ряд помогает определить долю неответивших респондентов (в табл. 15.2

один респондент из 30 не ответил на вопрос), а также указывает долю ошибочных ответов. Зна-

чения, равные 0 или 8, соответствуют ошибочным ответам. Следует определить количество слу-

чаев с такими значениями и соответственно откорректировать результат. Кроме того, можно ус-

тановить наличие выбросов, т.е. случаев с экстремальными значениями. При анализе распре-

деления частот относительно размера домохозяйства (семьи) выбросами следует считать

несколько семей, состоящих не меньше чем девяти человек. Распределение частот также опре-

деляет форму эмпирического распределения значений переменной. Частотные данные можно

использовать для построения гистограмм или вертикальных столбчатых диаграмм, на которых

по оси ЛГоткладывают значения переменной, а по оси Y— абсолютные (частоты) или относи-

тельные (частости) значения. На рис. 15.1 представлена гистограмма для данных табл. 15.2. По

гистограмме можно проверить, соответствует ли наблюдаемое распределение предполагаемому

маркетологом распределению.

Для иллюстрации наших рассуждений рассмотрим следующий пример.

ПРИМЕР. Этические проблемы в рекламе

В опросе, касающемся этических проблем, руководителей рекламных агентств просили

описать наиболее трудные этические проблемы, с которыми они сталкиваются в повседнев-

ной работе. Распределение частот показало, что чаше всего они испытывали следующие про-

блемы: честное отношение к своим клиентам; создание объективной, не вводящей в заблуж-

дение, социально значимой рекламы; принятие решения о целесообразности оказания услуг

клиентам, чьи продукты или услуги вредят здоровью, ненужны, бесполезны и неэтичны;

честное отношение к поставщикам, партнерам и посредникам; справедливое отношение к

сотрудникам и менеджерам; объективное и честное отношение к другим рекламным

агентствам [3].

Этические проблемы руководителей рекламных агентств

Ответы

Проблема

1. Честное отношение к своим клиентам

2. Создание честной, не вводящей в заблуждение, социально значимой рекламы

3. Принятие решения о целесообразности предоставления услуг клиентам, чьи продукты

или услуги вредят здоровью, ненужны, бесполезны и неэтичны

4. Честное отношение к поставщикам, партнерам и посредникам

5. Честное отношение к сотрудникам и менеджерам

6. Объективное и честное отношение к другим рекламным агентствам

7. Другие

8. Ответов нет

Итого

Количество

80

66

34

25

15

7

11

43

281

Процент

28

24

12

9

5

3

4

15

100%

Данные в этом примере указывают на распространенность различных этических проблем.

Поскольку при этом используют числовые значения, для вычисления описательных статистик

можно применить распределение частот. Вычисление некоторых статистик, связанных с рас-

пределением частот, обсуждается в следующем разделе.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 557

СТАТИСТИКИ. СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ

ЧАСТОТ

Как следует из предыдущего раздела, распределение частот — удобный способ представ-

ления различных значений переменной. Таблица вариационного ряда легко читается и со-

держит основную информацию, но иногда такая информация слишком детализированна, и

исследователь вынужден обобщать ее с помощью описательных статистик [4]. Чаще всего

используют следующие статистики, связанные с распределением частот: показатели центра

распределения (среднее, мода и медиана), показатели вариации (размах, меж квартальный

размах, стандартное отклонение и коэффициент вариации) и показатели формы распределе-

ния (асимметрия и эксцесс) [5].

Показатели центра распределения

Показатели центра распределения (measures of location) характеризуют положение центра

распределения, вокруг которого концентрируются данные. Если всю выборку изменить, доба-

вив фиксированную величину к каждому наблюдению, то среднее, мода и медиана изменятся

на аналогичную величину.

Показатели центра распределения (measures of location)

Статистики, которые характеризуют значение признака, вокруг которого концентрируются

наблюдения, или, как говорят, показывают центральную тенденцию распределения.

Среднее арифметическое или выборочное среднее (mean) — это наиболее часто используе-

мый показатель, характеризующий положение центра распределения. Он используется для

оценки среднего значения в случае, если данные собраны с помощью интервальной или отно-

сительной шкалы. Его величина должна отражать некоторое среднее значение, вокруг которого

распределена большая часть ответов.

Среднее арифметическое, выборочное среднее (mean)

Эта величина получается делением суммы всех имеющихся значений переменной на число

значении,

Среднее арифметическое X задается формулой

где X t— полученные значения переменной X, п — число наблюдений (размер выборки).

Обычно среднее значение — устойчивый показатель и заметно не изменяется при добавле-

нии или вычитании значений данных. Для частот, представленных в табл. 15.2, среднее ариф-

метическое вычисляют следующим образом:

— _ (2x2 + 6x3 + 6x4 + 3x5 + 8x6 + 4x7) _ (4 + 18 + 24 + 15 + 48 + 28) _,,„,.,„_, „„,

А — — — \jli2.f—'+il2A

29 29

Мода (mode) — значение переменной, встречающееся чаще других. Представляет наивыс-

шую точку (пик) распределения. Мода хороший показатель центра распределения, если пере-

менная имеет категорийный характер, или, иначе говоря, ее можно разбить на категории.

Мода (mode)

Значение переменной, которое чаще всего встречается в выборочном распределении.

Медиана (median) выборки — это значение переменной в середине ряда данных, располо-

женных в порядке возрастания или убывания, Положение медианы определяется ее номером.

558 Часть III. Сбор, подготовка и анализ данных

Если число данных четное, то медиана равна полусумме двух серединных значений. Медиа-

на— это 50-й процентиль. Она характеризует положение центра распределения порядковых

данных. В табл. 15.2 медиана равна 5,000.

Медиана (median)

Значение переменной, которое приходится на середину распределения частот, т.е. одна по-

ловина всех значений больше медианы, а другая половина - меньше.

Как видно из табл. 15.2, три показателя, характеризующих положение центра распределе-

ния для рассматриваемого нами примера, различны (среднее значение — 4,724; мода — 6,000;

медиана — 5,000). И это неудивительно, поскольку каждый показатель определяет центр рас-

пределения по-разному. Какой же показатель использовать? Если переменную измеряют по

номинальной шкале, то лучше использовать моду. Если переменную измеряют по порядковой

шкале, то больше подходит медиана. Если же переменную измеряют по интервальной или от-

носительной шкале, то мода плохо отражает положение центра распределения. Это можно уви-

деть из табл. 15.2. Хотя значение моды, равное 6,000, отражает наивысшую частоту, оно пред-

ставляет только 27,6% выборки. Медиана лучше подходит в качестве показателя, характери-

зующего положение центра распределения, для интервальной или относительной шкалы, хотя

и она не учитывает имеющуюся информацию о переменной. Текущие значения переменной до

и после медианы игнорируются. Самый лучший показатель для интервальной или относи-

тельной шкалы — среднее арифметическое. Он учитывает всю доступную информацию, по-

скольку для его вычисления используются все значения. Однако среднее арифметическое чув-

ствительно к выбросам значений (экстремально малым или экстремально большим значени-

ям). Если данные содержат выбросы, то среднее не будет хорошим показателем центра

распределения и лучше использовать два показателя — среднее и медиану.

Показатели вариации

Показатели вариации (изменчивости) (measures of variability), вычисляемые на основании

данных, измеряемых с помощью интервальных или относительных шкал, включают размах

вариации, межквартильный размах, дисперсию, стандартное отклонение и коэффициент

вариации.

Показатели вариации (изменчивости) (measures of variability)

Статистики, показывающие меру разброса (вариабельность) значений переменной.

Размах вариации (range) отражает разброс данных. Он равен разности между наибольшим и

наименьшим значениями в выборке. Поэтому на него непосредственно влияют выбросы.

Размах вариации (range)

Разность между наибольшим и наименьшим значениями переменной в вариационном ряду.

Размах = Xuacfumihligf - Хна!ме„ьа1С1

Если все значения данных умножить на константу, то значение размаха вариации умножа-

ется на ту же константу. Размах вариации в табл. 15.2 равен: 7 — 2 = 5,000.

Межквартильный размах (interquartile range) — это разность между 75- и 25-м процентиля-

ми. Для набора точек данных, расположенных в ранжированном ряду, />-м процентилем будет

такое значение переменной в ранжированном ряду распределения, что/>% единиц совокупно-

сти будут меньше и (100 — р)% — больше него. Если все значения данных умножить на кон-

станту, то межквартильный размах умножается на эту же константу. Межквартильный размах в

табл. 15.2 равен 6 - 3 = 3,000.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 559

Межквартильный размах (interquartile range)

Размах вариации распределения, охватывающий центральные 50% всех наблюдений.

Разность между средним значением переменной и ее наблюдаемым значением называют

отклонением от среднего. Дисперсия (variance) — среднее из квадратов отклонений переменной

от ее средней величины. Она никогда не может быть отрицательной. Если значения данных

сгруппированы вокруг среднего, то дисперсия невелика. И наоборот, если данные разбросаны,

то мы имеем дело с большей дисперсией. Если все значения данных умножить на константу, то

дисперсия умножится на квадрат константы. Среднеквадратическое (стандартное) отклонение

(standard deviation) равно квадратному корню из дисперсии. Таким образом стандартное откло-

нение выражается в тех же единицах, что и сами данные.

Дисперсия (variance)

Среднее из квадратов отклонений переменной от ее средней величины.

Среднеквадратическое (стандартное) отклонение (standard deviation)

Корень квадратный из значения дисперсии.

Стандартное отклонение выборки s x вычисляют следующим образом;

я-1

Мы делим на п —1 вместо л, поскольку генеральное среднее неизвестно, и вместо него ис-

пользуют выборочное среднее, что делает выборку менее изменчивой, чем фактически. Деля на

п —1 вместо п, мы корректируем более слабую изменчивость значений переменой, наблюдае-

мую в выборке. Для данных, приведенных в табл. 15.2, дисперсию вычисляют так;

V ={2х(2-4,724)2 + 6х(3-4,724): + бх(4-4Л24)2 + Зх(5-4,724)2 +

+8х(б-4,724)2 +4х(7-4,724):}/

/28 :

{14,840+17,833 + 3,145 + 0,229 + 13,025 + 20,721} 69,793

= 1 1=—: = 2,493

28 28

Следовательно, стандартное отклонение находим по формуле;

s,.=V2,493 =1,579

Коэффициент вариации (coefficient of variation) — это отношение стандартного отклонения к

среднему арифметическому, выраженное в процентах. Коэффициент вариации — показатель

относительной изменчивости переменной. Коэффициент вариации CVвычисляют так:

CV=s. /X"

Коэффициент вариации (coefficient of variation)

Величина относительной изменчивости переменной, представляющая собой отношение ее

стандартного отклонения к ее среднему значению.

Коэффициент вариации имеет смысл, только если переменную измеряют по относитель-

ной шкале. Поскольку степень знакомства с Internet измерена не по этой шкале, то бессмыс-

ленно вычислять коэффициент вариации для данных табл. 15.2.

560 Часть III. Сбор, подготовка и анализ данных

Показатели формы распределения

Показатели формы распределения, как и показатели вариации, также полезны для пони-

мания природы распределения переменной. Форму распределения оценивают с помощью

асимметрии и эксцесса.

Асимметрия. Распределение переменной может быть симметричным или асимметричным

(скошенным). При симметричном распределении частоты любых двух значений переменной,

которые расположены на одном и том же расстоянии от центра распределения, одинаковы.

Равны между собой также и значения среднего арифметического, моды и медианы. Распреде-

ление асимметрично (skewness), если значения переменной, равноудаленные от среднего, име-

ют разную частоту, т.е. одна ветвь распределения вытянута больше другой (рис. 15.2). Значение

асимметрии для распределения данных табл. 15.2 равно —0,094; что указывает на незначитель-

ную отрицательную асимметрию.

Симметричное распределение

Среднее

Медиана

Мода

Асимметричное распределение

Среднее Медиана Мода

Рис. 15.2. Асимметрия распределения

Асимметрия (skewness)

Характеристика распределения, которая оценивает симметрию расположения значений дан-

ных относительно средней.

Эксцесс (kurtosis) — это показатель относительной крутости (островершинности или плос-

ко верш и нности) кривой вариационного ряда по сравнению с нормальным распределением.

Эксцесс нормально распределенной случайной величины равен нулю. Если эксцесс положите-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 561

лен, то распределение более островершинно по сравнению с нормальным распределением. При

отрицательном значении распределение более плосковершинно по сравнению с нормальным,

Значение этой статистики для табл. 15.2 равно —1,261; это указывает на то, что распределение

более плосковершинное по сравнению с нормальным.

Эксцесс (kurtosis)

Мера относительной крутости кривой распределения частот.

ВВЕДЕНИЕ В ТЕОРИЮ ПРОВЕРКИ ГИПОТЕЗ

Этот раздел посвящен введению в теорию проверки гипотез. Базовый анализ данных неиз-

менно включает в себя статистическую проверку гипотез. Приведем примеры гипотез в марке-

тинговых исследованиях.

• Число постоянных покупателей универмага превышает 10% семей.

• Потребители определенной марки товара, которые отличаются между собой уровнем

его потребления (много и мало), различаются также и психографическими характери-

стиками.

• Рассматриваемый отель имеет более высокий имидж, чем его ближайший конкурент,

• Чем лучше респондент знаком с рестораном, тем чаще он его посещает.

В главе 12 мы рассмотрели понятия выборочного распределения, стандартную ошибку

среднего и доли и доверительный интервал [6]. Все они относятся к проверке гипотезы и по-

этому необходимо вспомнить их. Ниже мы опишем общую схему проверки гипотезы, которая

применима к проверке гипотез с большим диапазоном параметров.

ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Для проверки гипотезы необходимо выполнить следующие этапы (рис.15.3).

1. Сформулировать нулевую гипотезу Н 0 и альтернативную гипотезу Н,.

2. Выбрать подходящий метод статистической проверки гипотезы (статистический критерий)

и соответствующую статистику критерия (выборочную статистику, тест-статистику).

3. Выбрать уровень значимости а.

4. Определить размер выборки и собрать данные. Вычислить значение выборочной ста-

тистики.

5. Определить вероятность, которую примет статистика критерия (выбранная на этапе 2) при

выполнении нулевой гипотезы, используя соответствующее выборочное распределение.

Альтернативный вариант данного этапа: определить критическое значение статистики, ко-

торое делит интервал на область принятия и непринятия нулевой гипотезы.

6. Сравнить полученную вероятность для тест-статистики (статистики, построенной по ре-

зультатам выборочного наблюдения) с заданным уровнем значимости. Альтернативный ва-

риант данного этапа: определить, попадает ли выборочное значение тест-статистики в об-

ласть принятия или отклонения нулевой гипотезы.

7. Принять статистическое решение, касающееся того, принять или отвергнуть нулевую

гипотезу.

8. Выразить статистическое решение с точки зрения проблемы маркетингового исследования.

562 Часть III. Сбор, подготовка и анализ данных

Определить критическое

значение

выборочной статистики

критерия

i

чонить или не отклонять нулевую гипотеза

Определить, попадает ли

значение в область

принятия или непринятия

нулевой гипотезы

Рис. 15.3. Общая схема проверки гипотезы

Этап 1. Формулировка гипотез

На первом этапе маркетолог формулирует нулевую и альтернативную гипотезы. Нулевая

гипотеза (null hypothesis) утверждает, что между определенными статистическими параметрами

генеральной совокупности (средними или долями) не существует связи или различия. Ее под-

тверждение не требует от компании каких-либо действий.

Нулевая гипотеза (null hypothesis)

Предположение о том, что между определенными статистическими параметрами генераль-

ной совокупности {средними или долями) не существует связи или различия. Ее подтвер-

ждение не требует от компании каких-либо действий.

Альтернативная гипотеза (alternative hypothesis) — это гипотеза, предполагающая, что между

определенными статистическими параметрами генеральной совокупности (средними или до-

лями) есть связь или различия. Ее подтверждение означает, что руководству компании следует

предпринимать какие-либо действия или менять свои взгляды на положение дел. Таким об-

разом, альтернативная гипотеза противоположна нулевой.

Маркетолог всегда проверяет именно нулевую гипотезу. Она имеет отношение к конкрет-

ному значению параметра совокупности (например, ц , ст , л ), а не к выборочным статисти-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 563

кам (например, X ). Проверка гипотез имеет два исхода: нулевая гипотеза отвергается, а аль-

тернативная — принимается, или нулевая гипотеза не отклоняется, исходя из представленных

доказательств. Следовательно, по результатам статистической проверки нулевую гипотезу не

следует принимать, т.е. некорректно заключить, что, поскольку нулевую гипотезу не отклоня-

ют, ее можно принять как истинную. В классической теории проверки гипотез сложно опреде-

лить, достоверность нулевой гипотезы.

Альтернативная гипотеза (alternative hypothesis)

Утверждение о том, что между определенными статистическими параметрами (средними

или долями) генеральной совокупности есть связь или различия. Ее подтверждение означа-

ет, что руководству компании следует предпринимать какие-либо действия или менять свои

взгляды на положение дел.

В маркетинговых исследованиях нулевую гипотезу формулируют так, что ее непринятие

ведет к желаемому заключению. Альтернативная гипотеза представляет заключение, для кото-

рого маркетологи ищут доказательство его справедливости. Например, руководство универмага

хотело бы начать торговлю своими товарами через Internet. Новую услугу введут в действие, ес-

ли свыше 40% пользователей Internet используют сеть для совершения покупок. Маркетолог

записывает гипотезы следующим образом:

Я0:тг<0,40

Я, : п > 0,40

Если нулевую гипотезу Н 0 отклоняют, то принимают альтернативную гипотезу Н„ значит,

стоит ввести новую услугу — приобретение товаров через Internet. С другой стороны, если нуле-

вую гипотезу Н а не отклоняют, то новую услугу не стоит внедрять до тех пор, пока не будет по-

лучено дополнительных доказательств для того, чтобы заняться Internet-торге влей.

В рассматриваемом случае для проверки гипотезы используют односторонний критерий

(one-tailed test), так как альтернативная гипотеза имеет четко выраженное направление: доля

пользователей Internet, которые используют его для приобретения товаров, больше 0,40.

Односторонний критерий (one-tailed test)

Критерий проверки нулевой гипотезы, когда альтернативная гипотеза имеет четкую направ-

ленность.

С другой стороны, предположим, что исследователь хочет определить, действительно ли

доля пользователей Internet, которая осуществляет покупки через сеть, отличается от 40%.

Для этого использует двусторонний критерий (two-tailed test), а гипотезы запишем в следую-

щем виде:

Я0: п =0,400

Я,: я* 0,400

Двусторонний критерий (two-tailed test)

Критерий проверки нулевой гипотезы, когда альтернативная гипотеза не имеет четкой на-

правленности.

В практике маркетинговых исследований односторонний критерий используют чаще,

чем двусторонний. Обычно существует какое-либо предпочтительное направление изме-

ненения характеристик, подлежащее доказательству. Например, чем выше прибыль, объ-

ем продаж и качество продукта, тем это лучше для фирмы. Односторонний критерий

сильнее двустороннего. Мощность статистического критерия обсуждается ниже, при рас-

смотрении этапа 3.

564 Часть III. Сбор, подготовка и анализ данных

Этап 2. Выбор подходящего метода проверки

Для проверки нулевой гипотезы необходимо выбрать подходящий статистический метод

(статистический критерий). Исследователь должен принимать во внимание саму процедуру

вычисления выборочной статистики и характерное для нее выборочное распределение. Выбо-

рочная статистика критерия (test statistic) служит для того, чтобы можно было сделать вывод о

том, насколько близко выборка соответствует нулевой гипотезе.

Выборочная статистика критерия (test statistic)

Мера соответствий выборки нулевой гипотезе. Она часто подчиняется таким распространен-

ным распределениям, как нормальное, Стьюдента (t-распределение) или хи-квадрат рас-

пределение.

Выборочная статистика часто имеет такие широко распространенные распределения, как

нормальное, Стьюдента (^-распределение) или хи-квадрат распределение. Правила выбора под-

ходящего метода проверки обсуждаются ниже. В нашем примере наиболее приемлема z-

статистика, которая имеет нормальное распределение. Она вычисляется по формуле

г~^.

°е

где

Этап 3. Выбор уровня значимости

Какой бы вывод мы ни сделали в отношении изучаемой совокупности, всегда существует

риск неверного заключения. При этом встречаются два типа ошибок.

Ошибку I рода (Type I error) совершают, когда, исходя из результатов выборочного распреде-

ления, отклоняют нулевую гипотезу, в то время как она фактически верна.

Ошибка I рода (Type I error)

Также известная под названием альфа-ошибка, имеет место тогда, когда по результатам

выборочного распределения отклоняют нулевую гипотезу, которая на самом деле верна.

В нашем примере ошибка I рода имела бы место, если мы, исходя из данных выборки, ус-

тановили бы, что доля потребителей, предпочитающих новый вид услуг, больше 0,40 (40%), в

то время как фактически она была бы меньше либо равна 0,40. Вероятность ошибки I рода (а)

также называют уровнем значимости (level of significance).

Уровень значимости (level of significance)

Вероятность ошибки первого рода.

Вероятность ошибки первого рода устанавливается, исходя из допустимого уровняя риска

отклонения истинной нулевой гипотезы. Выбор уровня риска зависит от того, во сколько оце-

нивается ошибка первого рода.

Ошибку II рода (Туре II error) совершают, когда, исходя из результатов выборки, не откло-

няют нулевую гипотезу, которая в действительности является ошибочной. В нашем примере

ошибка II рода имела бы место, если мы, исходя из данных выборки, установили бы, что доля

потребителей, предпочитающих новый вид услуг, меньше или равна 0,40, в то время как фак-

тически она была бы больше 0,40. Вероятность ошибки II рода обозначается р*. В отличие от а,

значение которой устанавливает сам исследователь, величина Р зависит от фактического значе-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 565

ния параметра генеральной совокупности (например, доли). Вероятность совершения ошибки

I рода (а) и вероятность ошибки II рода (|3) показаны на рис. 15.4. Вероятность (1 - р) соверше-

ния ошибки II рода также называют мощностью статистического критерия.

Критическое значение

статистики z

., = 0,45

zp =-2,330 -|

Рис. 15.4. Ошибка Iрода (а) и ошибка IIрода (&)

Ошибка II рода (Type I error)

Также известна под названием бета-ошибка, имеет место тогда, когда результаты выборки

ведут < принятию нулевой гипотезы, которая фактически ошибочна.

Мощность критерия (power of a test) представляет собой вероятность (1 — |3) отклонения ну-

левой гипотезы, когда она неверна и должна быть отвергнута. Хотя величина (3 неизвестна, она

связана с а. Чрезвычайно низкое значение ее (например, 0,001) приведет к недопустимо высо-

кому значению р. Поэтому необходимо сбалансировать два типа ошибок. В качестве компро-

мисса ее часто устанавливают равной 0,05; иногда ей присваивают значение 0,01; другие значе-

ния а встречаются редко. Уровень а, наряду с размером выборки, определяет уровень Р для

конкретного исследовательского проекта. Риском а и р можно управлять, увеличив размер вы-

борки. Для данного уровня значимости а увеличение размера выборки уменьшит значение Р,

повысив тем самым мощность статистического критерия.

Мощность статистического критерия (power of a test)

Вероятность отклонений нулевой гипотезы, когда она фактически неверна и должна быть

отвергнута.

Этап 4. Сбор данных

Размер выборки определяют, приняв во внимание желаемые значения вероятностей совер-

шения ошибок I и II рода и других количественных факторов, например финансовых ограни-

566 Часть III. Сбор, подготовка и анализ данных

чений. Затем собирают необходимые данные и вычисляют значение выборочной статистики.

В нашем примере из 30 опрошенных пользователей Internet 17 отметили, что они приобретают

товары через Internet. Таким образом, выборочная доля этих пользователей Internet составляет

£ = 17/30 = 0,567.

Значение о> можно определить по следующей формуле:

= 0,089

п \ 30

Выборочную статистику z можно вычислить по формуле:

р-я- 0,567-0.40 _

; =

0,089

Этап 5. Определение критического значения z-статистики

Используя таблицы нормального распределения (табл. 2 Приложения), можно вычислить

вероятность получения значения z, равного 1,88 (рис. 15.5).

Закрашенная область

= 0,9699 Незакрашенная область

= 0,0301

Рис. 15.5. Вероятность получения значения г при использо-

вании одностороннего критерия

Площадь закрашенной области между -°° и 1,88 равна 0,9699. Следовательно, площадь

незакрашенной области справа от 2=1,88 равна 1,0000— 0,9699 = 0,0301. Альтернативно, кри-

тическое значение г, которое отсекает область, имеющую площадь а = 0,05 и расположенную

справа от критического значения, находится между 1,64 и 1,65 и равно 1,645. Обратите внима-

ние, что при определении критического значения выборочной статистики область вправо от

критического значения критерия равна либо а либо а/2. Это значение равно а для односто-

роннего критерия и а/2 — для двустороннего.

Этапы 6 и 7. Сравнение выборочного

значения z-статистики с критическим значением

и принятие решения

Итак, маркетологи выяснили, что вероятность того, что вычисленная ими выборочная ста-

тистика больше 1,88, равна 0,0301. Это вероятность получения значения р, равного 0,567 при

р -0,40 . Это число меньше выбранного уровня значимости, равного 0,05. Следовательно, ну-

левая гипотеза отклоняется. Альтернативно исследователи могут поступить следующим обра-

зом. Они видят, что полученное значение z-статистики = 1,88 лежит в области отклонения ну-

левой гипотезы (в критической области), справа от значения 1,645. Поэтому снова можно сде-

лать такой же вывод, т.е. отклонить нулевую гипотезу. Обратите внимание, что два способа

проверки нулевой гипотезы эквивалентны по выводу, но математически отличаются направле-

нием сравнения. Если вероятность получения вычисленного значения выборочной статистики

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 567

( TS C- AL), меньше, чем уровень значимости (а), то нулевую гипотезу отклоняют. Справедливо и

следующее утверждение: если вычисленное значение выборочной статистики больше, чем ее

критическое значение (TS CK ), то нулевую гипотезу также отклоняют. Причина этой перемены

знаков в том, что чем больше значение TS CAL , тем меньше вероятность получения высокого

значения выборочной статистики при условии выполнения нулевой гипотезы. Запишем этот в

следующем виде:

если вероятность TS CAI < уровня значимости (а), то нулевую гипотезу Н й отклоняют,

или

если Т5 СЛ1> Г5СЛ , то нулевую гипотезу отклоняют.

Этап 8. Вывод с точки зрения маркетингового

исследования

На основании результатов проверки статистической гипотезы следует сделать заключение с

точки зрения стоящей перед нами проблемы маркетингового исследования. В нашем примере

мы заключаем, что существует статистически значимое доказательство того, что доля пользова-

телей Internet, которые приобретают товары через Internet, выше, чем 0,40. Следовательно, уни-

вермагу можно порекомендовать вводить новую услугу — приобретение товаров через Internet.

Как видно из рис. 15.6, маркетологи используют проверку статистической гипотезы как для

проверки наличия связей между переменными, так и для проверки различий между парамет-

рами генеральной совокупности.

Типы

проверки

гипотезы

1

Г

Проверка

связи

дщСж; ^^^ |^L

Распределения Средние Доли

1

ПроЕ

раап^

ерка

ичий .

1

Медианы/Ранги:

Рис. 15.6, Общая классификация типов проверки гипотезы

Проверка различий может относиться к распределениям, средним, долям, медианам или

рангам. Сначала мы обсудим гипотезы, относящиеся к проверке связей с точки зрения

кросс-табуляции.

ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ

ПРИЗНАКОВ

Помимо ответов на вопросы, относящихся к анализу одной переменной, маркетологов час-

то интересуют дополнительные вопросы о связи этой переменной с другими переменными.

• Как много мужчин среди приверженцев данной торговой марки?

568 Часть III. Сбор, подготовка и анализ данных

• Связано ли использование товара (потребление его в больших, средних, малых коли-

чествах и не потребление) с отдыхом на открытом воздухе (высокая, средняя и низкая

активность)?

• Связана ли осведомленность о новом товаре с возрастом и уровнем образования?

• Связана ли покупка товара с доходом человека (высокий, средний или низкий доход)?

На эти и подобные вопросы можно ответить с помощью таблицы сопряженности призна-

ков. В то время как вариационный ряд характеризует одну переменную, построение таблиц со-

пряженности признаков (кросс-табуляция) (cross-tabulation) помогает увидеть одновременно

значения двух или больше переменных.

Построение таблиц сопряженности признаков, кросс-табуляция (cross-tabulation)

Статистический метод, который одновременно характеризует две или больше переменных и

заключается в создании таблиц сопряженности признаков, отражающих совместное распре-

деление двух или больше переменных с ограниченным числом категорий или определен-

ными значениями.

Кросс-табуляция представляет собой процесс объединения распределений частот значений

двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например

лояльность торговой марке, связана с другой переменной, такой как пол. В таблицах сопря-

женности признаков показывается совместное распределение значений двух или больше пере-

менных, обладающих ограниченным числом категорий или принимающих определенные зна-

чения. Категории одной переменной помешают в таблицу так, чтобы они размещались в ней

(сопрягались) в соответствии с категориями другой или другими несколькими переменными.

Таким образом, распределение частот одной переменной подразделяется на группы в зависи-

мости от категорий других переменных.

Предположим, нас интересует, действительно ли использование Internet связано с полом.

Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости

от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше

отнесли к мало пользующимся, а остальных — ко много, Итог процедуры кросс-табуляции

приведен в табл. 15.3.

1 Таблица 15.3, Пол и использование Internet

Использование Internet

Мало(1)

Много (2)

Итого

Мужчины

5

10

15

Пол

Женщины

10

5

15

Итого

15

15

Кросс-табуляция предусматривает создание ячейки для каждой комбинации категорий

двух переменных. Число в каждой ячейке показывает количество респондентов, давших эту

комбинацию ответов. В табл. 15.3 видим, что 10 респондентов, ответивших, что они мало ис-

пользуют Internet — женщины. Итоговые значения таблицы показывают, что из 30 респонден-

тов с достоверными ответами по обеим переменным 15 человек ответили, что они мало ис-

пользуют Internet, a 15 — много. Что касается пола, то 15 респондентов оказались женщинами,

а 15 — мужчинами. Обратите внимание, что эту информацию можно было бы получить из от-

дельного распределения частот для каждой переменной. Таблицы кросс-табуляции также на-

зывают таблицами сопряженности признаков (contingency tables).

Таблицы сопряженности признаков (contingency tables)

Таблица кросс-табуляции состоит из ячеек, в которых приведены комбинации категорий

двух переменных.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 569

Рассматриваемые данные должны быть качественными или категориальными, по-

скольку предполагается, что каждая переменная должна измеряться только по номиналь-

ной шкале [7].

Таблицами сопряженности широко пользуются при проведении прикладных маркетинго-

вых исследований, поскольку

• менеджеры, которые недостаточно владеют статистическими методами, легко интерпре-

тируют и понимают процедуру кросс-табуляции и ее результаты;

• очевидность трактовки результатов анализа ясно свидетельствует о возможных управ-

ленческих действиях;

• ряд операций кросс-табуляции позволяет лучше понять сложное явление, чем это сде-

лал бы один многовариантный анализ;

• кросс-табуляция облегчает проблему разбросанных ячеек, которая затрудняет дискрет-

ный много вариантный анализ;

• анализ методом кросс-табуляции прост для выполнения и поэтому обращен к исследо-

вателям, менее искушенным в вопросах статистики [8].

Мы рассмотрим построение таблиц сопряженности для двух и трех переменных.

Две переменные

Кросс-табуляцию с двумя переменными можно рассматривать как двумерную. Сначала

рассмотрим кросс-табуляцию данных, касающихся пола и использования Internet, представ-

ленную в табл. 15.3. Связано ли использование Internet с полом? Это можно выяснить из

табл. 15.3. Мы видим, что непропорционально большое количество респондентов, проводя-

ших много времени в Internet, — мужчины. Лучше понять этот вопрос поможет процентное

вычисление.

Исходя из того, что обе переменные подвергаются процедуре кросс-табуляции, мы можем

посчитать проценты применительно к колонке (табл. 15.4) либо к строке (табл, 15.5).

Таблица 15.4. Использование Internet в зависимости от пола

Пол

Использование Internet Мужчины Женщины

Мало 33,3% 66,7%

Много 66,7% 33,3%

Итого 100,0% 100,0%

Таблица 15.5. Пол человека в зависимости от использования Internet

Использование Internet

Поп Мало Много Итого

Мужчины 33,3% 66,7% 100,0%

Женщины 66,6% 33,3% 100,0%

Какая из этих двух таблиц полезнее? Ответ на данный вопрос зависит от того, какая пере-

менная рассматривается как независимая, а какая как зависимая [9]. Общее правило, которое

необходимо соблюдать, гласит —проценты необходимо вычислять для каждой категории неза-

висимой переменной (так, чтобы суммарное значение категорий зависимой переменной при-

менительно к каждой категории независимой переменной давало 100%). В нашем анализе пол

можно рассматривать как независимую переменную, использование Internet — как зависимую,

570 Часть III. Сбор, подготовка и анализ данных

а правильный способ вычисления процентов показан в табл. 15.4. Заметим, что мужчины

больше используют Internet, чем женщины. Это видно из того, что 66,7%, активно пользую-

щихся Internet, составляют мужчины, тогда как на долю женщин в этой категории приходится

всего лишь 33,3%.

Вычисление процентов в направлении зависимой переменной через независимую, как по-

казано в табл. 15.5, бессмысленно. Табл. 15.5 подразумевает, что интенсивное пользование

Internet — причина того, что такими людьми являются мужчины. Это последнее утверждение

неправдоподобно. Однако, возможно, что связь между пользованием Internet и полом человека

опосредована третьей переменной, например возрастом или доходом. Поэтому необходимо

проверить влияние третьей переменной.

Три переменные

Часто введение третьей переменной позволяет маркетологу четче уяснить природу исходной

связи между двумя переменными. Как показано на рис. 15.7, третья переменная может привес-

ти к четырем возможностям.

1. Уточнить связь, наблюдаемую между двумя исходными переменными.

2. Указать на отсутствие связи между двумя переменными, хотя первоначально связь наблю-

далась, Другими словами, третья переменная покажет, что исходная связь между двумя пе-

ременными была ложной.

3. Показать некоторую связь между двумя переменными, хотя первоначально она не наблю-

далась. В этом случае третья переменная показывает скрытую связь между первыми двумя

переменными.

4. Не показать никаких изменений в первоначальной связи [10].

Две исходные переменные

Отсутствие связи

Уточненная

связь между двумя

Отсутствие связи между

\ \

Исходная структура

Рис. 15.7. Введение третьей переменной в кросс-табуляцию

Эти возможности объясняются на примерах, в основе которых лежит выборка в тысячу рес-

пондентов.

Уточнение исходной связи. В результате изучения связи между покупкой модной одежды и

семейным положением получены данные, приведенные в табл. 15.6.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 571

Таблица 15.6. Покупка модной одежды в зависимости от семейного положения

Семейное положение

Покупка модной одежды Женат (замужем) Не женат (не замужем)

Много

Мало

Итого

Число респондентов

31%

69%

100%

700

52%

48%

100%

300

Респондентов поделили на две категории покупателей модной одежды: много покупающие

и мало покупающие. Семейное положение тоже имело две категории: женат (замужем) либо не

женат (не замужем). Как видно из табл. 15.6, в категорию лиц, покупающих много модной

одежды, попали 52% несемейных респондентов и только 31% семейных. Перед тем как заклю-

чить, что респонденты, не имеющие семьи, покупают больше модной одежды, чем имеющие

семью, в анализ была введена третья переменная — пол.

'^^^^•^•••••^••••••^•••••••••••••••^Н Таблица 15.7. Связь покупки модной одежды с семейным положением

Покупка модной одежды

Много

Мало

Итого

Число респондентов

Женат

35%

65%

100%

400

Мужской

Не женат

40%

60%

!00%

120

Пол

Замужем

25%

75%

100%

300

Женский

Не замужем

60%

40%

100%

180

Пол респондентов вводился в качестве третьей переменной на основании результатов

предшествующего маркетингового исследования. Связь между покупкой модной одежды и се-

мейным положением пересмотрена в свете третьей переменной, как показано в табл. 15.7. Что

касается женщин, то из них 60% незамужних попали в категорию покупающих больше модной

одежды по сравнению с 25% замужних женщин, С другой стороны, для мужчин эта разница в

процентах не так велика: 40% холостых и 35% женатых попали в категорию покупателей, при-

обретающих много модной одежды. Следовательно, третья переменная, уточнила связь между

семейным положением и покупкой модной одежды (начальными переменными). Вероятность

попадания в категорию покупателей, приобретающих много модной одежды, выше для несе-

мейных респондентов по сравнению с семейными, причем она выше для женщин.

Исходная связь между двумя переменными ложна. Маркетолог проводит исследование для

рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч

долларов. Он попытался проанализировать факторы, влияющие на владение дорогими автомо-

билями (табл. 15.8).

Таблица 15.8. Зависимость владения дорогами автомобилями от образовательного уровня

Наличие дорогого автомобиля Выпускник колледжа

Образование

Без степени колледжа

Да

Нет

Итого

Число респондентов

32%

68%

100%

250

21%

79%

100%

572 Часть 111. Сбор, подготовка и анализ данных

Из таблицы видно, что 32% выпускников колледжа имеют дорогой автомобиль, в то время

как среди не окончивших колледж дорогим автомобилем владеют только 21%. Исследователь

убежден, что уровень образования влияет на приобретение дорогого автомобиля. Решив, что на

его покупку влияет и доход, исследователь перепроверил связь между образованием и наличи-

ем дорогого автомобиля в свете уровня доходов. Результаты приведены в табл. 15.9.

„Таблица 15.9 Влияние образования и уровня дохода на наличие дорогого автомобиля

Доход

Низкий Высокий

Наличие дорогого автомобиля Образование Образованно

Колледж Нет Колледж Нет

Да

Нет

Итого:

Число респондентов

20%

80%

100%

100

20%

80%

100%

700

4D:-b

60%

100%

150

40%

60%

100%

50

Заметим, что процент тех, кто имеют дорогой автомобиль, среди окончивших колледж или

не окончивших его одинаков для каждой из групп, разбитых по доходу. Если данные по груп-

пам с высокими и низкими доходами проверить отдельно, то связь между образованием и на-

личием дорогого автомобиля исчезает, а это значит, что первоначально наблюдаемая связь ме-

жду этими двумя переменными была ложной.

Третья переменная показывает подавленную связь между первыми двумя переменными.

Маркетолог, исследуюший сферу туристических поездок за границу, предположил, что на же-

лание путешествовать влияет возраст. Однако таблица сопряженности двух переменных

(табл. 15.10) не выявила никакой связи. Когда в качестве третьей переменной ввели пол, полу-

чили данные, представленные втабл. 15.11.

I Таблица 15,10. Зависимость желания совершить туристическую поездку за границу от ;

возраста

Возраст

Желание совершить туристическую поездку за границу До 45 лет 45 и старше

Да 50% 50%

Нет . 50% 50%

Итого 100% 100%

Число респондентов 500 500

| Таблица 15.11. Связь между желанием совершить туристическую поездку за границу,

| возрастом и полом

Пол

Желание совершить путешествие за границу Мужчины Женщины

До 45 лет 45 и старше До 45 лет 45 и старше

Да

Нет

Итого

Число респондентов

60%

40%

100%

300

40%

60%

100%

300

35%

65%

100%

200

65%

35%

100%

200

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 573

Среди мужчин до 45 лет 60% изъявили желание отправиться в турпоездку заграницу, а по-

сле 45 лет — всего лишь 40%. Обратная ситуация наблюдалась для женщин: в возрасте до 45 лет

желающих отправиться посмотреть мир оказалось 35%, а после 45 лет — 65%. Поскольку связь

между желанием путешествовать и возрастом различна для мужчин и женшин и с противопо-

ложной направленностью, связь между этими двумя переменными была скрыта, пока данные

не учитывали переменную "пол", как это сделано в табл. 15.10. Но при проверке влияния пола,

как показано в табл. 15.11, проигнорированная связь между желанием путешествовать и воз-

растом была обнаружена для отдельных категорий: мужчин и женшин.

Никаких изменении в первоначальной связи. В некоторых случаях третья переменная не из-

меняет первоначально наблюдаемую связь, независимо от того, были ли исходные переменные

взаимосвязаны. Это означает, что третья переменная никак не влияет на связь между двумя

первыми переменными. Рассмотрим кросс-табуляцию двух переменных: размер семьи и часто-

ту посещения ресторанов быстрого питания, представленную в табл. 15.12.

Таблица 15.12. Связь частоты посещения ресторанов быстрого питания с размером

семьи

Частота посещения ресторана быстрого питания

Большая

Маленькая

Итого

Число респондентов

Небольшая

65%

35%

100%

500

Размер семьи

Большая

65%

35%

100%

500

Респондентов разделили (используя медиану) на две равные по размеру категории по 500

респондентов в каждой: небольшая и большая семья, Не наблюдалось никакой связи, Затем по

этому же принципу респондентов разделили на категории: семьи с большим и малым доходом.

При введении в анализ третьей переменной получили табл. 15,13. И снова не наблюдалось ни-

какой связи.

Таблица 15.13. Связь частоты посещения ресторанов быстрого питания с размером

семьи и уровнем дохода

Доход

Семьи с низким доходом Семьи с высоким доходом

Частота посещения ресторанов быстрого питания Малая Большая Малая Большая

Большая

Маленькая

Итого

Число респондентов

65%

35%

100%

250

65%

35%

100%

250

65%

35%

100%

250

65%

35%

100%

250

Общие комментарии по поводу кросс-табуляции

Можно построить таблицу сопряженности больше, чем для трех переменных, но интер-

претация полученных результатов достаточно сложная. Кроме того, поскольку число ячеек

многократно увеличится, проблематично оставить необходимое количество респондентов

или случаев в каждой ячейке. Как правило, чтобы вычислить статистику в каждой ячейке,

должно быть, по крайней мере, пять наблюдений. Таким образом, кросс-табуляция — не-

эффективный способ проверки связей для ситуаций с несколькими переменными, она рас-

574 Часть III. Сбор, подготовка и анализ данных

сматривает просто связь между переменными, а не причинность. Чтобы изучить причинно-

следственную связь, необходимо провести соответствующее причинно-следственное иссле-

дование (см. главу 7).

СТАТИСТИКИ ТАБЛИЦ СОПРЯЖЕННОСТИ

ПРИЗНАКОВ

Мы рассмотрим статистики, обычно используемые для оценки статистической значимости

и тесноты связи переменных, содержащихся в таблице сопряженности. Статистическая значи-

мость наблюдаемой связи обычно измеряется критерием хи-квадрат. Теснота связи важна с

практической точки зрения. Обычно она имеет значение, если связь статистически значимая.

Тесноту связи можно измерить коэффициентом корреляции фи, коэффициентом сопряжен-

ности признаков, У-коэффициентом Крамера и коэффициентом "лямбда". Эти статистики

ниже описаны детальнее.

Критерий хи-квадрат

Критерий хи-квадрат (chi-square statistic, x!) используют для проверки статистической зна-

чимости наблюдаемой связи в таблице сопряженности признаков.

Критерий хи-квадрат (chi-square statistic, %2)

Критерий, используемый для проверки статистической значимости наблюдаемых связей в

таблицах сопряженности признаков. Он помогает определить наличие или отсутствие сис-

тематической связи между двумя переменными.

Он помогает определить наличие или отсутствие систематической связи между двумя пере-

менными. В данном случае нулевая гипотеза Яп утверждает, что между двумя переменными не

существует никакой связи. Проверка нулевой гипотезы выполняется вычислением частот рас-

пределения признаков анализируемых переменных в ячейках таблицы, которые можно было

бы ожидать, если бы не существовало зависимости между переменными, и при данных итого-

вых числах в каждом ряду и колонке. Затем для вычисления значения х: эти ожидаемые часто-

ты, обозначаемые /е, сравнивают с фактически наблюдаемыми частотами распределения при-

знаков/о, соответствующими ячейкам таблицы. Чем больше разница между ожидаемыми и

фактическими частотами, тем выше значение статистики. Предположим, что таблица сопря-

женности имеет г рядов и с колонок, а случайная выборка состоит из п наблюдений. Тогда

ожидаемую частоту для каждой ячейки вычислим по следующей формуле:

е пгпс

J, = - '

Л

где п, — итоговое число в ряду, п г — итоговое число в колонке, л — полный размер выборки.

Для данных табл. 15.3 ожидаемая частота распределения признаков для ячеек, расположен-

ных слева направо и сверху вниз, выглядит так:

ч - . , -*

30 30

= 7,50; 15X15.7.50.

30 30

Тогда значение %~ вычисляют следующим образом:

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 575

Для данных табл. 15.3 значение #2 вычислили по формуле:

, (5-7,5)' ; (10-7,5)* t (10-7,5)г

| (5-7.5)2

7,5 7,5 7,5 7,5

= 0,833 + 0,833+0,833 + 0,833

= 3,333

Чтобы определить, существует ли между переменными систематическая связь, определяют

вероятность получения значения х2, равного или большего, чем рассчитанное из таблицы со-

пряженности. Важной характеристикой критерия %2 является число степеней свободы (df). Б

обшем случае оно равно числу наблюдений за вычетом числа ограничений, необходимых для

вычисления статистического показателя. Для критерия хи-квадрат таблицы сопряженности

число степеней свободы равно произведению количества рядов ( г ) минус единица на количе-

ство колонок ( с ) минус единица, т.е. df =(г-1)х(с-1) [11]. Нулевая гипотеза (Я0) об отсутст-

вии зависимости между двумя переменными должна быть отклонена только тогда, когда полу-

ченное значение х2 больше, чем критическое значение х2 распределения с соответствующим

числом степеней свободы, как это показано на рис. 15.8.

Не отклонять нулевую;

гипотезу Н0 Отклонить нулевую

гипотезу Н0

Критическое значение '1,

Рис. 15.8. Проверка зависимости между переменными

с помощью критерия у}

Распределение х2 (chi-square distribution) представляет собой асимметричное распределение,

форма которого зависит исключительно от числа степеней свободы [12]. С ростом числа степе-

ней свободы распределение хи-квадрат становится более симметричным. Данные табл. 3 в Ста-

тистическом приложении дают представление о величине хг Для различных степеней свободы.

В этой таблице значение вверху каждой колонки указывает область в верхней части (правая

сторона на рис. 15,8) распределения хи-квадрат. Например, для одной степени свободы и

а = 0,05 значение х2 равно 3,841. Это означает, что для одной степени свободы вероятность пре-

вышения значения хд, равного 3,841, составляет 0,05. Другими словами, при уровне значимо-

сти, равном 0,05, и числе степеней свободы, равном единице, критическое значение статисти-

ки х2 равно 3,841.

Распределение х2 (Chi-square distribution)

Асимметричное распределение, форма которого зависит исключительно от числа степеней

свободы. С ростом числа степеней свободы хи-квадрат распределение более симметрично,

Для таблицы сопряженности (табл. 15.3) число степеней свободы равно (2 — 1) х (2 — 1) = 1.

Вычисленное значение х2 — 3,333. Так как оно меньше критического значения, равного 3,841,

нулевую гипотезу об отсутствии связей между переменными нельзя отклонить. Это означает,

что связь между переменными не является статистически значимой при уровне значимости,

равном 0,05.

576 Часть lit. Сбор, подготовка и анализ данных

Статистику хи-квадрат также можно использовать в проверках степени согласия, чтобы оп-

ределить, согласуется ли определенная модель с наблюдаемыми данными. Эти проверки вы-

полняют вычислением значимости (уровня статистической значимости) выборочных отклоне-

ний от предполагаемых теоретических (ожидаемых) распределений, а также можно выполнить

как на основе таблиц сопряженности, так и на основе таблиц распределения частот

(одномерная табуляция). Расчет %2 и определение ее уровня статистической значимости вы-

полняется изложенным выше способом.

Значение •£ следует вычислять только для числовых данных. Если данные представлены в

виде процентов, то сначала их необходимо перевести в абсолютные единицы или числа. Кроме

того, допущение, лежащее в основе проверки с помощью критерия у?, заключается в том, что

наблюдения проведены независимо. В качестве общего правила стоит запомнить, что проверку

по критерию хи-квадрат нельзя выполнять, если ожидаемые или теоретические частоты в лю-

бой из ячеек меньше пяти. Если число наблюдений в любой ячейке меньше десяти, или если

таблица имеет два рядка и две колонки (таблица 2 х 2), то необходимо использовать поправоч-

ный коэффициент [13]. С поправочным коэффициентом значение х 1 равно 2,133, что не явля-

ется значимым при уровне значимости, равном 0,05. Для таблицы размером 2 x 2 , статистику

хи-квадрат называют фи-коэффициентом.

Фи-коэффициент

Фн-коэффициент (phi coefficient, ф) используют для измерения тесноты связи в особом слу-

чае — при анализе таблицы с двумя рядками и двумя колонками (таблица 2 х 2).

Фи-коэффициент (phi coefficient, ф)

Мера тесноты связи переменных для конкретного вида таблицы: с двумя рядками и двумя

колонками (таблица 2 х 2).

Фи-коэффициент пропорционален корню квадратному из j;2. Для выборки размером п эту

статистику находят по формуле:

Фи-квадрат принимает значение, равное 0, если связь отсутствует, на что также указывает и

значение хи-квадрат, равное 0. При сильной связи между переменными фи-коэффициент

имеет значение 1 и все наблюдения находятся на главной или второстепенной диагонали. (В

некоторых компьютерных программах фи-коэффициент принимает значение —1, а не +1, ко-

гда наблюдается отрицательная связь.) В нашем случае фи-коэффициент равен:

Таким образом, связь не очень сильна. В более общем случае при наличии таблицы любого

размера тесноту связи можно оценить коэффициентом сопряженности признаков.

Коэффициент сопряженности признаков

Фи-коэффициент применяют только к таблице 2 х 2, а коэффициент сопряженности

признаков С (contingency coefficient) используют для оценки тесноты связи в таблицах лю-

бого размера.

Коэффициент сопряженности признаков (contingency coefficient)

Мера тесноты связи в таблицах любого размера.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 577

Коэффициент сопряженности признаков связан с х1 следующим образом:

I у1

f-i ___ I /V

Vr+«

Значения коэффициента сопряженности находятся в диапазоне от 0 до 1. При отсутствии

связи он равен нулю (т.е. переменные статистически независимы), но своего максимального

значения (1) он никогда не достигает. Максимальное значение коэффициента сопряженности

зависит от размера таблицы (числа рядков и колонок). Поэтому он используется только для

сравнения таблиц одинакового размера. Значение коэффициента сопряженности для табл. 15.3

следующее:

3,333+ 30

Это значение коэффициента сопряженности указывает на слабую связь. Другой статистикой,

которую можно вычислить для любой таблицы, является К-козффициент Крамера (Cramer).

И-коэффициент Крамера

К-коэффициент Крамера (Cramer's V) — это модифицированная версия коэффициента кор-

реляции фи (0 ), которую используют в таблицах, больших по размеру, чем 2x2.

V-коэффициент Крамера (Cramer's V)

Мера тесноты связи, используемая в таблицах, больших по размеру, чем 2 x 2 .

Если для таблиц, больших, чем 2 x 2 , вычисляют фи-коэффициент, то он не имеет верхней

границы. К-коэффициент Крамера получают корректировкой фи-коэффициента или по числу

рядов, или по числу колонок в таблице. Причем из двух значений выбирают меньшее. Коррек-

тировку осуществляют так, что значения К-коэффициента лежат в диапазоне от 0 до 1. Большее

значение К-коэффициента указывает на более сильную связь, но не указывает, как связаны пе-

ременные. Для таблицы с г рядами и с колонками связь между К-коэффициентом Крамера и

фи-коэффициентом выражается следующим образом:

Значение V-коэффициент Крамера для табл. 15.3 равно:

Таким образом, связь не очень сильна. В этом случае V = ф . Так всегда происходит для таб-

лицы 2x2. Другой обычно рассчитываемой статистикой является коэффициент "лямбда".

Коэффициент "лямбда1

Коэффициент "лямбда" используется в том случае, когда переменные измерены с помо-

щью номинальной шкалы. Асимметрический коэффициент "лямбда" (asymmetric lambda) по-

казывает выраженное в процентах улучшение при прогнозировании значения зависимой пе-

ременной при данном значении независимой переменной,

I—

Асимметрический коэффициент "лямбда" (asymmetric lambda)

Мера выраженного в процентах улучшения прогнозирования значения зависимой перемен-

ной при данном значении независимой переменной. Значения коэффициента "лямбда" ле-

жат в пределах от 0 до 1.

578 Часть III. Сбор, подготовка и анализ данных

Значения коэффициента "лямбда" лежат в пределах от 0 до 1. Значение "лямбда", равное О,

означает, что никакого улучшения в прогнозировании не наблюдается. Значение 1 указывает

на то, что прогноз может быть сделан без ошибки. Это происходит тогда, когда каждая катего-

рия независимой переменной связана с одной категорией зависимой переменной.

Асимметрический коэффициент "лямбда" подсчитывают для каждой из зависимых пере-

менных. Также рассчитывают симметричный коэффициент "лямбда" (symmetric lambda) —

средним значением двух асимметричных значений.

I Симметричный коэффициент "лямбда" (symmetric lambda)

Симметричный коэффициент "лямбда" не дает предположения о том, какая из переменных

зависимая. Он измеряет общее улучшение прогнозирования, когда прогноз уже сделан в

обоих направлениях.

Симметричный коэффициент "лямбда" не делает предположения о том, какая из пере-

менных зависимая. Он измеряет общее улучшение, прогнозирования, когда прогноз уже

выполнен в обоих направлениях [14]. Значение асимметричного коэффициента "лямбда" в

табл. 15.3, если в качестве зависимой переменной взять использование Internet, равно 0,333.

Это указывает на то, что знание пола увеличивает нашу возможность прогнозирования на

0,333, т.е. имеет место улучшение прогнозирования на 0,33%. Симметричный коэффициент

"лямбда" также равен 0,33%.

Другие статистики

Обратите внимание, что при вычислении значения у. 2 переменные должны быть изме-

рены по номинальной шкале. Для измерения связи между двумя порядковыми перемен-

ными применяют другие статистики, такие как may b t may с и гамма. Все эти статистики

используют информацию об упорядочении категорий переменных, рассматривая каждую

возможную пару случаев в таблице, чтобы определить, имеет ли первая переменная тот же

относительный порядок расположения (ранг), что и вторая (конкордатное, согласованное

расположение), или их расположения (ранги) имеют обратный порядок (несогласованное

расположение), или их ранги совпадают (связанные ранги). Эти статистики отличаются

только способом обработки рангов. Как тау Ь, так и тау Ь, корректируют по числу связан-

ных рангов. Тау Ь (tau b) больше всего подходит для квадратных таблиц, в которых коли-

чество рядов и колонок равно.

Тау b (tau b)

Вычисляемая статистика, которая измеряет связь между двумя порядковыми переменными.

Она вычисляется с учетом числа связанных рангов, и ее лучше использовать для квадратных

таблиц.

Значения этой статистики лежат в пределах от +1 до —1. Таким образом, можно определить

направление (положительное или отрицательное) и силу (насколько близко данное значение

находится к 1) связи. Для прямоугольной таблицы, в которой количество рядов отличается от

количества колонок, следует использовать тау с (tau с).

Тау с (tau с)

Вычисляемая статистика, измеряющая связь между двумя порядковыми переменными. Она

вычисляется с учетом числа связанных рангов, и ее лучше использовать, когда таблица пе-

ременных не квадратна, а прямоугольна.

Статистика "гамма" (gamma) не учитывает ни связанные ранги, ни размер таблицы. Зна-

чения гаммы также лежат в пределах от +1 до —1 и обычно имеет большее числовое значе-

ние, чем тау b и тау с.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 579

Статистика "гамма" (gamma)

Вычисляемая статистика, измеряющая связь между двумя порядковыми переменными. Она

не делает поправку на связанные ранги.

Данные табл. 15.3, где пол— номинальная переменная, не обрабатывают с помощью по-

рядковых статистик. Все изложенные выше статистики можно оценить соответствующими

компьютерными программами для кросс-табуляции. Другие статистики для измерения тесно-

ты связи, а именно: смешанный момент корреляции и неметрическая корреляция, обсуждают-

ся в главе 17.

ПРАКТИКА ПРОВЕДЕНИЯ КРОСС-ТАБУЛЯЦИИ

На практике проведение кросс-табуляции полезно вести по следующим этапам.

1. Проверьте нулевую гипотезу о том, что отсутствует связь между переменными, используя

критерий хи-квадрат. Если вам не удалось отклонить нулевую гипотезу, то связь между пе-

ременными отсутствует.

2. Если нулевая гипотеза Н„ отклонена, то определите тесноту связи, используя подходящие

статистики (фи-коэффициент, коэффициент сопряженности, К-коэффициент Крамера,

коэффициент "лямбда" или другие статистики).

3. Если нулевая гипотеза Н 0 отклонена, то поясните характер связи, вычислив проценты в

направлении независимой переменной через зависимую переменную.

4. Используйте в качестве проверяемых статистик тау Ь , тау с или "гамму" для обработки

порядковых, а не номинальных переменных. Если нулевая гипотеза Н 0 отклонена, то оп-

ределите тесноту связи, используя величину и направление связи, а также учитывая знак

проверяемой статистики.

ПРОВЕРКА ГИПОТЕЗ О РАЗЛИЧИЯХ

В предыдущем разделе проверялись гипотезы о связях между переменными. Теперь мы

сделаем акцент на проверке гипотез о различиях. Классификация процедур проверки гипотез о

различиях представлена на рис. 15.9.

Методы, показанные на рис. 15.9, согласуются с классификацией одномерных методов, пред-

ставленных на рис. 14.6. Главное различие в том, что методы на рис. 14.6 также применимы к не-

скольким выборкам (больше двух) и таким образом связаны с однофакторным дисперсионным

анализом (ANOVA) и ранговым дисперсионным анализом Краскера—Уоллеса (K-W ANOVA)

(глава 14), тогда как методы на рис, 15.9 ограничены двумя выборками. Процедуры проверки ги-

потез можно в общем виде классифицировать на параметрические и непараметрические, исходя

из шкалы измерения переменных. Параметрические методы проверки гипотез (parametric tests)

предполагают, что изучаемые переменные измерены с помощью интервальной шкалы.

Параметрические методы проверки гипотез (parametric tests)

Предполагают, что изучаемые переменные измерены с помощью интервальной шкалы.

Непараметрические методы проверки гипотез (nonparametric tests) предполагают, что пере-

менные измерены с помощью номинальной или порядковой шкал.

Непараметрические методы проверки гипотез (nonparametric tests)

Предполагают, что переменные измерены с помощью номинальной или порядковой шкал.

580 Часть III. Сбор, подготовка и анализ данных

Проверка гипотезы

Параметрические

методы проверки

Непараметрические

методы проверки

аметрические-данные)

(-критерий

z- критерий

Г

Независимые

Двухгрупповой

t- критерий

I- критерий

Парные

выборки

Парный

(- критерий

Критерий хи-квадрат

Критерий Колмогорова-

Смирнова

Критерий серий

Биномиальный критерий

Критерий хи-каадрат

Критерий Манна-Уитни

Медианы

Критерий Колмогорова-

Смирнова

Парные

выборки

Критерий знаков

Критерий Вилшксона

Критерий МакНемара

Критерий хи-квадрат

Рис. 15.9. Проверка гипотез о различиях

Дальнейшая классификация проводится в зависимости от количества выборок: одна, две

или больше. Как объяснялось в главе 14, число выборок определяют, исходя из метода даль-

нейшей обработки данных для анализа, а не из того, как были собраны данные. Выборки неза-

висимы в том случае, если взяты случайным образом из различных генеральных совокупностей.

Для анализа данные, принадлежащие различным группам респондентов, например мужчинам

и женщинам, обычно обрабатывают как независимые выборки. С другой стороны, выборки

являются парными (связанными), когда данные двух выборок имеют отношение к одной и той

же группе респондентов.

Наиболее популярный параметрический критерий для проверки гипотез о равенстве сред-

них заключается в расчете значений /-статистики. Проверка на основе /-критерия выполняется

относительно среднего значения одной или двух выборок. В случае двух выборок они могут

быть независимыми или парными. Непараметрические методы проверки, основанные на на-

блюдениях, взятых из одной выборки, включают критерий Колмогорова-Смирнова, критерий

хи-квадрат, критерий серий и биномиальный критерий. В случае двух независимых выборок

для проверки гипотез относительно среднего значения используют {/-критерий Манна—Уитни

(Mann—Whitney), медианный критерий и двухвыборочный критерий Колмогорова—Смирнова.

Эти критерии— непараметрические копии ^-критерия для двух групп. Для парных выборок

непараметрические критерии включают критерий Вилкоксона парных сравнений и критерий

знаков. Эти тесты — копии парного / -критерия. Как параметрическими, так и непараметри-

ческими методами оценивают гипотезы, относящиеся к более, чем двум выборкам. Эти крите-

рии рассматриваются в следующих главах.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 581

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

Использование параметрических критериев позволяет сделать статистический вывод отно-

сительно среднего значения генеральной совокупности. Обычно для этой цели используют

t-критерий (t-test). В основе критерия лежит /-статистика Стьюдента (Student).

Т-критерий (t-test)

Одномерный метод проверки гипотез, использующий t-распределение. Применяется, если

стандартное отклонение неизвестно и размер выборки мал.

Т-статистика (t-statistic) подразумевает, что переменная нормально распределена, среднее

известно (или предполагается, что оно должно быть известно) и дисперсия генеральной сово-

купности определена по данным выборки.

Т-статистика {t-statistic)

Статистика, подразумевающая, что переменная имеет колоколоподобное распределение,

среднее известно (или предполагается, что известно) и дисперсия генеральной совокупно-

сти определена поданным выборки.

Примем, что случайная переменная Анормально распределена, со средним ц и неизвестной

дисперсией генеральной совокупности о"2, которая оценивается с помощью выборочной дис-

персии s2. Вспомним, что стандартное отклонение выборочного среднего X определяется как

s-f = j/V" . Тогда / = ( X -,u)/s- является/-распределенным с л-1 степенями свободы.

Т-распределение (t-distribution) по внешнему виду аналогично нормальному распределе-

нию. Графики обоих распределений симметричны и имеют колоколообразную форму. Однако

по сравнению с нормальным распределением в распределении Стьюдента хвостовые части гра-

фика по площади больше, а центральная часть по площади — меньше. Это связано с тем, что

дисперсия совокупности ет2 неизвестна, и ее оценивают во выборочной дисперсии s:.

Т-распределение (t-statistic)

Симметричное колоколоподобное распределение, используемое для проверки выборок не-

большого размера (п < 30).

При данной неопределенности в значении s: наблюдаемые значения / -статистики более

изменчивы, чем значения г-статистики. Однако с ростом числа степеней свободы распределе-

ние приближается к нормальному. Фактически, для выборок большого размера (120 и больше)

t~распределение и нормальное распределение практически не отличаются. В табл. 4 Статисти-

ческого приложения даны избранные процентили /-распределения.

Процедура проверки гипотезы в случае использования в качестве метода проверки

(-критерия состоит из следующих этапов.

1. Сформулировать нулевую (Н 0) и альтернативную (Я,)гипотезы.

2. Выбрать соответствующую формулу для вычисления /-статистики.

3. Выбрать уровень значимости а для проверки нулевой гипотезы И 0. Обычно выбирают уро-

вень значимости а, равный 0,05.

4. Взять одну или две выборки и для каждой вычислить значение средней и стандартное от-

клонение.

5. Вычислить значение t -статистики, приняв, что нулевая гипотеза ff a верна.

582 Часть III. Сбор, подготовка и анализ данных

6. Вычислить число степеней свободы и оценить вероятность получения большего значения

статистики из табл. 4 Статистического приложения. (Альтернативно, вычислить критиче-

ское значение / -статистики).

7. Если вероятность, рассчитанная на этапе 6 меньше, чем уровень значимости И а, выбран-

ный на этапе 3, то отклонить нулевую гипотезу Н й. Если значение вероятности больше, то

Н 0 не отклонять. (Альтернативно, если значение, вычисленной на этапе 5 /-статистики,

больше критического значения, определенного на этапе 6, то отклонить нулевую гипотезу

Я0. Если вычисленное значение меньше критического значения, то Я0 не следует откло-

нять). Неудачная попытка отклонить нулевую гипотезу необязательно подразумевает, что

Я0 верна. Это только означает, что истинное положение несущественно (статистически не-

значимо) отличается от положения, утверждаемого Я0.

8. Выразить полученный результат с точки зрения решения проблемы маркетингового ис-

следования.

Мы проиллюстрируем общую процедуру проверки гипотез с помощью /-критерия в после-

дующих разделах главы, начав с рассмотрения одной выборки.

Одна выборка

В маркетинговом исследовании аналитика часто интересует утверждение о сотноше-

нии одной переменной по сравнению с известной или заданной величиной. Примерами

таких утверждений являются: доля рынка для нового товара превышает 15%; по крайней

мере 65% потребителей понравится новая упаковка; 80% дилеров предпочтут новую поли-

тику ценообразования. Эти утверждения сформулируем с точки зрения нулевой гипотезы,

которую затем проверим, используя статистический критерии для одной выборки, такой

как /- или г-критерий. Если маркетолог использует /-критерий для проверки значения

средней, его интересует, совпадает ли значение генеральной средней со значением, зада-

ваемым в утверждении нулевой гипотезы (Я0). Для данных табл. 15.2 предположим, что

мы хотим проверить гипотезу о том, что среднее значение степени знакомства с Internet

превышает 4,0 (балла) — нейтральное значение по семибалльной шкале. Выберем уровень

значимости, равный а = 0,05. Сформулируем гипотезы:

Я0:ц<4,0

Я0:ц>4,0

(х-,}

5,385

0,297 О, ЗУ.'

Число степеней свободы для /-статистики, используемой для проверки гипотезы в отноше-

нии среднего значения, равно п ~ 1. В нашем случае п — 1 = 29 — 1 или 28. Из табл. 4 Статисти-

ческого приложения находим, что вероятность получения более высокого значения, чем 2,471,

меньше 0,05. {Альтернативно, критическое значение /-статистики для 28 степеней свободы и

уровня значимости 0,05 равно 1,7011, что меньше рассчитанного значения, равного 2,471).

Следовательно, нулевую гипотезу отклоняют. Степень знакомства с Internet превышает 4,0,

Обратите внимание, что если нам известно стандартное отклонение генеральной совокуп-

ности, и оно, допустим, равно 1,5, а, значит мы используем его, а не определенное на основа-

нии выборки, то лучше использовать z-критерий (z-test).

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 583

Z-критерий (z-test)

Одномерный метод проверки гипотезы, использующий стандартное нормальное рас-

пределение.

В нашем случае значение г-статистики было бы равно:

где

_ 1.5 _ 15 _ 02?9 ~Viif7 — г

V29 5,385

(4/724-4,0) 0/724

0,279 0,279

Из табл. 2 Статистического приложения вероятность получить более высокое значение ста-

тистики г, чем 2,595, меньше 0,05. (Альтернативно, критическое значение г-статистики для

односторонней проверки при уровне значимости 0,05 равно 1,645, что меньше полученного

значения, равного 2,595). Следовательно, нулевую гипотезу отклоняют и получают тот же ре-

зультат, что и при проверке гипотезы с помощью /-критерия.

Процедура проверки нулевой гипотезы относительно доли уже проиллюстрирована в этой

главе, когда мы знакомились с теорией проверки гипотезы.

Две независимые выборки

Иногда гипотезы в маркетинге связаны с параметрами, взятыми из двух разных генеральных

совокупностей; например, пользователи и непользователи торговой марки по-разному восприни-

мают данную торговую марку; люди с высокими доходами больше тратят на развлечения по срав-

нению с лицами, имеющими низкий доход; доля приверженцев данной торговой марки в сег-

менте 1 больше их доли в сегменте 2. Выборки, взятые случайным образом из разных изучаемых

совокупностей, называют независимыми выборками (independent samples). Как и для одной выбор-

ки, проверка гипотез может проводиться относительно значений средних или долей.

Независимые выборки (independent samples)

Две выборки, экспериментально не связанные между собой. Измерения, проведенные в од-

ной выборке, не оказывают влияния на значения переменных в другой.

Средние. В случае проверки средних для двух независимых выборок гипотезы имеют сле-

дующий вид:

Я = = i

Из двух совокупностей берут выборки и вычисляют значения средних и дисперсий, исходя

из размеров выборок, равных соответственно п, и п 2. Если окажется, что обе рассматриваемые

совокупности имеют одинаковые значения дисперсий, то значение объединенной дисперсии,

рассчитанное из двух дисперсий выборок, равно:

m + ni-2

Стандартное отклонение проверяемой статистики рассчитывается по формуле:

584 Часть III. Сбор, подготовка и анализ данных

Соответствующее значение /-статистики вычислим по формуле:

Число степеней свободы в нашем случае равно (п,+ п 2— 2).

Если две генеральные совокупности имеют разные значения дисперсий, то точное значение

f-статистики нельзя подсчитать из-за различия в выборочных средних. Вместо этого аппрок-

симируем значения ^-статистики. Число степеней свободы в этом случае обычно не будет це-

лым числом, но приемлемо точное значение вероятности можно получить округлением до

ближайшего целого числа [17].

Если неизвестно, равны ли дисперсии двух совокупностей, то для проверки выборочной

дисперсии используем F-критерий, или критерий Фишера (F-test). В этом случае гипотезы

имеют вид:

F-критерий, или критерий Фишера (F-test)

Статистический критерий для проверки равенства двух дисперсий из двух совокупностей.

F-статистику (F-statistic) вычисляют как отношение выборочных дисперсий по формуле:

F(ni-0>:-.)=^T'

где

п, — размер выборки 1;

п г — размер выборки 2;

«[ -1 — степени свободы для выборки 1;

«, -1 — степени свободы для выборки 2;

$,2 — выборочная дисперсия для выборки 1;

Si — выборочная дисперсия для выборки 2.

F-статистика (F-statistic)

F-статистика представляет собой отношение двух выборочных дисперсий.

Как видно, критическое значение F-распределения (F-distribution) зависит от значений

числа степеней свободы: в числителе и в знаменателе.

F-распределение (F-distribution)

Распределение частот, зависящее от значений степеней свободы: числа степеней свободы в

числителе и знаменателе.

Критическое значение f-статистики для различных степеней свободы в числителе и знамена-

теле дано в табл. 5 Статистического приложения. Если вероятность F-статистики выше уровня

значимости а, то Н 0 не отклоняют и используют /-критерий, в основе которого лежит оценка объ-

единенной дисперсии. С другой стороны, если вероятность f-cra-racTHKH меньше или равна а, то

ЯцОтклоняют и используют /-критерий, в основе которого лежит оценка отдельных дисперсий.

Предположим, что с помощью данных табл. 15.1 мы хотим определить, действительно ли интен-

сивность использования Internet мужчинами отличается от использования Internet женщинами. Для

этого выполним /-критерий для двух независимых выборок. Результаты приведены втабл. 15.14.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 585

Таблица 15.14. Т-критерий двух независимых выборок

Итоговые статистики

Число случаев Среднее Стандартное отклонение

Мужчины

Женщины

15

15

F-статнстика

15,507

9,333

3,867

4,0

1,68

F-критернй для проверки равенства дисперсий

Двусторонняя вероятность

0,000

t-критерий

Предполагается равенство дисперсий Не предполагается равенство дисперсий

t-статнстика Степени Двусторонняя t-статистика Степени Двусторонняя

свободы вероятность свободы вероятность

4,492 28 0,000 4,492 18,014 0,000

Обратите внимание, что /"-критерий имеет вероятность меньше 0,05. В соответствии с этим

нулевую гипотезу Я0 отклоняют. В данном случае следовало бы использовать /-критерий, в основе

которого лежит утверждение "Предполагается, что дисперсии не равны". Значение / равно 4,492 и

с учетом 18,014 степеней свободы это дает значение вероятности, равное 0,000, которое меньше

уровня значимости, равного 0,05. Следовательно, нулевую гипотезу о равенстве средних отклоня-

ют. Так как среднее значение степени использования Internet для мужчин (пол — 1) равно 9,333, а

для женщин (пол — 2) — 3,867, то мужчины пользуются Internet значительно больше по сравне-

нию с женщинами. Мы также показываемоценивание с помощью /-критерия для равных диспер-

сий, поскольку большинство компьютерных программ автоматически выполняет /-критерий

обоими способами. Применение /-критерия рассмотрим в следующем примере.

ПРИМЕР. Маркетологи пытаются установить связь между мобильностью лиц

пожилого возраста и приверженностью к определенному универмагу

В исследовании выборки 789 американских респондентов 65 лет и старше маркетологи

попытались определить связь недостаточной мобильности людей с выбором универмага.

Главный вопрос данного исследования связан с различиями в физических требованиях,

предъявляемых лицами пожилого возраста, зависимыми от других (требующими помощи

при передвижении) и уверенными в своих силах, т.е. действительно ли две группы лиц по-

жилого возраста выдвигают разные требования, чтобы добраться до магазина? Детальный

анализ физических требований, выполненный на основе проверки двух независимых выбо-

рок с помощью /-критерия (таблица ниже), показал, что зависимые лица, вероятнее всего,

ищут магазины, которые предлагают доставку товаров на дом или прием заказов по телефо-

ну, а также магазины, в которые они могут добраться. Они также предпочитают ряд близко-

расположенных магазинов [18].

Различия в физических требованиях между зависимыми и уверенными в своих силах пожилыми

людьми

Среднее'

Уверенные в своих силах Зависимые пожилые Вероятность для

пожилые люди люди (-критерия

Доставка домой

Заказы по телефону

Доставка (человека) в универмаг

1,787

2,030

2,188

2,000

2,335

3,098

0,023

0,003

0,000

586 Часть III. Сбор, подготовка и анализ данных

Близость парковки 4,001 4,095 0,305

Расположение (магазина) рядом с домом 3,177 3,325 0,137

Ряд магазинов, расположенных близко 3,456 3,681 0,023

один от другого

"Измерения проведены по пятибалльной шкале: "не важно" присвоено 1 балл, "очень важно" — 5 баллов.

В этом примере мы проверили различие между средними. Аналогичную проверку можно

выполнить для различия долей для двух независимых выборок.

Доли. Рассмотрим ситуацию для долей двух независимых выборок, данные для которой

приведены в табл. 15.1, где дано количество мужчин и женщин, использующих Internet для

приобретения товаров. Одинаковы ли доли людей, использующих Internet для приобретения

товаров, среди мужчин и женщин? Нулевая и альтернативная гипотезы имеют вид:

Я0 :*,=*,

Н2:п^ Лг

Для одной выборки используют г-критерий. Однако в этом случае статистику, лежащую в

основе критерия, вычисляют по формуле:

р — Р

Z-L\ О.

5Ъ-Ъ

Здесь числитель представляет собой разность долей в двух выборках Р 1 и Р 2 Знаменатель —

это стандартная ошибка разности двух долей, вычисляемая по формуле:

где

Выбран уровень значимости а = 0,05. С учетом данных табл. 15.15 тест-статистику можно

вычислить следующим образом:

Р } -Д =(1Ш5)-(б/15) = 0,733-0,400 = 0,333

(15x0,733+15x0,400)

P=i Ц ^ L = 0,567

(15 + 15)

*«. =.|0,567хО,43зГ-1 + ^1 =0,181

,

0,181

При двусторонней проверке область справа от критического значения равна а/2 или 0,025.

Следовательно, критическое значение тест-статистики равно 1,96. Так как вычисленное значе-

ние меньше, чем критическое, нулевую гипотезу нельзя отклонить. Таким образом, различие в

долях пользователей (0,733) для мужчин и (0,400) для женщин не считается статистически зна-

чимым. Обратите внимание, хотя различие довольно существенное, оно статистически незна-

чимое из-за небольшого размера выборки (по 15 человек в каждой группе).

Парные выборки

Во многих маркетинговых исследованиях наблюдения для двух групп не берут из незави-

симых выборок. В таком случае наблюдения называют парными или связанными выборками

(paired samples), поскольку два набора наблюдений относятся к одним и тем же респондентам.

Глава 15, Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 587

Парные или связанные выборки (paired samples)

В проверке гипотез наблюдения называют парными, если два набора наблюдений относятся

к одним и тем же респондентам.

Выборга респондентов может оценивать две конкурирующие торговые марки, выявляя от-

носительную важность двух характеристик (атрибутов) продукта, или оценивать стоимость тор-

говой марки в разное время (сезон). Различие, возникающее в этой ситуации, проверяют с по-

мощью t-критерия парных выборок (paired samples t-test).

t-критерий парных выборок (paired samples t-test)

Критерий для различий средних значений парных выборок.

Чтобы вычислить значение /-критерия для парных выборок, вводят переменную разности,

обозначаемую D, и вычисляют ее среднее и дисперсию. После этого вычисляют /-статистику. Чис-

ло степеней свободы равно п — 1, где п — число пар. Соответствующие формулы имеют вид:

где

В примере с пользователями Internet (см. табл. 15.1) этот критерий используют для опреде-

ления отношения респондентов к Internet и к Internet-технологиям. Полученные данные при-

ведены втабл. 15.15.

Таблица 15.15. t-критерий парных выборок

Переменная Количество случаев Среднее

Отношение к Internet 30 5,167

Отношение к Internet- 30 4,100

технологии

Различие отношений к Internet и Internet-технологиям

Стандартное

отклонение

1,234

1,398

Стандартная ошибка

0,225

0,255

Разность Стандартное Стандартная Корреляция Двусторонняя Т-статис- Степени Двусторонняя

средних отклонение ошибка вероятность тика свободы вероятность

1,067 0,828 0,1511 0,609 O.OOQ 7,059 29 0,000

Среднее значение отношения респондентов к Internet равно 5,167, а к Internet-технологиям —

4,10. Разность средних между этими переменными равна 1,067 со стандартным отклонением

0,828 и стандартной ошибкой 0,1511. Поэтому значение /-статистики равно (1,067/0,1511) =

7,06 с числом степеней свободы, равным 30 — I = 29 и значением вероятности, меньшим 0,001.

Следовательно, респонденты более благосклонно относятся к Internet, чем к Internet-

технологиям в целом. В качестве другого примера рассмотрим определение относительной эф-

фективности 15-секундной телевизионной рекламы по сравнению с 30-секундной.

588 Часть III. Сбор, подготовка и анализ данных

ПРИМЕР. Подсчет секунд

Для выяснения относительной эффективности 15-секундной телевизионной рекламы

по сравнению с 30-секундной провели опрос 83 директоров по работе с масс-медиа круп-

нейших в Канаде рекламных агентств. Используя пятибалльную шкалу (1 — отлично, 5 —

плохо) респонденты оценивали эффективность 15- и 30-секундной рекламы по следующим

показателям; осведомленность о торговой марке, главная запоминающаяся идея, убедитель-

ность и способность к эмоциональной передаче. Данные таблицы свидетельствуют, что по

всем показателям респонденты выше оценили 30-секундную рекламу.

Среднее значение рейтинга 15- и 30-секундной рекламы по четырем переменным

Осведомленность о Главная запоминающаяся Убедительность Эмоциональность

торговой марке идея

15

2,5

30

1,9

15

2,7

30

2,0

15

3,7

30

2,1

15

4,3

30

1,9

Парные проверки показали, что эти различия статистически значимы, и 15-секундная I

телереклама оценена как менее эффективная [19].

, |т .||Ш.|иШ|ШШ|И|,|ИЦ, „ I пптпп:пплл-:лт- ' V ' lllll .ll..l..llllilLmmiimiiii»ii,»..i. i 1 и , „,„„„,, ft

Разность в долях для парных выборок можно проверить, используя критерий Мак-Немара

или критерий хи-квадрат, как это показано в следующем разделе, посвященном непараметри-

ческим методам проверки.

НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ

ПРОВЕРКИ ГИПОТЕЗ

Данные методы используют в том случае, когда маркетологи имеют дело с независимыми

неметрическими переменными. Аналогично параметрическим методам проверки, непарамет-

рические критерии применяют для проверки переменных из одной выборки, двух независи-

мых или двух взаимосвязанных выборок.

Одна выборка

Иногда исследователь хочет проверить, попадают ли значения конкретной переменной под

определенный тип закона распределения, например нормального распределения, равномерно-

го или распределения Пуассона. Знание закона распределения необходимо для нахождения ве-

роятностей, соответствующих известным значениям переменной или для нахождения значе-

ний переменной, соответствующих известным вероятностям (см. Приложение 12.А). Критерий

согласия Колмогорова-Смирнова для одной выборки (Kolmogorov—Smirnov (К—S) one-sample

test) как раз и является критерием степени согласия теоретической кривой распределения с эм-

пирическими данными.

Критерий согласия Колмогорова-Смирнова для одной выборки

(Kolmogorov-Smirnov (K-S) one-sample test)

Непараметрический метод проверки степени согласия эмпирической функции распределе-

ния переменной с определенным теоретическим законом распределения.

Критерий Колмогорова-Смирнова сравнивает эмпирическую функцию распределения пе-

ременной с определенным теоретическим законом распределением. В наших дальнейших рас-

суждениях А,- обозначает кумулятивную частость для каждой категории теоретического

(предполагаемого) распределения, а О,— сравниваемое значение выборочной частости. Крите-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 589

рий К-С основан на максимальном значении абсолютной разности между А; и О,. Значение

критерия вычисляют по формуле:

К = Мах\А, - О;

Решение об отклонении нулевой гипотезы основано на значении К. Чем больше значение

К, тем больше уверенности, что нулевая гипотеза Я^неверна. При а = 0,05 критическое значе-

ние Кцпя больших выборок (свыше 35 наблюдений) задается формулой l,36vn [20]. Альтерна-

тивно, К можно преобразовать в нормально распределенную ^-статистику и определить свя-

занную с ней вероятность.

Предположим, что в рамках примера по степени использования Internet мы хотели бы уз-

нать, действительно ли собранные данные подчиняются нормальному распределению. Резуль-

таты проверки с помощью критерия согласия К—С, представлены в табл. 15.16.

I Таблица 15.16. Критерий К-С для проверки нормального закона распределения дан*

• ных (для одной выборки) в примере по изучению степени использования Internet

Проверка распределения - Нормальное

Среднее 6,600

Стандартное отклонение 4,296

Случаи (количество) 30

Самые большие значения разностей

Абсолютное Положительное Отрицательное K-S z-статистика Двусторонняя

вероятность р

0,222 0,222 -0,142 1,217 0,103

Самая большая по абсолютной величине разность между наблюдаемым и нормальным

распределением равна К = 0,222. Хотя размер нашей выборки только 30 (меньше, чем 35),

мы можем использовать приближенную формулу, и критическое значение для К равно

1.3бл/30 =0,248 . Так как вычисленное значение К меньше критического, то нулевая гипотеза

не может быть отклонена. Альтернативно, из данных табл. 15.16 видно, что вероятность по-

явления наблюдаемого значения К, равного 0,222, определенная с помощью нормализован-

ной г-статистики, равна 0,103. Поскольку это значение больше, чем уровень значимости

0,05, то нулевую гипотезу нельзя отклонить. Мы пришли к аналогичному выводу. Следова-

тельно, распределение степени использования Internet несущественно отклоняется от нор-

мального распределения.

Как уже упоминалось, в отношении одной переменной из одной выборки можно выпол-

нять проверку гипотезы по критерию хи-квадрат. В этом плане он также является критерием

согласия. Он проверяет, действительно ли существует статистически значимая разница между

наблюдаемым числом случаев в каждой категории и ожидаемым. Другие непараметричсские

методы проверки включают критерий серий и биномиальный тест.

Критерий серий (runs test)

Критерий случайности для дихотомической переменной.

Критерий серий (runs test) представляет собой критерий случайности для дихотомических

(двузначных) переменных. Эту проверку выполняют, определяя, действительно ли порядок

или последовательность, в которой получены наблюдения, случайны. Биномиальный критерий

(binomial test) также является критерием согласия для дихотомических переменных. Он прове-

ряет степень соответствия (согласия) числа наблюдений в каждой категории с числом наблю-

дений, ожидаемым в условиях конкретного биномиального распределения.

590 Часть III. Сбор, подготовка и анализ данных

Биномиальный критерий (binomial test)

Статистический критерий согласия для дихотомических переменных. Он проверяет степень

согласия наблюдаемого числа наблюдений в каждой категории с числом наблюдений, ожи-

даемым G условиях конкретного биномиального распределения.

Подробную информацию об этих критериях смотрите в литературе по статистике [21].

Две независимые выборки

Если необходимо сравнить различие в показателях центратьной тенденции двух генераль-

ных совокупностей, исходя из наблюдений из двух независимых выборок, а переменная изме-

рена на основании порядковой шкалы, то можно использовать {/-критерий Манна—Уитни

(Mann-Whitney £/-test) [22]. Этот критерий соответствует /-критерию двух независимых выбо-

рок, переменные которых выражены в интервальной шкале, когда предполагают, что диспер-

сии двух совокупностей равны.

При использовании {/-критерия Манна—Уитни две выборки объединяют и наблюдения

ранжируют в порядке возрастания. Тест-статистику U вычисляют как число повторений рангов

из одной выборки или группы 1, которое стоит впереди рангов из группы 2. Если выборки взя-

ты из одной совокупности, распределение рангов из двух групп в ранжированном перечне

должно быть случайным. Экстремальное значение (/-статистики свидетельствует о неслучай-

ном характере, указывая на неравенство двух групп. Для выборок размером меньше 30 вычис-

ляют точное значение уровня значимости для ^/-статистики, Для выборок большого размера U-

статистику преобразуют в нормально распределенную ^-статистику, которую можно скорректи-

ровать с учетом совпадений внутри рангов.

^/-критерий Манна-Уитни (Mann-Whitney (Atest)

Статистический критерий для переменной, измеренной с помощью порядковой шкалы, ко-

торый сравнивает различие в показателях положения двух совокупностей, исходя из на-

блюдений, взятых из двух независимых выборок.

Мы снова рассмотрим различие использования Internet мужчинами и женщинами, обра-

тившись к {/-критерию Манна—Уитни. Результаты приведены в табл. 15.17.

Таблица 15.17. {/-критерий Манна-Уитни

(/-критерий Манна-Уитни и W-критерий парных сравнений Уилкоксона

Зависимость степени использования Internet от пола

Пол Средний ранг Количество случаев

Мужчины 20,93 15

Женщины 10,07 15

Итого 30

U W z Откорректированная

вероятность р

31,000 151,00 - 3,406 0001

Примечание. U ~ тест-статистика Манна-Уитни,

W— W-статистика Уилкоксона,

i — U-статистика, преобразованная в нормально распределенную z-статистику.

Из данных таблицы обнаруживается значительное различие между двумя группами,

подкрепляющее изложенные результаты проверки двух независимых выборок с помощью

Г-критерия. Поскольку ранги присвоены в порядке возрастания наблюдений, то более высо-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 591

кое среднее значение ранга для мужчин (20,93) свидетельствует, что они интенсивнее ис-

пользуют Internet по сравнению с женщинами (среднее значение ранга 10,7).

Исследователи часто хотят проверить различия в долях, полученных из анализа двух неза-

висимых выборок. В качестве альтернативы параметрической г-статистики можно использо-

вать процедуру кросс-табуляции, чтобы выполнить проверку с помощью критерия хи-

квадрат [23]. В этом случае имеем таблицу 2 x 2 . Одну переменную используем для обозначе-

ния выборки, допустим, значение 1 — для выборки 1, а значение 2— для выборки 2. Другая

переменная будет интересующей нас двоичной переменной.

Два других непараметрических метода проверки независимых выборок— это медианный

критерий и критерий Колмогорова—Смирнова. Двухвыборочный медианный критерий (twosample

median test) определяет, действительно ли две группы взяты из совокупностей с одной и

той же медианой. Медианный критерий не такой мощный, как ^/-критерий Манна—Уитни,

поскольку он попросту использует показатель положения каждого наблюдения относительно

медианы, а не ранг каждого наблюдения.

Двухвыборочный медианный критерий (two-sample median test)

Непараметрический метод проверки, который определяет, действительно ли две группы

взяты из совокупностей с одной и той же медианой. Медианный критерий не такой мощ-

ный, как U-критерий Манна-Уитни.

Двухвыборочный критерий Колмогорова—Смирнова (Kolmogorov-Smirnov two-sample test)

проверяет, действительно ли две совокупности подчиняются одному и тому же закону распре-

деления. Он учитывает любые различия между двумя распределениями, включая медиану, ва-

риацию и асимметрию, о чем свидетельствует приведенный ниже пример.

Двухвыборочный критерий Колмогорова-Смирнова

(Kolmogorov-Smirnov two-sample test)

Непараметрический метод проверки, действительно ли две совокупности подчиняются од-

ному и тому же закону распределения. Этот критерий учитывает любые различия между

двумя распределениями, включая медиану, вариацию и асимметрию.

ПРИМЕР. Большой бизнес: так ли просто поменять стартегию?

Как руководители маркетинговых компаний и их клиенты — компании из списка Fortune

500— представляют себе роль маркетинговых исследований в изменении маркетинговой страте-

гии? Обнаружено, что руководители маркетинговых компаний, в отличие от своих клиентов, по-

ложительно смотрят на изменение стратегии и не склонны откладывать начало изменений. Вы-

раженные в процентах ответы на один из пунктов опроса "Должны ли вноситься изменения в

маркетинговую стратегию фирмы при первой возможности" приведен ниже. С помощью крите-

рия Колмогорова—Смирнова показано (в таблице), что различия в определении роли маркетин-

I говых исследований статистически значимы при уровне значимости 0,05 [24].

; Роль маркетингового исследования в выработке стратегии

Ответы (%)

Выборка п Должны Предпочтитель И могут, и не Предпочтитель Абсолютно не

обязательно но должны могут но не должны должны

D 77 7 26 43 19 5

U 68 2 15 32 35 16

Уровень значимости К - С = 0,05

'D — руководители маркетинговых компаний; U — клиенты маркетинговых компаний.

592 Часть III. Сбор, подготовка и анализ данных

В этом примере руководители маркетинговых компаний и их клиенты представляют две

независимые выборки. Однако выборки не всегда независимые. В случае парных выборок сле-

дует использовать другой набор критериев.

Парные выборки

Важным непараметрическим критерием для изучения различий в показателях центральной

тенденции двух генеральных совокупностей на основе парных наблюдений является критерий по-

парных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test). С его помощью анализи-

руется величина разностей между парными наблюдениями. В этом методе вычисляют разности

между парами переменных и ранжируют абсолютные значения разностей. На следующем этапе

суммируют положительные и отрицательные ранги. Далее на основании положительных и отри-

цательных сумм рангов рассчитывают г-статистику. В соответствии с нулевой гипотезой, утвер-

ждающей об отсутствие различий, z представляет собой случайную величину, распределенную по

нормальному закону, со значением медианы, равным 0, и дисперсией 1 для больших выборок.

Критерий Уилкоксона соответствует рассмотренному ранее парному f-критерию [25].

Критерий попарных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test).

Непараметрический метод проверки, посредством которого анализируют разности между

парными наблюдениями, учитывая их величину.

Рассмотрим еще раз пример, приведенный для парного /-критерия и касающийся наличия

различий в отношении респондентов к Internet и Internet-технологиям. Допустим, что обе эти

переменные измерены с помощью порядковой шкалы, а не интервальной. В соответствии с

этим используем критерий Уилкоксона. Результаты приведены в табл. 15.18.

ннм^^^^^^^н^^мн^^^^^^^^^^^^^^ВМН^^^^^^^^^Н^Н Таблица 15.18. Критерий попарных сравнений Уилкоксона

internet с Internet-технологиями

(Internet-технологии - internet} Число случаев Средний ранг

- Ранги

+- Ранги

Совпадающие ранги

Итого

г = -4,207

23

1

6

30

12,72

7,50

Вероятность для двусторонней проверки р= 0,0000

Здесь снова выявлено различие в переменных, и результаты согласуются с выводами, сде-

ланными на основании парного /-критерия. В данном случае мы имеем 23 отрицательные раз-

ности (респонденты лучше относятся к Internet, чем к Internet-технологиям). Средний ранг их

равен 12,72. С другой стороны, есть только одна положительная разность (один респондент

лучше относится к Internet-технологиям, чем к Internet). Средний ранг этой разности равен

7,50. Кроме того, есть 6 совпадающих рангов, т.е. 6 одинаковых значений обеих переменных.

Эти числа показывают, что респонденты лучше относятся к Internet, чем к Internet-

технологиям. Кроме того, вероятность соответствующей ^-статистики меньше, чем 0,05, свиде-

тельствует о том что различие в отношениях действительно значимое.

Критерий знаков (sign test)

Непараметрический критерий для изучения разностей в показателях центральной тенденции

двух генеральных совокупностей на основе парных наблюдений, который только сравнивает

знаки разностей между парами переменных, но не учитывает величину разностей.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 593

Другой непараметрический метод парной проверки — критерий знаков (sign test) [26]. Он не

такой мощный, как критерий Уилкоксона, поскольку только сравнивает знаки разностей меж-

ду парами переменных, не учитывая величину разностей.

В особом случае двоичной переменной, когда исследователь желает проверить разности в

долях, можно использовать критерий Мак-Немара. В противном случае можно использовать

критерий хи-квадрат. Различные параметрические и непараметрические критерии для разли-

чий обобщены в табл. 15.19.

Таблица 15.19. Проверка гипотез о различиях: итог

Выборка Применение Шкала измерения Критерий/Комментарии

Одна выборка

Одна выборка Распределения Неметрическая Критерии согласия Колмогорова-Смирнова и хи-

квадрат

Критерий серий

Биномиальный тест согласия для дихотомиче-

ских переменных

Одна выборка Средние

Одна выборка Доли

Две независимые выборки

Две независимые выборки Распределения

Две независимые выборки Средние

Две независимые выборки Доли

Две независимые выборки Ранги/Медианы

Парные выборки

Парные выборки Средние

Парные выборки Доли

Парные выборки Ранги/Медианы

Метрическая

Метрическая

Неметрическая

Метрическая

Метрическая

Неметрическая

Неметрическая

Метрическая

Неметрическая

Неметрическая

(-критерий, если дисперсия неизвестна

z-критерий, если дисперсия известна

z -критерий

Двухвыборочный критерий Колмогорова-

Смирнова для проверки эквивалентности двух

распределений

Двугрупповой (-критерий

F-критерий для равенства дисперсий

z-критерий

критерий хи-квадрат

f-критерий Манна-Уитни более мощный, чем

медианный критерий

Парный (-критерий

Критерий Мак-Немара для двоичных перемен-

ных. Критерий хи-квадрат

Критерий попарных сравнений Уилкоксона более

мощный, чем критерий знаков

Критерии в табл. 15.19 легко соотнести с представленными на рис. 15.9. Табл. 15.19 делит

критерии для распределений и для рангов/медиан. Врезка 15.1 "Практика маркетинговых ис-

следований" показывает использование проверки гипотез в стратегии международного брэн-

динга, в то время как врезка 15.2 "Практика маркетинговых исследований" излагает использо-

вание описательных статистик в исследованиях по этике.

Врезка 15.1. Практика маркетинговых исследований

Стратегия международного брэндинга

С 1990-х годов наблюдается тенденция к глобальному маркетингу. Как можно продавать

фирменный товар за границей, учитывая многообразие исторических и культурных тради-

ций? По словам Боба Кролла (Bob Kroll), бывшего президента компании Del Monte

594 Часть III. Сбор, подготовка и анализ данных

International', преимуществом может стать унифицированная упаковка, также важно удовле-

творение кулинарных вкусовых предпочтений в каждой стране. Эту мысль проясняет одно

из последних международных маркетинговых исследований. В настоящее время руководи-

тели маркетинговых компаний считают, что лучше мыслить глобально, а действовать — ло-

кально. В число респондентов вошли 100 менеджеров по управлению продуктом и сотруд-

ники маркетинговых служб из некоторых наиболее крупных пищевых, фармацевтических и

других компаний США. 39% ответили, что использование унифицированной упаковки на

зарубежных рынках — неудачная идея, а 38% поддержали ее. Однако те, кто были за то, что-

бы упаковка разрабатывалась для каждой страны, пожелали, чтобы упаковка все-таки была

как можно ближе к своему оригиналу, независимо от страны, где продается данный товар.

Но они также считали необходимым, чтобы упаковка товара соответствовала языковым осо-

бенностям и требованиям различных рынков. Исходя из этих положений, подходящим по-

исковым вопросом такого исследования мог стать следующий: "Предпочитают ли потреби-

тели в разных странах покупать товары фирм с известной всему миру товарной маркой в раз-

личной упаковке, соответствующей местным требованиям?" На основании такого

поискового вопроса выдвинем гипотезу о том (при всех других равных условиях), что пред-

ложение фирменного товара в специально разработанной упаковке может увеличить его до-

лю рынка. Гипотезу можно сформулировать так:

Я0: Для хорошо известного фирменного товара доработанная для местных рынков упа-

ковка не увеличит долю на международном рынке.

//,: При равных прочих условиях для хорошо известного фирменного товара доработан-

ная для местных рынков упаковка увеличит долю на международном рынке.

Для проверки нулевой гипотезы в качестве хорошо известного фирменного товара можно

выбрать зубную пасту фирмы Colgate, которая придерживалась смешанной стратегии. Долю

рынка в странах со стандартной упаковкой можно сравнить с долей рынка в странах с дора-

ботанной для местных рынков упаковкой при контроле влияния других факторов. Можно

использовать /-критерий для двух независимых выборок [28].

Врезка 15.2. Практика маркетинговых исследований

Недоверие, подтвержденное статистически

Описательные статистики указывают на то, что общественное восприятие этики в бизне-

се и, таким образом, этики в маркетинге, слабое. В опросе, проведенном Business Week, 46%

респондентов ответили, что только этические принципы руководителей компаний справед-

ливы. Опрос журнала Time показал, что 76% американцев считают, что менеджерам компа-

ний (и, таким образом, исследователям) не хватает этики поведения, и это отсутствие мора-

ли снижает нравственные стандарты в Соединенных Штатах Америки. Результаты исследо-

вания бизнесменов, проведенные Туше Росс (louche Ross), показали, что мораль является

серьезным вопросом и предположение масс-медиа об отсутствии морали в бизнес-кругах не

преувеличено [29].

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА

Все три стандартных статистических пакета (SPSS, SAS, BMDP) имеют схожие функ-

ции для вычисления распределения частот, построения таблиц сопряженности признаков

и проверки гипотезы. Основные программы для вычисления распределения частот сле-

дующие: FREQUENCIES (SPSS), UNIVARIATE (SAS) и 2D (BMDP). Другие программы

определяют только распределение частот (FREQ в SAS, 4D в BMDP) или только некото-

рые статистики [27].

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 595

Компьютерные программы для анализа распределения частот

SPSS

Основная программа в SPSS — FREQUENCIES. С ее помощью строится таблица значе-

ний частот, частостей и накопленных частостей для значений каждой переменной. Она про-

водит расчет всех необходимых статистик, за исключением коэффициента вариации. Если

данные интервальные и требуется определить только итоговые статистики, то можно ис-

пользовать процедуру DESCRIPTIVES. Все статистики, которые вычисляют с помощью

DESCRIPTIVES, доступны и в FREQUENCIES. Однако DESCRIPTIVES эффективнее, по-

скольку она не сортирует значения в таблице частот. Дополнительная программа MEANS

вычисляет среднее значение и стандартное отклонение для зависимой переменной в под-

группах случаев, определяемых независимыми переменными.

SAS

Основная программа в SAS — UNIVARIATE. В дополнение к определению таблицы час-

тот, эта программа позволяет вычислить все необходимые статистики. Другая доступная

процедура — FREQ, Для одномерного распределения частот FREQ не дает ни одной необ-

ходимой статистики. Для определения итоговых статистик используются такие процедуры,

как MEANS, SUMMARY и TABULATE. Следует отметить, что FREQ недоступна в качестве

независимой программы в микрокомпьютерной версии,

BMDP

Главная процедура в BMDP — 2D, она позволяет определять распределение частот и все

ассоциированные статистики, за исключением коэффициента вариации. С помощью ID

можно вычислить итоговые статистики для интервальных данных, но нельзя вычислить

распределение частот. 4D вычисляет распределение частот для метрических и неметрических

данных, но не позволяет вычислить итоговые статистики.

Minitab

Главная функция — Stats1^Descriptive Statistics. Выходные величины включают среднее,

медиану, стандартное отклонение, минимум, максимум и квартили. Гистограмму можно

получить при выборе опции Graph^Histogram.

Excel

С помощью функции ToolsOData Analysis (Инструменты"=> Анализ данных) вычисля-

ют дескриптивные статистики. Можно определить среднее, стандартную ошибку, медиа-

ну, моду, стандартное отклонение, дисперсию, эксцесс, асимметрию, размах, минимум,

максимум, сумму и доверительный интервал. Частоты можно отобразитьть с помошью

гистограммы.

Основные программы для построения таблиц сопряженности признаков— CROSSTABS

(SPSS), FREQ (SAS) и 4F (BMDP). Все они могут строить таблицы сопряженности и вычис-

лять данные для ячеек, проценты для категорий в рядах и колонках, высчитывать критерий хи-

квадрат для определения уровня значимости и все рассмотренные показатели силы связи. Про-

грамму TABULATE (SAS) также можно использовать для получения данных для ячеек, про-

центов рядов и колонок, хотя она не вычисляет ни одной ассоциированной статистики. В про-

грамме Minitab таблицы сопряженности и критерий хи-квадрат вычисляют с помощью функ-

ции Stats'*Tables. Каждую из этих характеристик можно выбрать с помощью функции Tables.

Функция Data1^Pivot Table выполняет построение таблиц сопряженности в программе Excel.

Для дополнительного анализа необходимы такие функции: максимум, минимум, среднее или

стандартное отклонение. Расчеты можно провести также на основе других ячеек. Для ChiTest

можно воспользоваться функцией Insert^Function^Statistical^ChiTest.

596 Часть III. Сбор, подготовка и анализ данных

Основная программа для выполнения проверки с помошью (-критерия в SPSS — T-TEST.

Она_с помощью /-критерия проверяет как независимые, так и парные выборки. Все рассмот-

ренные выше непараметрические методы проверки выполняются с помощью программы

NPAR. В SAS используется T-TEST. Непараметрические методы проверки выполняются

программой NPAR1WAY, которая проверяет гипотезу для двух независимых выборок (с по-

мощью критерия Манна—Уитни, медианого критерия и критерия Колмогорова—Смирнова),

а также вычисляет критерий Уилкоксона для парных выборок. Параметрический метод про-

верки с помощью /-критерия можно выполнить в BMDP, используя программы 3D, а непа-

раметрическую проверку с помощью того же критерия — с использованием программы 3S.

Параметрические критерии, доступные в Minitab с помощью функции descriptive stat, сле-

дующие: ^-критерий для средних, /-критерий для средних и двухвыборочный /-критерий.

Непараметрические критерии доступны с помощью функции Stat^Time Series. Они вклю-

чают следующие категории: од но выборочный знаков, Уилкоксона, Манна—Уитни, Круска-

ла-Уэллиса, медианный, Фридмана, серий и попарных разностей. Доступные параметриче-

ские критерии в Excel и других электронных таблицах включают /-критерий: парных выбо-

рок для средних; г-критерий: две независимые выборки, предполагающие равные

дисперсии; /-критерий: две независимые выборки при допущении неравенства дисперсий;

^-критерий: две выборки для средних и F-критерий для дисперсий двух выборок. Непара-

метрических критериев здесь нет.

! В центре внимания Burke

Основной инструмент, используемый большинством исследователей для анализа дан-

| ных, — построение таблиц сопряженности признаков (кросс-табуляция). Она позволяет

окинуть быстрым взглядом распределение ответов и выявить проблемы с данными. Однако

она может ввести в заблуждение, если не предпринять определенных мер.

Рассмотрим такой пример. Корпорация Burke завершила исследование, представляющее

большой интерес для клиента. Результаты таблиц Burke отличались от недавних результатов

другой маркетинговой компании. Для разбора этого примера используем иллюстративные

данные (фактические данные — частная собственность компании).

Это исследование проводилось среди небольших компаний (с количеством работающих

меньше 20 человек) относительно использования ими кадровых агентств как источника

приема временных рабочих. Взята выборка в 100 фирм с одним работником, а также в 100

фирм с количеством работающих от 2 до 19 человек, Создана следующая таблица,

Это тип таблицы привычен для обычного клиента. Получается, что 52% фирм исполь-

зуют помощь кадровых агентств для привлечения временных рабочих Информационный

центр корпорации Burke имел данные переписи населения, показывающие, что в генераль-

ной совокупности имелось 9,2 миллиона фирм с одним работником и только 2,5 миллиона

фирм с количеством работающих от 2 до 20 человек. Взвешенная общая колонка должна вы-

глядеть следующим образом.

Количество постоянных работников, t

Использовали агентство? База

Да

Нет

= 1

100

40

40%

60

60%

От 2 до 19

100

65

65%

35

35%

Итого

200

105

52%

95

48%

Репрезентативная выборка должна включать 157 фирм с одним работником и 43 фирмы

от 2 до 20 человек.

Тогда веса для формирования общей колонки равны 1,57 и 0,43 соответственно.

Правильная таблица должна имеет следующий вид:

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 597

Количество постоянных работников, t

= 1 От 2 до 19 Взвешенный итог

Использовали агентство? База 100 100 200

Да 40 65 91

40% 65% 45%

Нет 60 35 109

60% 35%

% выборочной совокупности (выборки) —1 работник = 0,79

% выборочной совокупности (выборки) — от 2 до 20 работников = 0,21

Теперь клиенту сказали, что 45% (а не 52%) компаний с количеством работников мень-

ше 20 человек используют кадровые агентства для приема временных работников. Может

показаться, что это незначительное изменение, но когда клиент увидел последнюю таблицу,

он принял решение о перестройке своего бизнеса. Никогда не формируйте итоговую колон-

ку в таблицах, не рассмотрев истинное распределение в генеральной совокупности.

РЕЗЮМЕ

Базовый анализ данных позволяет глубже проникнуть в суть явления и является основой как для

выполнения последующего анализа, так и для интерпретации данных. Для каждой переменной не-

обходимо получить распределение частот признаков (вариационный ряд). Результаты анализа отра-

жены в таблицах частот, частостей и накопленных частот для всех значений переменной. Они по-

казывают наличие выбросов, пропущенных или экстремальных значений. Показатели центра рас-

пределения— среднее арифметическое, медиана и мода. Вариация распределения признаков

описывается размахом, дисперсией, стандартным отклонением, коэффициентом вариации и меж-

квартильным размахом. Форму кривой распределения определяют асимметрия и эксцесс.

Кросс-табуляция представляет собой процедуру создания таблиц сопряженности призна-

ков, которые отражают совместное распределение значений двух или больше переменных.

В кросс-табуляции проценты вычисляем по колонкам (к итоговой колонке) или по рядам

(к итоговому ряду). Общее правило — вычисление процентов в направлении независимой пе-

ременной через зависимую переменную.

Часто, чтобы лучше уяснить суть связи переменных, вводят третью переменную. Статистика

хи-квадрат позволяет проверить статистическую значимость наблюдаемой связи в таблице со-

пряженности. С помощью фи-коэффициента, коэффициента сопряженности, V -коэффициент

Крамера и коэффициента "лямбда" определяют силу связи между переменными.

Для проверки гипотез о различиях используют параметрические и непараметрические ме-

тоды. Из параметрических методов для проверки гипотезы относительно среднего совокупно-

сти используют /-критерий. Его различные типы подходят для проверки гипотезы, в основе ко-

торой лежит одна выборка, две независимые выборки или парные выборки. Из непараметри-

ческих методов популярны одновыборочные критерии, включающие критерий согласия

Колмогорова—Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий.

Для двух независимых непараметрических выборок можно использовать ^/-критерий Манна-

Уитни, медианный критерий и критерий Колмогорова—Смирнова. В случае парных выборок

для проверки гипотезы о показателе центра распределения полезны критерий попарных срав-

нений Уилкоксона и критерий знаков.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ

• /-критерий, критерий Фишера (/-test) • /-критерий (/-test)

• /"-распределение (/'-distribution) • /-распределение (/ -distribution)

• /"-статистика (/"-statistic)

598 Часть III. Сбор, подготовка и анализ данных

• {/-критерий Манна-Уитни (Mann-

Whitney U-test)

• К-коэффициент Крамера (Cramer's V)

• г-статистики ( г -test)

• альтернативная гипотеза (alternative

hypothesis)

• асимметричная "лямбда" (asymmetric

lambda)

• асимметрия (skewness)

• биномиальный критерий (binomial test)

• вариационный ряд, распределение частот

(frequency distribution)

• выборочная (наблюдаемая) статистика,

статистика критерия (test statistic)

• гамма (gamma)

• двусторонний критерий (two-tailed test)

• двухвыборочный критерий согласия

Колмогорова—Смирнова (Kolmogorov—

Smirnov two-sample test)

• двухвыборочный медианный критерий

(two-sample median test)

• дисперсия (variance)

• коэффициент вариации (coefficient of

variation)

• коэффициент сопряженности признаков

(contingency coefficient)

• критерий знаков (sign test)

• критерий попарных сравнений Уилкоксо-

на (Wilcoxon matched-pairs signed-ranks test)

• критерий серий (run test)

• медиана (median)

• межквартильный размах (interquartile

range)

• мода (mode)

• мощность критерия (power of a test)

• независимые выборки (independent

samples)

• непараметрические методы проверки ги-

потез (nonparametric tests)

УПРАЖНЕНИЯ

Вопросы

1. Опишите процедуру определения частот распределения значений переменной.

2. Какие показатели центра распределения обычно вычисляют?

нулевая гипотеза (null hypothesis)

одновыборочный критерий согласия

Колмогорова—Смирнова (Kolmogorov—

Smirnov one-sample test)

односторонний критерий (one-tailed test)

ошибка I рода (type I error)

ошибка II рода (type II error)

параметрические методы проверки гипо-

тез (parametric tests)

парные выборки (paired samples)

парный г -критерий (paired samples t test)

показатели вариации (measures of

variability)

показатели центра распределения

(measures of location)

построение таблицы сопряженности

признаков, кросс-табуляция (crosstabulation)

размах вариации (range)

распределение хи-квадрат (chi-square

distribution)

симметричная "лямбда" (symmetric

lambda)

средняя арифметическая, среднее (mean)

стандартное (среднеквадратическое) от-

клонение (standard deviation)

t -статистика ( t -statistic)

статистика хи-квадрат (chi-square statistic)

таблица сопряженности призна-

ков (contingency table)

тау b (tau b )

тау с (tau с )

уровень значимости (level of significance)

фи-коэффициент (phi coefficient)

эксцесс (kurtosis)

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 599

3. Определите межквартильный размах. Что он измеряет?

4. Что означает коэффициент вариации?

5. Каким образом измеряют относительную плоско верши нность или островершинность кри-

вой распределения?

6. Что такое асимметричное распределение?

7. Чем отличается таблица распределения частот от таблицы сопряженности?

8. Какое общее правило вычисления процентов при кросс-табуляции?

9. Дайте определение ложной корреляции.

10. Что означает подавленная связь? Как ее выясняют?

П. Проанализируйте причины частого использования таблиц сопряженности. Каковы огра-

ничения их применения?

12. Представьте классификацию методов проверки гипотез.

13. Опишите обычную процедуру для выполнения проверки гипотезы с помощью /-критерия.

14. Чем отличаются параметрические и непараметрические методы проверки гипотез?

15. Какие непараметрические критерии соответствуют t -критерию двух независимых выборок

для параметрических данных?

16. Какие непараметрические критерии соответствуют t -критерию парных выборок для пара-

метрических данных?

Задачи

1. Для каждой из следующих ситуаций укажите статистический анализ, который надо провес-

ти, и подходящий для этого критерий или тест-статистику.

a) Потребители оценили свое предпочтение мыла Camay по 11-балльной шкале Лайкерта.

Затем они просмотрели коммерческую рекламу о мыле Camay. После этого предпочте-

ния потребителей опять измерили. Изменила ли реклама предпочтения потребителей?

b) Подчиняются ли предпочтения относительно мыла Camay закону нормального распре-

деления?

c) Маркетологи разбили одну тысячу семей на следующие группы, исходя из уровня по-

требления мороженного: много, средне, мало и не употребляющие. Одновременно их

разделили на семьи с высоким, средним и низким доходом, Зависит ли потребление

мороженого от уровня дохода?

d) В исследовании, использующем репрезентативную выборку из 2000 домохозяйств из

потребительской почтовой панели Market Facts, респондентов попросили проранжи-

ровать 10 универмагов, включая универмаг Sears, в порядке предпочтения. Выборка

была разделена на малые и большие семьи (по медиане). Варьируются ли предпочте-

ния покупателей относительно покупки товаров в универмаге Sears в зависимости от

размера семьи?

2. Текущую рекламную кампанию для известного прохладительного напитка следует изме-

нить, если реклама понравится менее чем 30% потребителей.

a) Сформулируйте нулевую и альтернативную гипотезы.

b) Обсудите ошибки I и II рода, которые могут иметь место при проверке гипотез,

c) Какой статистический критерий вам следует использовать? Почему?

d) Была взята случайная выборка из 300 потребителей, и 84 респондента указали, что им

понравилась рекламная кампания. Стоит ли вносить в рекламную кампанию корректи-

ровку? Почему?

600 Часть III. Сбор, подготовка и анализ данных

3. Сеть универмагов (10 магазинов) организовала распродажу холодильников. Количество

проданных холодильников в выборке из десяти магазинов было такими: 80 110 0 40 70 80

100 50 80 30

a) Очевидно ли, что в среднем продано свыше 50 холодильников одним магазином в тече-

ние этой распродажи? Используйте а = 0,05 .

b) Какое допущение необходимо сделать для этой проверки?

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET

И КОМПЬЮТЕРА

1. Используйте статистические пакеты (SPSS, SAS BMDP) для вычисления статистического

критерия для задачи 3.

КОММЕНТАРИИ

1. Chow-Hou Wee, Mei-Lan Choong, Siok-Kuan Tambyah, "Sex Role Portrayal in Television Advertising",

International Marketing Review, January 1995, p. 49-64; Магу С. Gilly, "Sex Roles in Advertising:

A Comparison of Television Advertisements in Australia, Mexico and the United States",

Journal of Marketing, April 1988, p. 75-85.

2. Melissa Dowling, "To Go Direct — or Not", Catalog Age, September 1, 1997, p. 5; Troy A. Festervand,

Don R. Snyder, John D. Tsalikis, "Influence of Catalog vs. Store Shopping and Prior Satisfaction

on Perceived Risk", Journalof the Academy of Marketing Science, Winter 1986, p. 28—36.

3. Saviour L.S. Nwacukwu, Scott. J. Vitell, Jr., Faye W. Gilbert, James H. Barnes, "Ethics and Social

Responsibility in Marketing: An Examination of the Ethical Evaluation of Advertising Strategies",

Journal of Business Research, June 1997, p. 107—18; Shelby D. Hunt, Lawrence B. Chonko, "Ethical

Problems of Advertising Agency Executives", Journal of Advertising, Fall 1994,p. 16—24.

4. О применении частот и дискрептивных статистик см, статью Mary Jo Bitner, Bernard H.

Booms, Lois A. Mohr, "Critical Service Encounters: The Employee's Viewpoint", Journal of

Marketing, October 1994, p. 95-106.

5. Для более подробного описания таких статистик см. любую книгу по статистике, например,

Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed.

(Englewood Cliffs, NJ: Prentice Hall, 1996).

6. Для нашей цели не следует делать различие между проверкой гипотезы и статистическим

выводом через доверительный интервал.

7. Thomas T. Semon, "Let's Hear It for Disaggregate Analysis", Marketing News, March 25, 1996,

p. 10; O. Hellevik, Introduction to Causa! Analysis: Exploring Survey Data by CrossTabulation (Beverly

Hills, CA: Sage Publications, 1984).

8. Lawrence F. Feick, "Analyzing Marketing Research Data with Association Models", Journal of

Marketing Research, November 1984, p. 376-386. Последние применения см. в статье Wagner

A. Kamakura, Michel Wedel, "Statistical Data Fusion for Cross-Tabulation", Journal of Marketing

Research, November 1997, p. 485-498.

9. Wayne Lenell, Robert Boissoneau, "Using Causal-Comparative and Correlational Designs in Conducting

Market Research", Journal of Professional Services Marketing, February 1996, p, 59-69.

10. R. Mark Sirkin, Statistics for the Social Sciences (Thousand Oaks, CA: Sage Publications, 1997).

11. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications,

1997). Для более глубокого изучения см. работу Н.О. Lancaster, The Chi-Squared

Distribution (New York: John Wiley, 1969).

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 601

12. Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed.

(Upper Saddle River, NJ: Prentice Hall, 1996):

13. Однако некоторые ученые-статистики с этим не согласны. Они считают, что не стоит ис-

пользовать поправочный коэффициент. См., например, статью John E, Overall, "Power of

Chi-Square Tests for 2 x 2 Contingency Tables with Small Expected Frequencies", Psychological

Bulletin, January 1980, p, 132-135.

14. Проверка значимости и доверительных интервалов также возможна как для асимметрично-

го коэффициента "лямбда", так и для симметричного. См. статью L.A. Goodman,

W.H. Kruskal, "Measures of Association for Cross Classification: Appropriate Sampling Theory",

Journal of the American Statistical Association, June 1963, p. 310—364.

15. Rohit Verma, John C. Goodale, "Statistical Power in Operations Management Research", Journal of

Operations Management, August 1995, p. 139—152.

16. С технической точки зрения нулевую гипотезу нельзя принять. Ее можно либо отвергнуть,

либо не отвергнуть.

17. Условие, когда нельзя предполагать равенства дисперсий, известно под названием пробле-

мы Беренса-Фишера (Behrens-Fisher). Существует несколько мнений по поводу лучшего

метода расчета данного случая,

18. Anne L. Balazs, "Positioning the Retail Shopping Center for Aging Customers", Stores, April 1995,

p. RR10—RR11; James R. Lumpkin, James B. Hunt, "Mobility as an Influence on Retail Patronage

Behavior of the Elderly: Testing Conventional Wisdom'', Journal of the Academy of Marketing Science,

Winter 1989, p. 1-12.

19. Eleflheria Parpis, "Playing for the Ring", Adweek (Eastern Edition), January 19, 1998, p. 29—31;

Larry Dunst, "Is It Possible to Get Creative in 15 Seconds?", Advertising Age, November 29, 1993,

p. 18; Jerry A. Rosenblatt, Janett Mainprize, "The History and Future of 15-Second Commercials:

An Empirical Investigation of the Perception of Ad Agency Media Directors", in William Lazer, Eric

Shaw, Chow-Hou Wee (eds.), World Marketing Congress (International Conference Scries), vol. IV

(Boca Raton, FL: Academy of Marketing Science, 1989), p. 169-177.

20. Gopal K. Kanji, 100 Statistical Tests (Thousand Oaks, CA: Sage Publications, 1993); Donald L.

Harnett, Statistical Methods, 3rd ed. (Reading, MA: Addison-Wesley, 1982).

21. Marjorie A. Pelt, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications,

1997),

22. Существуют разные точки зрения о том, следует ли использовать непараметрические стати-

стические методы, чтобы сделать статистический вывод о параметрах совокупности. См.

также статью Y.K. Cheung, J.H. Klotz, "The Mann-Whitney-Wilcoxon Distribution Using linked

Lists", Statistica Sinica, July 1997, p. 805-813.

23. t -критерий в этом случае эквивалентен критерию "хи-квадрат" для проверки независимо-

сти в таблице сопряженности 2x2 . Этих два критерия связаны между собой следующим

образом: #:о.и<п = п>.<и<«,+«;-2). Для больших выборок г-распределение приближается к

нормальному, следовательно, / -критерий и г-критерий эквивалентны.

24. James R, Crum, Pradeep A. Rau, Stephen K. Reiser, 'The Marketing Research Process: Role Perceptions

of Researches and Users", Journal of Advertising Research, December—January 1988, p. 9—

21. См, также статью Cyndee Miller, "Gallup Brothers Analyze the Research Industry", Marketing

News, January 6, 1997, p. 2.

25. Пример последнего применения критерия парных сравнений Вилкоксона приведен в рабо-

те U. Kalwani, Narakesari Narayandas, "Long-Term Manufacturer-Supplier Relationships: Do

They Pay Off for Supplier Firms?", Journal of Marketing, January 1995, p. 1—16.

26. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications,

1997); J.G. Field, "The World's Simplest Test of Significance", Journal of the Market

Research Society, July 1971, p. 170-172.

602 Часть III. Сбор, подготовка и анализ данных

27. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications,

1993); Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks,

CA: Sage Publications, 1993); Mahamed Afzal Norat, "Software Reviews", Economic Journal: The

Journal of the Royal Economic Society, May 1997, p. 857—882; John Wass, "How Statistical Software

Can be Assessed", Scientific Computing and Automation (October 1966).

28. Leslie de Chernatony, Chris Halliburton, Ratna Bernath, "International Branding: Demand or Supply

Driven", International Marketing Review, February 1995, p. 9—21.

29. Lawrence B. Chonko, Ethical Decision Making in Marketing (Thousand Oaks, CA: Sage Publications,

1995); G.R. Laczniak, E. Murphy, "Foresting Ethical Marketing Decisions", Journal of Business

Ethics, October 1991, p. 259-271.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 603

 

Дата: 2019-02-25, просмотров: 435.