| Категории
| ||||
1 | 2 | 3 | 4 | Итого | |
Ожидаемые (теоретические) (Е) и эмпирические (О) частоты | Е1 = 20 О1 = 17 | Е2=20 О2= 23 | Е3 = 20 О3= 32 | Е4 =20 О4=8 | 80 |
Полученное значение Х2эмпир сравнивается со значением Х2критич, которое берется из таблицы критических значений для теста х2 (табл. 2, Приложение 2) в зависимости от выбранного уровня значимости α и числа степеней свободы df. В свою очередь, число степеней свободы для теста х2 зависит от размера расчетной таблицы и равно df =( k — 1). В нашем случае df =( k — 1) = (4— 1) = 3.
Если Х2эмпир меньше Х2критич, то нет оснований отвергнуть нулевую гипотезу (нет значимых различий между эмпирическим и теоретическим распределением: автомобили всех стран-производителей одинаково представлены на городских улицах).
Если Х2эмпир больше или равно Х2критич, то нулевая гипотеза отклоняется и принимается альтернативная (эмпирическое распределение значимо отличается от теоретического: автомобили одних стран-производителей встречаются на городских улицах чаще или реже, чем автомобили других).
Из таблицы 2 находим, что для df =3 и α =0,05 Х2критич,==7,82.
Поскольку Х2эмпир = 15,3 больше, чем Х2критич,=7,82, то нулевая гипотеза отклоняется и принимается альтернативная. Автомобили одних стран-производителей встречаются на городских улицах чаще или реже, чем автомобили Других.
Сделаем несколько замечаний относительно теста х2.
1. Для его корректного применения необходима достаточно большая выборка (не менее 30 значений).
2. Если df = 1 (или k =2), все ожидаемые частоты должны быть больше 5.
3. Если df > 1 (или k > 2), часть ожидаемых частот (не более 20%) могут быть менее 5. При этом не должно быть ожидаемых частот меньших 1.
4. В том случае, если предыдущее условие не выполняется, требуется укрупнение категорий (объединение нескольких категорий в одну) с целью 5 избавления от ожидаемых (теоретических) частот меньших 5 или 1. Например, в рассмотренном примере вместо четырех возможно использование трех категорий «Америка», «Европа», «Азия и другое». Это приведет к росту значения теоретических (ожидаемых) частот (80 значений будут распределены по трем категориям, по 26,67 значений в каждой категории).
5. Тест х2 позволяет выявлять отличие эмпирического распределения от теоретического или отличия между несколькими эмпирическими распределениями, но не выявляет направление этих отличий9.
9 Из этого следует, что здесь неприменимо понятие односторонней критической области (за одним исключением, которое рассмотрено ниже).
ВКЛЮЧАЕМ КОМПЬЮТЕР...
Создадим переменную «Автомобили» (саге) с использованием следующих обозначений: 1 — США, 2— Европа, 3 — Азия, 4 — другие страны. Представим в этой переменной данные о странах-производителях для 80 автомобилей. Дальнейшая очередность действий и конечный результат показаны на рисунках 3.5—3.7.
Рис. 3.5. Выбор требуемой статистической процедуры
Рис. 3.6. Тест х2 для единственной выборки: необходимые действия и настройки
Рис. 3.7. Тест х2 для единственной выборки: результат.
Дата: 2018-12-21, просмотров: 476.