Для решения задачи сравнения выборок пользуются статистическими критериями. Критерий вообще — это решающее правило, обусловливающее поведение в ситуации выбора. Статистическим критерием называется правило, обеспечивающее надежное поведение, т. е. принятие истинной и отклонение ложной гипотезы с высокой вероятностью. Слова статистический критерий обозначают также метод расчета определенного числа и само это число.
Критерии делятся на параметрические и непараметрические; односторонние и двусторонние.
При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе — двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости 0,05, теперь соответствует лишь уровню 0,10.
Этапы принятия решения для статистических критериев одни и те же: эмпирическое (или расчетное) значение критерия сравнивается с критическим значением и делается вывод. По их соотношению мы можем судить, подтверждается или опровергается нулевая гипотеза. Каким именно должно быть это соотношение, указывается в правиле принятия решения (правиле вывода) этого критерия. Обратите внимания на то, что для одних критериев для принятия альтернативной гипотезы и отклонения нулевой гипотезы необходимо, чтобы Чэмп≥Чкр; для других критериев — Чэмп≤Чкр.
В большинстве случаев критические значения критерия находятся по соответствующим таблицам критических значений в зависимости от числа наблюдений (объема выборки) N. Однако есть критерии (например, критерий хи-квадрат Пирсона или критерий Стьюдента), для которых критическое значение находится в зависимости от так называемого числа степеней свободы, которое обозначается, как правило, буквой «ню»: ν.
Число степеней свободы ν или df равно числу классов вариационного ряда минус число условий, при которых он был сформирован, иначе: количество возможных направлений изменчивости переменной. Это понятие можно пояснить на простом примере. Пусть у нас имеется уравнение х1+х2+х3=10. Данная сумма может получаться при различных значениях переменных, например, 2+5+3=10; 3+3+4=10;1+0+9=10; +6+7–3=10 и т.п. Два слагаемых могут быть любыми числами, а последнее должно дополнять сумму первых двух до десяти, то есть оно является не свободным, а «связанным». Таким образом, возможное число изменений равно двум, а в общем случае для N слагаемых это число равно N–1.
Если признак измерен по шкале наименований, например, определялся тип темперамента людей (число градаций значений признака или классов равно 4-м). В первые три класса может войти любое количество испытуемых, а в последний класс должно войти столько, сколько будет дополнять общее количество испытуемых в первых трех группах до общего объема выборки N.
В общем случае можно сказать, что число степеней свободы определяется как число объектов в выборке, число классов или интервалов квантования за вычетом количества характеристик, определяющих переменную. Так, например, сумма определяется только одной характеристикой — числом слагаемых; признак, измеренный по шкале наименований, также одной — числом значений признака (числом градаций или классов); признак, измеренный в интервальной шкале и имеющий нормальное распределение, определяется числом интервалов квантования, средним арифметическим и стандартным отклонением.
Для каждого случая (статистического критерия) определение числа степеней свободы имеет свою специфику. Поэтому в каждом алгоритме расчета критерия указывается правило (формула) для определения числа степеней свободы.
Параметрические критерии служат для проверки гипотез о параметрах распределений или для их оценивания (т. е. является ли параметр, полученный на выборке испытуемых, и параметром генеральной совокупности). Они включают в формулу расчета параметры распределения (например, критерий Стьюдента, критерий Фишера и др.). Для их расчета необходимо прежде подсчитать параметры распределения. Параметрические критерии применяются сравнения параметров признаков, измеренных по количественной шкале (интервальной или пропорциональной) при условии нормального распределения признака.
Непараметрические критерии — критерии, не включающие в формулу расчета параметры распределения и основанные на оперировании частотами или рангами (например, критерий знаков, критерий Ван-дер-Вардена и др.). Непараметрические критерии применяются для сравнения признаков измеренных в основном по шкалам порядка, интервальным или пропорциональным; некоторые критерии могут применяться даже в шкале наименований. Непараметрические критерии безразличны к форме распределения признака, они не требуют нормального распределения.
Под мощностью критерия понимается его способность правильно отбрасывать ложную гипотезу. Она определяется эмпирическим путем. При этом оказывается, что одни и те же задачи могут быть решены с помощью разных критериев; при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий.
Основанием выбора критерия может быть не только мощность, но и другие его характеристики:
а) простота расчетов;
б) более широкий диапазон использования (например, по отношению к данным, измеренным по шкале наименований, или по отношению к большим N);
в) применимость по отношению к неравным объемам выборки;
г) большая информативность результатов.
Кроме этого, необходимо учитывать, с какого вида выборками мы имеем дело в данном исследовании.
Выборки бывают двух видов: независимые и зависимые.
Независимые выборки (не связанные выборки) — это две выборки, составленные из разных людей, у которых были измерены одни и те же признаки по одним и тем же методикам, например, экспериментальная и контрольная группы, женщины и мужчины, здоровые и больные, 9а и 9б классы и т.п.
Зависимые выборки (связанные выборки) — это одна и та же группа людей, у которых были измерены одни и те же признаки в двух (или более) различных ситуациях, например, «до — после», «фон — стресс».
Для того, чтобы выбрать критерий различий, необходимо ответить себе на три или четыре вопроса:
Дата: 2019-11-01, просмотров: 228.