Статистические методы, объединенные понятием «непараметрическая статистика», стали набирать популярность к концу 1940-х гг.
Существует несколько теоретических и практических предпосылок, обусловивших развитие непараметрического направления в статистике.
1. Большинство наших рассуждений и рассмотренных выше примеров явно или неявно отталкивались от предположения о нормальном распределении экспериментальных данных. Во многих случаях это предположение оправдано, однако встречаются ситуации, когда либо о характере распределения мало что известно, либо оно явно отличается от нормального. Например, на рис. 1.26 приведены сведения о числе госпитализаций в течение жизни, полученные при опросе 763 человек, употребляющих наркотики:
Рис. 1.26. Число госпитализаций
Как видно из рисунка, характер распределения даже отдаленно не напоминает нормальное.
В том случае, когда экспериментальные данные имеют неизвестный или отличный от нормального закон распределения, нельзя использовать методы проверки статистических гипотез, базирующиеся на свойствах и параметрах нормального распределения.
Это обстоятельство стало одной из основных предпосылок для создания методов проверки статистических гипотез, в которых свойства нормального распределения не применяются. Тем самым стало формироваться направление, получившее название «непараметрическая статистика» (в отличие от «параметрической статистики», использующей параметры нормального распределения или других распределений, полученных на основе нормального)17.
17 Сказанное не означает, что эти методы нельзя использовать для нормально распределенных результатов. Речь идет о том, что эти методы можно применять, вообще не думая о характере распределения. Поэтому в ряде случаев непараметрические методы статистики называют методами, свободными от характера распределения.
2. Важным фактором, обеспечивающим надежную проверку статистических гипотез, является размер (объем) выборки. Мы уже приводили пример, показывающий, как, в зависимости от объема выборки, меняется результат проверки.
К сожалению, в поведенческих науках (психология, педагогика, социальная работа и др.) далеко не всегда есть возможность получать значительные по объему выборки (содержащие, например, не менее 100 значений). Во многих исследованиях приходится ограничиваться выборками, содержащими не более двух-трех десятков значений. Но на столь малых выборках обычные (параметрические) методы проверки статистических гипотез не работают. Это обстоятельство стало еще одним толчком к разработке непараметрических методов, пригодных к работе с малыми выборками.
3. Развитие экспериментальных методов в психологии, педагогике, социальной работе и др. привело к формированию нового подхода к пониманию измерения. Классическая теория измерений (невозможная без опоры на математическую статистику) имела дело исключительно с физическими измерениями, производимыми в шкале отношений18. Однако измерительные процедуры, например, в психологии связаны с более частым использованием других измерительных шкал.
18 Подробнее об измерениях и шкалах в следующей главе.
Науки о человеке оказались в наибольшей степени заинтересованными в развитии измерительных и статистических методов, не привязанных к методологии физических измерений и нормальному распределению.
Непараметрические методы статистики целесообразней всего применять при сочетании трех факторов:
· малая выборка;
· неизвестный (или отличный от нормального) закон распределения;
· нефизическая природа изучаемых явлений (качества, психологические характеристики, мнения, установки и др.).
В этом случае непараметрическая статистика обладает явными преимуществами по сравнению с параметрической.
Как правило, основным критерием при выборе непараметрической или параметрической статистики является объем выборки. Чем выборка меньше, тем более оправдано применение непараметрической статистики. Отражением этого обстоятельства стало то, что многие статистические таблицы для непараметрических методов ограничены объемом выборки в 30—40 значений. При выходе выборки за эти пределы приходится прибегать к дополнительным вычислениям и, как правило, переходить к статистическим таблицам для нормального распределения или распределения χ2. Если же приходится иметь дело с еще большими по размеру выборками, то в этом случае применение непараметрических методов возможно, но нецелесообразно, поскольку в большинстве случаев уже можно пользоваться обычной параметрической статистикой19.
19 При условии, что характер анализируемых данных позволяет сделать это.
В принципе, как параметрические, так и непараметрические методы статистики применяются для решения одного и того же круга задач: сравнение зависимых и независимых выборок, вычисление мер связи (корреляций) и др. В зависимости от конкретных обстоятельств, одна и та же задача может быть решена как параметрическими, так и непараметрическими методами. Например, при сравнении двух независимых выборок часто используется t-тест Стьюдента (сравнение средних). В непараметрической статистике та же самая задача будет решаться с использованием теста Манна—Уитни, который является непараметрическим аналогом теста Стьюдента.
Таблица 1.10 является путеводителем по методам непараметрической статистики, которые будут рассмотрены ниже
Таблица 1.10.
Основные непараметрические методы статистики20
Уровень измерения | Случай одной выборки | Случай двух выборок | Случай нескольких выборок | Непараметрические меры корреляции | ||
Связанные (зависимые) выборки | Независимые выборки | Связанные (зависимые) выборки | Независимые выборки | |||
Номинальный | Биноминальный тест Тест Х2 для одной выборки | Тест МакНемара | Точный тест Фишера Тест Х2 для двух независимых выборок | Q тест Кохрана | Тест Х2 для нескольких независимых выборок | |
Порядковый21 | Тест Колмогорова−Смирнова для одной выборки Тест последовательностей | Тест знаков Тест Вилкоксона | U тест Манна−Уитни Тест Колмогорова−Смирнова для двух независимых выборок Тест последовательностей Вальда−Волфовица Тест экстремальных реакций Мозеса | Тест Фридмана | Расширенный медианный тест Тест Крускала−Уоллиса Тест Джонкхиера−Терпстра для упорядоченных альтернатив | Коэффициент ранговой корреляции Спирмена Коэффициент ранговой корреляции Кендалла Коэффициент конкордации Кендалла |
20 Перечень непараметрических методов статистики не исчерпывается теми, которые вошли в таблицу 1.10. В частности, за рамками нашего рассмотрения остались немногие методы для шкалы интервалов, меры, связанности для дихотомических данных (например, коэффициент Крамера), частная ранговая корреляция и др. Подробнее об этих и других методах см. Conover [Conover, 1999], Siegel [Siegel, 1956], Siegel and Castellan [Siegel and Castellan, 1988].
21 Разумеется, непараметрические методы могут применяться для данных, представленных в шкале интервалов или отношений. Но в этом случае анализируемые данные рассматриваются как порядковые.
Глава 2 КАК ИЗМЕРИТЬ НЕИЗМЕРИМОЕ:
Дата: 2018-12-21, просмотров: 593.