1) Составить список испытуемых в любом порядке, например, алфавитном.
2) Вычислить разность между индивидуальными значениями во втором и первом замерах
("после" – "до"). Определить, что будет считаться "типичным" сдвигом и сформулировать
соответствующие гипотезы.
3) Перевести разности в абсолютные величины и записать их отдельным столбцом (иначе трудно
отвлечься от знака разности).
4) Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший
ранг. Проверить совпадение полученной суммы рангов с расчетной.
5) Отметить кружками или другими знаками ранги, соответствующие сдвигам в "нетипичном"
направлении.
6) Подсчитать сумму этих рангов по формуле:
Т=∑Rr, где Rr – ранговые значения сдвигов с более редким знаком.
7) Определить критические значения Т для данного n по табл. 4 Приложения 5.3.
Если Тэмп. меньше или равен Ткр., сдвиг в "типичную" сторону по интенсивности достоверно
преобладает.
L-критерий Пейджа.
http://statistika.siteedit.ru/page7
L-критерий Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых. Критерий позволяет выявить тенденции в изменении величин признака при переходе от условия к условию
l-kritery-page.htm
Критерий Пеиджа (его полное название Lкритерий тенденций Пеиджа) можно рассматривать как эквивалент критерия Фридмана для сопоставления показателей измеренных в трех и более условиях на одной и той же выборке испытуемых. Однако этот критерий не только позволяет выявить различия, но указывает на направление в изменении величин признака. Именно поэтому он является более предпочтительным.
Так, например, критерий Пеиджа позволяет проверить предположения о временной или ситуативно обусловленной динамике изменения каких-либо признаков. К сожалению, применение этого достаточно мощного критерия ограничено объемом выборки – число испытуемых не может быть больше 12 и числом измерений признака – оно не может быть больше 6.
Задача 6.6.Решим еще раз задачу 6.5, но уже помощью критерия Пеиджа, используя уже готовую таблицу 6.10. При этом основной тенденцией данного примера будем считать увеличение времени решения второго и четвертого заданий по сравнению с первым и третьим заданиями.
Решение. Подчеркнем, что первые несколько операций аналогичны операциям критерия Фридмана. Поэтому их описание мы опускаем и отсылаем к предыдущему критерию.
Дальнейшая работа с критерием Пейджа заключается в преобразовании таблицы 6.10. Следует попарно переставить столбцы таблицы 6.10, ориентируясь на величины сумм рангов так, чтобы в начале таблицы стояли столбцы с наименьшей суммой рангов, а в конце таблицы – с наибольшей. Понятно, что столбцы с соответствующими измерениями также переставляются. После проведения необходимых перестановок получается таблица 6.11.
Таблица 6.11
№ 1 | № 2 | № 3 | № 4 | № 5 | № 6 | № 7 | № 8 | № 9 |
№ испытуемых п/п | Время решения первого задания теста в сек. | Ранги времени решения первого задания теста | Время решения третьего задания теста в сек. | Ранги времени решения третьего задания теста | Время решения четвертого задания теста в сек. | Ранги времени решения четвертого задания теста | Время решения второго задания теста в сек. | Ранги времени решения второго задания теста |
2,5 | 2,5 | |||||||
Сумма рангов | 11,5 | 19,5 |
Теперь все готово для подсчета эмпирического значения Lэмп критерия Пейджа. Оно определяется по формуле:
где Ri – сумма рангов i-того столбца в упорядоченнойтаблице
i– порядковый номер столбца, получившийся в новойтаблице, упорядоченной по сумме рангов
с – число измерений.
Используя формулу (6.2) вычисляем эмпирическое значение Lэмп для нашего примера:
По таблице 5 Приложения определяем критические значения Lкрдля числа испытуемых n = 6 и для числа измерений с = 4. Отметим, что в таблице критических значений критерия Пейджа добавлен уровень значимости 0,001 или 0,1%. Представим соответствующий блок таблицы 5 Приложения в виде таблицы 6.12.
Таблица 6.12
№ – число испытуемых | С – количество измерений 4 | Р – уровень значимости Р |
0,001 | ||
0,01 | ||
0,05 |
Используя привычную форму записи для критических величин, получаем следующее выражение:
Строим “ось значимости”:
В нашем примере значение Lэмппопало в зону неопределенности, следовательно, можно считать, что тенденция увеличения времени решения заданий теста №№ 2 и 4 по сравнению с заданиями №№ 1 и 3 оказалась значимой на уровне 5 %.
Переформулируем полученный результат в терминах нулевой и альтернативной гипотез: поскольку между показателями, измеренными при решении четырех заданий теста, существуют не случайные различия на 5 % уровне значимости, то нулевая гипотеза Н0, т.е. гипотеза о сходстве отвергается, и принимается альтернативная гипотеза Н1 о наличии различий.
Сравнивая выводы, полученные при решении задачи 5 с помощью критериев Фридмана и Пейджа, можно подумать, что они не согласуются друг с другом. Однако это не совсем так. Эти критерии обращаются к разным сторонам анализируемого материала, характеризуя различные аспекты обрабатываемых данных. Если первый критерий – Фридмана – выявляет наличие различий в измеренных показателях (признаках), то критерий Пейджа позволяет выявить тенденцию в изменениях величин измеряемых признаков.
Приведем еще один пример использования критерия Пейджа.
Задача 6.7.Психолог высказывает предположение о наличии следующей тенденции: время решения заданий теста будет возрастать по мере увеличения их сложности.
Решение. Для выявления этой тенденции психолог сравнивает время решения пяти заданий теста у тех же шести испытуемых. Поскольку начальные операции с данными представлены выше, то результаты обработки по критерию Пейджа сразу представим в виде таблицы 6.13.
Как всегда необходимо проверить правильность ранжирования. Общая сумма рангов составила: 11 + 22 + 11,5 + 19 + 26,5 = 90
Согласно формуле (1.3): n ´ c ´ (c + 1) : 2 она должна быть 6 ´ 5 ´ (5 + 1) : 2 = 90
Таблица 6.13
№ испытуемых п/п | Время решения первого задания теста в сек. | Ранги времени решения первого заданиятеста | Время решения второго задания теста в сек. | Ранги времени решения второго задания теста | Время решения третьего задания теста в сек. | Ранги времени решения третьего заданиятеста | Время решения четвертого задания тестав сек. | Ранги времени решения четвертого заданиятеста | Время решения пятого задания в сек. | Ранги времени решения пятого задания теста |
2,5 | 2,5 | |||||||||
4,5 | 4,5 | |||||||||
Сумма рангов | 11,5 | 26,5 |
Сравнив результаты первого и второго подсчета рангов, делаем вывод о том, что ранжирование произведено правильно.
Теперь, чтобы подсчитать Lэмппо формуле (6.2), не будем строить новую таблицу, а применим второй способ вычислений. Для этого рассмотрим сумму рангов как обычный ряд чисел и проранжируем этот ряд. Причем каждой величине этого нового, упорядоченного ряда поставим в соответствие его ранг. Этот ранг в формуле (6.2) обозначен как индекс i. Поэтому получатся следующие соответствия:
Теперь, имея суммы рангов и соответствующие им индексы, можно применить формулу (6.2):
Следующим этапом, как всегда, является нахождение критических величин для соответствующего числа испытуемых и измерений.
По таблице 5 Приложения находим для n = 6 и с – 5:
Строим соответственно “ось значимости”:
Полученная величина Lэмпкритерия тенденций Пейджа оказалась значимой на 0,1% уровне. Следовательно, по мере увеличения сложности заданий, увеличивается и время их решения.
В терминах статистических гипотез полученный результат таков: Н0 – нулевая гипотеза о сходстве должна быть отвергнута, а на уровне 0,1% следует принять альтернативную гипотезу Н1 о наличии различий. Иными словами, тенденция увеличения времени решения заданий теста с увеличением их сложности не является случайной.
Для применения критерия Пейджа необходимо соблюдать следующие условия:
1. Измерение может быть проведено в ранговой, интервальной ив шкале отношений.
2. Выборка должна быть связной.
3. В выборке должно быть не менее двух и не больше 12 испытуемых, каждый из которых имеет не менее трех измеренных показателей.
4. Применение критерия ограничено, так как таблицы критических значений рассчитаны на небольшую выборку (n < 12) ималенькое число измерений (не больше 6). Если эти ограничения не выполняются, приходится использовать критерийФридмана.
31. χ2-критерий Пирсона. Применение критерия для установления сходства-различия между эмпирическим и равномерным распределением.
с. 31 (123) 121.JPG
Глава 9
АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-видимому, самого широкого класса гипотез — в отношении тех явлений, измерения которых доступны в номинативной шкале.
ПРИМЕРЫ
Кто чаще обращается в службу знакомств: мужчины или женщины? Зависит ли количество аварий на производстве от дня недели? Можно ли утверждать, что водители-женщины чаще становятся участниками ДТП (дорожно-транспортных происшествий)?
Можно ли утверждать, что выигрыши в игре распределены не случайно среди проигрышей?
Данные для ответов на подобные обыденные и чисто академические вопросы могут быть получены при помощи простого способа — классификации событий и людей по интересующим градациям. И несмотря на, казалось бы, бесчисленное многообразие подобных ситуаций, все они могут быть сведены /с трем типичным случаям:
1 — сравнение наблюдаемого (эмпирического) распределения частот с ожи
даемым (теоретическим) распределением;
2 —- сравнение двух или более наблюдаемых распределений частот;
3 — сравнение наблюдаемого распределения событий X среди событий Y
(серий X, Y) со случайным распределением.
ПРИМЕРЫ___________________________________________________
Случай I.
1. Кто чаще обращается в службу знакомств: мужчины или женщины? Для ответа
на этот вопрос необходимо: а) подсчитать количество женщин и мужчин, обра
тившихся в службу знакомств; б) воспользовавшись методом статистической
проверки, сопоставить полученное эмпирическое соотношение мужчин и жен
щин с ожидаемым (теоретическим) равномерным распределением.
Зависит ли количество аварий на производстве от дня недели? Проверка этого
предположения требует выполнения сходных действий: а) подсчитать количе
ство аварий для каждогодня недели за достаточно длительный промежуток времени; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое распределение количества аварий по дням недели с ожидаемым (теоретическим) равномерным распределением.
Случай П.
1. Зависит ли предпочтение напитка (минеральная вода, сок, лимонад) от сезона
(зима, весна, лето, осень)? Для проверки этого предположения необходимо для
каждого респондента определить тип предпочитае
мого напитка (первая номинативная переменная, 3
градации) и сезон опроса (вторая номинативная переменная — 4 градации).
2. Зависит ли предпочтение одного из пяти кандида
тов на выборах от пола потенциального избирате
ля? Для проверки этого предположения необходи
мо для каждого респондента определить пол (первая
номинативная переменная, 2 градации) и предпо
читаемого кандидата, одного из пяти (вторая номи
нативная переменная, 5 градаций).
3. Повлияла ли рекламная кампания на выбор респондентами одного из двух
товаров? Это предположение требует опроса респондентов на предмет предпоч
тения одного из двух товаров дважды: до рекламной кампании (первая номина
тивная переменная, две градации) и после нее (вторая номинативная перемен
ная, те же две градации).
Для решения подобных задач, связанных с анализом классификаций или таблиц сопряженности, оказывается достаточным применение одного и того же критерия — у}-Пирсона:
(9.1)
где Р— количество ячеек таблицы распределения или сопряженности, содержащих эмпирические значения частот;/,,/. — эмпирическое и теоретическое значения частот для одной ячейки; к— число градаций сопоставляемых распределений; / — количество сопоставляемых распределений. Приведенная формула является общей для различных ситуаций, и в каждом случае ее применение обладает своей спецификой.
ПРИМЕРЫ
Случай III.
!. Является ли закономерным последовательный повтор выигрышей среди проигрышей в игре или это случайные совпадения?
2. В последовательности событий X и Y является ли закономерным их чередова
ние (X после Y и наоборот)?
3. Наблюдается ли закономерность в чередовании быстрых и медленных реакций
на некоторый стимул: имеютли они тенденцию к группированию или после мед
ленной реакции следует быстрая (и наоборот)?
Для решения задач такого типа необходимо упорядочить события во времени и подсчитать число серий. Серия — это последовательность однотипных событий, непосредственно перед и после которой произошли события другого типа. Далее применяется критерий серий, позволяющий определить вероятность случайного появления наблюдаемого числа серий при условии хаотичного распределения событий А"среди событий Y.
Очень часто при исследовании классификаций, сопряженности или последовательности нет необходимости в накоплении данных в привычных таблицах типа «объект-признак»: результаты наблюдений сразу заносят в таблицу распределения (сопряженности) или составляют последовательность. В этом случае нет необходимости в использовании специальных статистических программ, и все расчеты можно провести «вручную». Тем более что они не составляют особого труда.
АНАЛИЗ КЛАССИФИКАЦИИ:
Дата: 2016-10-02, просмотров: 245.