См в вопросе №32 таблицу: с. 21 (113)
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

http://www.psychol-ok.ru/statistics/pearson/

Назначение критерия χ2 - критерия Пирсона

Критерий χ2 применяется в двух целях:

1) для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным;

2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака (в скрипте до 10).

Описание критерия

Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил брака", "решил задачу - не решил задачу" и т. п. мы уже можем применить критерий χ2.

Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение χ2.

 

titkova-matmetody.pdf с. 77

Распределения могут различаться по средним, дисперсиям, асимметрии, эксцессу и по

сочетаниям этих параметров. Рассмотрим несколько примеров.

На Рис. 5.6 представлены два распределения признака. Распределение 1 характеризуется

меньшим диапазоном вариативности и меньшей дисперсией, чем распределение 2. В

распределении 1 чаще встречаются значения признака, близкие к средней, а в распределении 2

чаще встречаются более высокие и более низкие, чем средняя, значения признака.

Рисунок 5.6. Кривые распределения признака с меньшим диапазоном вариативности

признака(1) и большим диапазоном вариативности признака (2)

Именно такое соотношение может наблюдаться в распределении фенотипических

признаков у мужчин (кривая 2) и женщин (кривая 1). Фенотипическая дисперсия мужского пола

должна быть больше, чем женского (Геодакян В.А., 1974; 1993). Мужчины – это авангардная часть

популяции, ответственная за поиск новых форм приспособления, поэтому у них чаще встречаются

редкие крайние значения различных фенотипических признаков. Эти отклонения, по мнению В.А.

Геодакяна носят "футуристический" характер, это "пробы", включающие как будущие возможные

пути эволюции, так и ошибки (Геодакян В.А., 1974, с. 381). В то же время женская часть

популяции ответственна за сохранение уже накопленных изменений, поэтому у них чаще

встречаются средние значения фенотипических признаков.

Анализ реально получаемых в исследованиях распределений может позволить нам

подтвердить или опровергнуть данные теоретические предположения.

На Рис. 5.7 представлены два распределения, различающиеся по знаку асимметрии:

распределение 1 характеризуется положительной асимметрией (левосторонней), а распределение 2

– отрицательной (правосторонней).

Рисунок 5.7. Кривые распределения признака с положительной асимметрией (1) и

отрицательной (2)

Данные кривые могут отражать распределение времени решения простой задачи (кривая 1)

и трудной задачи (кривая 2). Простую задачу большинство испытуемых решают быстро, поэтому

большая часть значений группируется слева. В то же время сама простота задачи может привести

к тому, что некоторые испытуемые будут думать над нею очень, очень долго, дольше даже, чем

над сложной.

Трудную задачу большинство испытуемых решают в тенденции дольше, чем простую, но в

то же время почти всегда находятся люди, которые решают ее мгновенно. Если мы докажем, что

распределения статистически достоверно различаются, это может стать основой для построения

классификаций задач и типологий испытуемых.

Часто бывает полезно сопоставить полученное эмпирическое распределение с

теоретическим распределением. Например, для того, чтобы доказать, что оно подчиняется или,

наоборот, не подчиняется нормальному закону распределения.

В практических целях эмпирические распределения должны проверяться на

"нормальность" в тех случаях, когда мы намерены использовать параметрические методы и

критерии.

Традиционные для отечественной математической статистики критерии определения

расхождения или согласия распределений – это метод χ2 – К. Пирсона и λ-критерий Колмогорова-

Смирнова.

Оба эти метода требуют тщательной группировки данных и довольно сложных

вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших

выборках (n>30). Тем не менее, они могут оказаться столь незаменимыми, что исследователю

придется пренебречь экономией времени и усилий. Например, они незаменимы в следующих двух

случаях:

1) в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких

альтернатив;

2) в задачах, требующих обнаружения точки максимального расхождения между двумя

распределениями, которая затем используется для перегруппировки данных с целью

применения критерия ϕ* (углового преобразования Фишера).

Назначения критерия.

Критерий χ2 применяется в двух целях:

1) для сопоставления эмпирического распределения признака с теоретическим – равномерным,

нормальным или каким-то иным;

2) для сопоставления двух трех или более эмпирических распределений одного и того же

признака На самом деле области применения критерия χ2 многообразны (см., например:

Суходольский Г.В., 1972, с. 295), но в данном руководстве мы ограничиваемся только этими

двумя, наиболее часто встречающимися на практике, целями).

Описание критерия.

Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные

значения признака в эмпирическом и теоретическом распределениях или в двух и более

эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения

признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом

случае альтернативного распределения "да – нет", "допустил брак – не допустил брака", "решил

задачу – не решил задачу".

При сопоставлении эмпирического распределения с теоретическим мы определяем степень

расхождения между эмпирическими и теоретическими частотами.

При сопоставлении двух эмпирических распределений мы определяем степень

расхождения между эмпирическими частотами и теоретическими частотами, которые

наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета

теоретических частот будут специально даны для каждого варианта сопоставлений.

Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше

эмпирическое значение χ2.

Гипотезы.

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой

ставим.

Первый вариант:

H0: Полученное эмпирическое распределение признака не отличается от теоретического

(например, равномерного) распределения.

H1: Полученное эмпирическое распределение признака отличается от теоретического

распределения.

Второй вариант:

H0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

H1: Эмпирическое распределение 1 отличается от эмпирического распределения 2.

Третий вариант:

H0: Эмпирические распределения 1, 2, 3,... не различаются между собой.

Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой.

Критерий χ2 позволяет проверить все три варианта гипотез.

Ограничения критерия.

1) Объем выборки должен быть достаточно большим: n>.30. При n<30 критерий χ2 дает весьма

приближенные значения. Точность критерия повышается при больших п.

2) Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: ƒ≥5. Это

означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем

применять метод, χ2 не накопив определенного минимального числа наблюдений. Если,

например, мы хотим проверить наши предположения о том, что частота обращений в

телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам

потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее,

как в данном случае, минимальное число наблюдений (nmin) определяется по формуле:

nmin=k*5.

3) Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь

диапазон вариативности признаков. При этом группировка на разряды должна быть

одинаковой во всех сопоставляемых распределениях.

4) Необходимо вносить "поправку на непрерывность" при сопоставлении распределений

признаков, которые принимают всего 2 значения. При внесении поправки значение χ2

уменьшается (см. Пример с поправкой на непрерывность).

5) Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду,

то оно уже не может быть отнесено ни к какому другому разряду. Сумма наблюдений по

разрядам всегда должна быть равна общему количеству наблюдений.

Правомерен вопрос о том, что считать числом наблюдений – количество выборов, реакций,

действий или количество испытуемых, которые совершают выбор, проявляют реакции или

производят действия. Если испытуемый проявляет несколько реакций, и все они регистрируются,

то количество испытуемых не будет совпадать с количеством реакций. Мы можем

просуммировать реакции каждого испытуемого, как, например, это делается в методике

Хекхаузена для исследования мотивации достижения или в Тесте фрустрационной толерантности

С. Розенцвейга, и сравнивать распределения индивидуальных сумм реакций в нескольких

выборках.

В этом случае числом наблюдений будет количество испытуемых. Если же мы

подсчитываем частоту реакций определенного типа в целом по выборке, то получаем

распределение реакций разного типа, и в этом случае количеством наблюдений будет общее

количество зарегистрированных реакций, а не количество испытуемых.

С математической точки зрения правило независимости разрядов соблюдается в обоих

случаях: одно наблюдение относится к одному и только одному разряду распределения.

Но считать ли наблюдением каждого испытуемого или каждую исследуемую реакцию

испытуемого – вопрос, решение которого зависит от целей исследования.

Пример 5.7. (с поправкой на непрерывность).

В исследовании порогов социального атома профессиональных психологов просили

определить, с какой частотой встречаются в их записной книжке мужские и женские имена

коллег-психологов. Попытаемся определить, отличается ли распределение, полученное по

записной книжке женщины-психолога X, от равномерного распределения. Эмпирические частоты

представлены в табл. 5.8

Таблица 5.8. Эмпирические частоты встречаемости имен мужчин и женщин в записной

книжке психолога Х

Гипотезы.

H0: Распределение мужских и женских имен в записной книжке Х не отличается от

равномерного распределения.

H1: Распределение мужских и женских имен в записной книжке Х отличается от

равномерного распределения.

Количество наблюдений n=67; количество значений признака k=2. Рассчитаем

теоретическую частоту: ƒтеор.=n/k=33.5

Число степеней свободы ν=k-1.

Далее все расчеты производим по известному алгоритму, но с одним добавлением: перед

возведением в квадрат разности частот мы должны уменьшить абсолютную величину этой

разности на 0,5 (см. табл. 5.8, четвертый столбец).

Таблица 5.8. Расчет критерия χ2 при сопоставлении эмпирического распределения имен с

теоретическим равномерным распределением

По таблице 5 Приложения 5.3 находим критические значения критерия для ν=1.

Пример 5.8 (сравнение двух эмпирических распределений). Определим, различаются ли

распределения мужских и женских имен у психолога А и психолога В, тоже женщины.

Эмпирические частоты приведены в табл. 5.10.

Таблица 5.10. Эмпирические частоты: встречаемости имен мужчин и женщин в записных

книжках психолога X. и психолога С.

Гипотезы.

H0: Распределения мужских и женских имен в двух записных книжках не различаются.

H1: Распределения мужских и женских имен в двух записных книжках различаются между

собой.

Теоретические частоты рассчитываем по уже известной формуле:

Все дальнейшие расчеты проводим по алгоритму (табл. 5.11).

Таблица 5.11. Расчет критерия при сопоставлении двух эмпирических распределений

мужских и женских имен

Замечание. Поправки на непрерывность можно избежать, если подобного рода задачи

решать с помощью ϕ*-критерия Фишера.

АЛГОРИТМ

Расчет критерияχ2

1) Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты

(первый столбец).

2) Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).

3) Подсчитать разности между эмпирической и теоретической частотой по каждому разряду

(строке) и записать их в третий столбец.

4) Определить число степеней свободы по формуле: ν=k-1, где k – количество разрядов признака.

Если ν=1, внести поправку на "непрерывность".

5) Возвести в квадрат полученные разности и занести их в четвертый столбец.

6) Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в

пятый столбец.

7) Просуммировать значения пятого столбца. Полученную сумму обозначить как χ2

.эмп.

8) Определить по табл. 5 Приложения 5.3 критические значения для данного числа степеней

свободы ν.

Если χ2

.эмп меньше критического значения, расхождения между распределениями

статистически недостоверны.

Если χ2

.эмп равно критическому значению или превышает его, расхождения между

распределениями статистически достоверны.

32. χ2-критерий Пирсона. Применение критерия для установления сходства-различия между эмпирическим и нормальным распределением. (???чем этот вопрос отличается от № 31???)

titkova-matmetody.pdf с. 77 (см. начало в билете №31)

см. также вопрос № 36 http://psystat.at.ua/publ/1-1-0-17 (очень доступно о корреляциях!!!)

с. 21 (113)

Связь Хи Y

Рис. 8.1. Классификация методов статистического вывода о связи двух явлений и зависи­мости от типа шкал, в которых они измерены

Методы сравнения (X— качественный, Y— количественный)

Рис. 8.2. Классификация методов статистического вывода о различии выборок по уровню выраженности количественного признака

 

 

33. χ2-критерий Пирсона. Оценка значимости отличия от нуля коэффициентов сопряженности φ, Кч и С.

(короче, ответы на вопросы №№33, 34, 35 находятся где-то после страницы 132 у Наследова)


Дата: 2016-10-02, просмотров: 200.