Для оценки различий между двумя выборками

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

Использование критерия χ² для оценки соответствия экспериментальных распределений теоретическим (нормальному или равномерному) подробно обсуждалось в разделе 6. Тот же критерий может использоваться и для сравнения двух эмпирических распределений на предмет достоверности различий между ними.

В качестве примера рассмотрим следующую задачу:

Условие задачи

В опытах с участием 100 испытуемых (50 мужчин и 50 женщин) регистрировалось время простой сенсомоторной реакции (ВСМР) в ответ на звуковой стимул. Получены следующие результаты (табл. 7.3):

Таблица 7.3

ВСМР в секундах
Классовый Интервал	0,10 ¸ 0,12	0,12 ¸ 0,14	0,14 ¸ 0,16	0,16 ¸ 0,18	0,18 ¸0,20	0,20 ¸0,22	0,22 ¸0,24
Частоты встречаемости ВСМР
Мужчины	2	15	26	5	2	0	0
Женщины	0	12	20	8	7	2	1

Задание

Пользуясь критерием χ² Пирсона, определить, достоверны ли различия распределений ВСМР у мужчин и женщин.

Решение

1. Строим рабочую таблицу для предварительных расчетов (табл. 7.4):

Таблица 7.4

Обозна-чение интер-вала	Классовый интервал в секундах	Эмпирические частоты (мужчины)	Эмпирические частоты (женщины)	Сумма эмпирических частот	Теоретиче-ские частоты
1	2	3	4	5	6
A В C D E F G	0,10 ÷ 0,12 0,12 ÷ 0,14 0,14 ÷ 0,16 0,16 ÷ 0,18 0,18 ÷ 0,20 0,20 ÷ 0,22 0,22 ÷ 0,24	2 15 26 5 2 0 0	0 12 20 8 7 2 1	2 27 46 13 9 2 1	1 13,5 23 6,5 4,5 1 0,5
Сумма		50	50	100

Столбец 1 служит исключительно для экономии: в дальнейшем мы не будем указывать границы классовых интервалов – нам будет достаточно того, что распределение включает в себя 7 количественных градаций (классов). В столбцах 2, 3 и 4 отражены данные из условия задачи. Столбец 5 служит для дальнейших вычислений.

Теоретические частоты (столбец 6) в данном случае вычисляются следующим образом:

1) в случае равноценных выборок теоретическая частота в каждом классе вычисляется как среднее арифметическое двух эмпирических частот;

2) если объемы выборок различны, то теоретическая частота вычисляется как сумма эмпирических частот в данной строке, умноженная на сумму в каждом столбце (по вертикали) и отнесенная к общей сумме частот.

Для дальнейших вычислений вносим данные в табл. 7.5:

Таблица 7.5

	Мужчины			Женщины
Интервал	f_эксп	. f_теор.		f_эксп	. f_теор.
1	2	3	4	5	6	7
A В C D E F G	2 15 26 5 2 0 0	1 13,5 23 6,5 4,5 1 0,5	1,00 0,17 0,39 0,35 1,39 1,00 0,50	0 12 20 8 7 2 1	1 13,5 23 6,5 4,5 1 0,5	1,00 0,17 0,39 0,35 1,39 1,00 0,50

Можно видеть, что это – типичная таблица для вычисления критерия χ² (см. раздел 6). Значения в столбцах 3 и 6 для мужчин и женщин одинаковы; это естественно, так как теоретические частоты соответствуют средним значениям экспериментальных частот в каждой выборке. Тем не менее χ²следует рассчитывать, суммируя все значения в столбцах 4 и 6 (т. е. по обеим выборкам).

В итоге получаем χ²= 9,6. В табл. VI Приложений для уровня значимости 0,95 и ν = N – 1 = 6 находим значение χ²_кр., равное12,6.

Вывод

Различия между распределениями не являются статистически достоверными.

Для решения задачи можно использовать критерий Колмогорова в несколько иной модификации, нежели при сравнении экспериментального распределения с теоретическим. Для этого оформляем рабочую таблицу следующего вида (табл. 7.6):

Таблица 7.6

	Экспериментальные частоты		Накопленные экспериментальные частоты		Относительные накопленные частоты		d
Интервал	f_м	f_ж	F_м	F_ж	F*_м	F*_ж	d
1	2	3	4	5	6	7	8
A В C D E F G	2 15 26 5 2 0 0	0 12 20 8 7 2 1	2 17 43 48 50 50 50	0 12 32 40 47 49 50	0,04 0,34 0,86 0,96 1,00 1,00 1,00	0 0,24 0,64 0,80 0,94 0,98 1,00	0,04 0,10 0,22 0,16 0,06 0,02 0

Рекомендуется следующий порядок вычислений:

1. В столбце 1 – условные обозначения временных интервалов; в столбцах 2 и 3 – экспериментальные частоты мужчин (2) и женщин (3).

2. В столбцах 4 и 5 – накопленные частоты для мужчин (4) и женщин (5). Напомним, что накопленные частоты вычисляются путем простого суммирования частот от первого до последнего класса.

3. В столбцах 6 и 7 – относительные накопленные частоты (F* = F/n). Другими словами, каждая накопленная частота в столбцах 4 и 5 делится на 50.

4. Вычисляем критерий λ по формуле Колмогорова в следующей модификации:

(7.9)

В нашем случае:

Вывод

Распределения отличаются друг от друга с вероятностью 0,822 (см. Приложения, табл. VII). Другими словами, соответствие между распределениями можно констатировать лишь с вероятностью 0,178.

Чем можно объяснить причины несоответствия результатов, полученных с помощью критериев χ² и λ? По-видимому, критерий Колмогорова, основанный на накоплении эмпирических частот, является более чувствительным к различиям и позволяет зафиксировать те тонкие нюансы, которые недоступны критерию Пирсона. Таким образом, в целом, можно усомниться в том, что различий вообще не существует. Кстати говоря, более мощные критерии (Стьюдента и Фишера), которые также можно применить к решению данной задачи, дают достоверные различия между двумя выборками на уровне значимости 0,95.

В заключение следует констатировать, что оценка различий между двумя распределениями по вышеупомянутым критериям может быть использована лишь в случае отсутствия достаточной информации о каждом конкретном значении переменной в выборках.

Задачи по теме

Задача 7. 1

40 студентов (20 юношей и 20 девушек) обследованы на уровень нейротизма – эмоциональной стабильности по тесту Айзенка. Получены следующие результаты:

№	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	10	20
Юноши	10	12	5	9	6	7	11	8	7	4	9	12	14	8	6	7	11	9	10	8
Девушки	5	9	9	13	8	8	10	7	13	11	10	11	10	13	8	10	9	16	13	11

Задание

Определить достоверность различий по уровню нейротизма у юношей и девушек, выбрав один или несколько критериев, адекватных условию задачи.

Задача 7. 2

Условие задачи

В психофизиологическом эксперименте 29 юношей и 27 девушек были протестированы методике РДО (реакция на движущийся объект). В числе показателей использовался следующий критерий: величина средней ошибки S остановки движущейся точки на линии. Получены следующие значения S (в миллисекундах) для двух групп испытуемых:

Юноши						Девушки
№№	S	№№	S	№№	S	№№	S	№№	S	№№	S
1 2 3 4 5 6 7 8 9 10	37 31 32 26 37 24 18 46 59 19	11 12 13 14 15 16 17 18 19 20	41 44 26 29 40 40 30 39 32 21	21 22 23 24 25 26 27 28 29	32 24 32 24 23 33 29 38 24	1 2 3 4 5 6 7 8 9 10	87 41 17 46 59 17 33 23 30 40	11 12 13 14 15 16 17 18 19 20	41 21 37 27 37 44 38 41 22 40	21 22 23 24 25 26 27	24 21 21 51 52 23 52

Задание

Определить достоверность различий между показателями РДО для юношей и девушек, выбрав адекватный критерий обработки результатов.

Задача 7.3

Условие задачи

Первоклассники одной из средних школ (12 мальчиков и 10 девочек) были протестированы по детскому тесту Д. Векслера на уровень интеллекта. Результаты тестирования (индивидуальные значения IQ) представлены в таблице.

Испытуемый	пол	IQ	Испытуемый	Пол	IQ
1 2 3 4 5 6 7 8 9 10 11	м м м м м м м м м м м	85 78 138 86 79 105 95 94 100 134 87	12 13 14 15 16 17 18 19 20 21 22	м д д д д д д д д д д	91 115 112 98 93 97 101 117 102 92 111

Задание. Проанализировать полученные результаты на предмет половых различий в уровне интеллекта детей.

Задача 7.4

Условие задачи

С помощью цветового теста отношений (ЦТО) были исследованы семейные отношения у мужчин-невротиков (38 человек). Оказалось, что 74% мужчин ассоциируют свою жену с одним из светлых цветов и лишь 26% - с темным. Себя ассоциируют со светлыми цветами лишь 31% мужчин, остальные 68% - с темными.

Вопрос

Можно ли на основании приведенных выше данных утверждать, что в восприятии семьи мужчинами-невротиками наблюдается выраженная асимметрия: качества активного, доминантного, «светлого» начала больные приписывают жене, а себе оставляют пассивную, страдательную роль?

Задача 7.5

Американский исследователь Стеннет изучал связь между полом и количеством пропусков детского сада. Он получил следующие данные: более 20 дней в году пропустили 29% мальчиков и 27% девочек. Всего в его исследовании приняли участие 873 мальчика и 837 девочек.

Вопрос

Можно ли считать, что мальчики пропускают детский сад чаще девочек?

З а д а ч а 7. 6

В двух студенческих выборках (n₁ = 27, n₂ = 23) исследовался коэффициент интеллекта (IQ). Получены следующие результаты:

Группа1				Группа 2
№№	IQ	№№	IQ	№№	IQ	№№	IQ
1 2 3 4 5 6 7 8 9 10 11 12 13 14	119 86 100 93 108 117 82 100 86 129 104 88 113 89	15 16 17 18 19 20 21 22 23 24 25 26 27	103 107 78 110 98 84 111 98 84 102 92 88 104	1 2 3 4 5 6 7 8 9 10 11 12	110 98 84 102 114 85 101 110 95 89 105 92	13 14 15 16 17 18 19 20 21 22 23	107 101 87 97 91 83 113 70 108 88 103

Задание

Определить, достоверны ли различия распределений IQ в двух студенческих группах.

Задача 7.7

Условие задачи. С помощью цветового теста отношений протестированы 38 человек с депрессивными симптомами и 50 человек без каких-либо выраженных психиатрических симптомов. Оказалось, что свое настроение ассоциируют с яркими цветами (красный, желтый, зеленый) 40% здоровых и 5% депрессивных испытуемых. Свое прошлое ассоциируют с аналогичными цветами 14% больных против 22% здоровых.

Задание

Определить достоверность различий между данными группами испытуемых.

РАЗДЕЛ 8. МЕРЫ СВЯЗИ

Постановка проблемы

Многие психологические черты, свойства, признаки не являются независимыми, а определенным образом взаимосвязаны между собой. Поэтому психологу часто приходится иметь дело с выявлением наличия и характера связи между этими признаками, свойствами, чертами. Это позволяет в известной степени минимизировать число изучаемых признаков, объединяя их в более крупные конгломераты, особенно в тех случаях, когда число таких признаков достаточно велико.

В математическом смысле задача состоит в нахождении связи между двумя рядами переменных (x_i и y_i), измеренных на одной и той же выборке испытуемых. О наличии связи (корреляции) между этими переменными можно говорить в тех случаях, когда изменение величины х ведет к закономерному изменению величины у, и если характер изменений является предсказуемым.

Представление данных

Данные о связи двух переменных могут быть представлены либо графически (в виде диаграмм рассеивания), либо путем вычисления коэффициентов корреляции по соответствующим формулам.

В графическом изображении каждый испытуемый может быть представлен точкой в координатах у = f (х), причем величины х_i и у_i соответствуют значениям двух исследуемых признаков. Выборка испытуемых в этих координатах представляет собой «облако рассеивания» точек, которое может иметь различную форму ( рис. 8.1).

Рис. 8.1. Графическое представление связи между переменными (облако рассеивания точек имеет различную форму в зависимости от характера связи), объяснение в тексте

При наличии прямой (положительной) связи между переменными облако рассеивания имеет более или менее уплощенную эллиптическую форму, длинная ось которого направлена вправо и вверх. Другими словами, при возрастании значения одной переменной имеется тенденция к увеличению другой переменной.

В случае отрицательной связи между переменными длинная ось облака рассеивания направлена вправо вниз, т. е., увеличение значений одной переменной соответствует закономерному снижению значений другой.

Наконец, если облако рассеивания имеет округлую форму, то можно предположить, что корреляция между переменными отсутствует или, по крайней мере, она весьма незначительна.

В психологии используется несколько различных мер связи (коэффициентов корреляции), выбор которых определяется в первую очередь типом шкалы, который формирует исследуемая переменная величина. Чаще всего коэффициенты корреляции представляют собой величины, стандартизованные таким образом, что они могут принимать значения от –1 (строгая обратная связь) до +1 (строгая прямая связь). Вычисление коэффициента корреляции предполагает также определение его статистической значимости (достоверности) по соответствующим формулам или таблицам. Достоверность коэффициента корреляции может быть определена для определенного уровня значимости (0,95, 0,99 и т. д.).

Дата: 2018-11-18, просмотров: 879.

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒