Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании.
В психометрике термин надежность имеет два значения. На одном из них — на- дежности по внутренней согласованности — мы не будем останавливаться под- робно, отсылая читателя к соответствующим справочникам и руководствам1, от- метив только, что требование к внутренней согласованности теста не случайно. Вполне естественно считать, что если некоторая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют нечто другое. Для того чтобы быть валидным, тест должен быть согласованным. Суще- ствует несколько способов определения надежности.
Надежност ь ретестовая — предполагает повторное предъявление того же само- го теста тем же испытуемым и примерно в тех же условиях, что первоначальное, а затем установление корреляции между двумя рядами данных. При использовании этого способа определения надежности нужно отдавать себе отчет в том, что испыту- емые могут запомнить свои ответы и воспроизвести их во второй раз, поэтому по- вторное тестирование должно быть отделено от первого более-менее значительным временным интервалом, обычно не менее месяца. Некоторые психологи настаи- вают на интервале между тестированиями не менее 6 месяцев (Клайн, 1994).
Мы не считаем требование П. Клайна об обязательном 6 месячном интервале между тестированиями безусловным. В подтверждение сошлемся на результаты исследования канадских психологов. С помощью личностного опросника были обследованы 302 студента с интервалом в 3 недели. Условия повторного тестиро- вания варьировались. Стандартный коэффициент ретестовой надежности, равный
0,872, не отличался от коэффициентов надежности, полученных в трех группах испытуемых, получавших одну из трех специфических инструкций: 1) продумы- вать ответы; 2) использовать воспоминания о прошлых ответах; 3) выполнять параллельную форму теста. Было обнаружено, что стандартный коэффициент надежности выше коэффициента, полученного при инструкции воспроизводить прошлые ответы.
Наименьшим удовлетворительным значением для ретестовой надежности яв- ляется коэффициент корреляции, равный 0,7. Правда, для некоторых тестов этот показатель может быть несколько ниже.
|
по конструированию тестов» (Киев, 1994), пока, к сожалению, единственная на русском языке дос- таточно подробная работа по конструированию тестов, может удовлетворить интерес читателя к этой проблеме.
16 2 Глава 3. Психометрические основы психодиагностики: основные этапы...
Надежност ь параллельных форм предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами. Основная пробле- ма, препятствующая широкому распространению этого способа определения на- дежности, — необходимость подготовки двух наборов заданий, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности.
Надежност ь частей теста определяется путем деления опросника на две час- ти (обычно на четные и нечетные задания), после чего и рассчитывается корреля- ция между этими частями. Обычно к этому способу определения надежности ре- комендуется прибегать только в тех случаях, когда необходимо быстро получить результаты.
Для определения ретестовой надежности и надежности параллельных форм корреляции подсчитывается на основе коэффициента произведения моментов Пирсона. Эта процедура подсчета рассматривалась нами ранее, в разделе, посвя- щенном анализу заданий. Для определения надежности частей теста ранее рассчи- танный коэффициент произведения моментов Пирсона (между двумя полови- нами теста) используется в формуле Спирмена—Брауна. Формула Спирмена— Брауна имеет вид:
|
|
Например, если коэффициент корреляции произведения моментов Пирсона между двумя половинами теста равен 0,80, то:
Подчеркнем, что наилучшей процедурой определения надежности является проведение повторных исследований через более или менее значительные времен- ные интервалы.
Все исследования надежности должны выполняться на достаточно больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надеж- ность — важная характеристика теста, но сама по себе ценности не представляет. Она необходима для достижения валидности.
Факторны й анализ
Во многих случаях перед разработчиком теста встает задача «сжатия» информа- ции или, иначе говоря, компактного описания изучаемых явлений при наличии множества наблюдений или переменных. Факторный анализ как раз и является методом снижения размерности изучаемого многомерного явления.
Напомним читателю, что факторный анализ зародился в психологической на- уке и связан в первую очередь с исследованиями Ч. Спирмена (Spearman, 1904). Последующими работами таких выдающихся психологов, как Т. Келли, Л. Тер-
3.7. Факторный анализ 163
стоуна, Дж. Гилфорда и Р. Кэттелла, а также математиков К. Пирсона, К. Холзин- гера, Г. Хармана и др., был достигнут значительный успех в математическом обо- сновании факторного анализа, и этот метод начинает активно применяться в раз- личных науках.
Как хорошо известно, одной из типичных форм представления эксперимен- тальных данных является матрица, столбцы которой соответствуют, например, различным тестам (заданиям тестов), а строки — отдельным результатам (значе- ниям), полученным в результате их применения. Визуальный анализ сколь-ни- будь значительной по величине матрицы невозможен, а поэтому требуется исход- ную информацию сжать, извлечь из нее наиболее важное, существенное. Прежде всего исследователю необходимо получить корреляционную матрицу (подсчет ко- эффициентов корреляции).
Воспользуемся в качестве примера исследованием Л. Айкена (Aiken, 1996). В этом исследовании 90 студентов колледжа просили оценить преподавателя с по- мощью пятибалльной шкалы (1 — низший балл, 5 — высший) по 11 параметрам: тактичность, вежливость, креативность, доброжелательность, увлеченность сво- им предметом, знание предмета, способность мотивировать студентов, организо- ванность, терпеливость, подготовленность и пунктуальность.
Если поделить матрицу корреляций рейтинговых оценок, данных студентами по списку качеств личности преподавателя (табл. 3.4) на два равных треугольни- ка, проведя диагональ из левого верхнего угла в правый нижний угол, то можно увидеть, что это — симметричная матрица, в которой первая верхняя строка со- стоит из тех же оценок, что и первая колонка. Аналогично вторая строка включает те же самые элементы, что и вторая колонка, и т. д. Также нужно обратить внима- ние на то, что все числа на основной диагонали (начиная сверху слева вплоть до чисел внизу справа) равны +1,00 — это предполагаемая корреляция каждого за- дания шкалы с самим собой.
В психологическом тестировании цель факторного анализа заключается в том, чтобы найти несколько фундаментальных факторов, которые объясняли бы боль- шую часть дисперсии в группе оценок по различным тестам или другим психомет- рическим измерениям. В вышерассмотренном примере — 11 переменных, поэто- му для него задача факторного анализа заключается в том, чтобы найти матрицу факторных нагрузок или корреляции между факторами и заданиями шкалы. Су- ществует несколько процедур факторного анализа, но все они предполагают две стадии: 1) факторизацию матрицы корреляций, с тем чтобы получилась первона- чальная факторная матрица; 2) вращение факторной матрицы, с тем чтобы обна- ружить наиболее простую конфигурацию факторных нагрузок (см. табл. 3.4).
Стадия факторизации в этом процессе призвана определить количество фак- торов, необходимых для объяснения связей между различными тестами, и обес- печивает получение первичных оценок нагрузки (веса) каждого теста по каждо- му фактору. Вращение факторов необходимо для того, чтобы сделать их более по- нятными (интерпретируемыми) с помощью создания конфигурации факторов, в которой совсем немного тестов имеют высокие нагрузки, тогда как большая часть тестов имеют низкие нагрузки по любому фактору.
164 Глава 3. Психометрические основы психодиагностики: основные этапы...
Таблица 3.4
Образе ц матрицы корреляций между 11 заданиями шкалы
для оценки личности преподавателя
Задани е
1
2
3
4
5
6
7
8
9
10
11
i
1,000
0,727
0,424
0,573
0,343
0,294
0,458
0,200
0,425
0,091
00,78
2
0,727
1,000
0,304
0,620
0,287
0,258
0,363
0,075
0,459
0,115
0,127
3
0,424
0,304
1,000
0,470
0,510
0,080
0,691
0,206
0,304
0,129
0,112
4
0,573
0,620
0,470
1,000
0,336
0,195
0,390
0,061
0,528
0,026
0,022
5
0,343
0,287
0,510
0,336
1,000
0,171
0,638
0,374
0,203
0,243
0,244
6
0,294
0,258
0,080
0,195
0,171
1,000
0,108
0,227
0,159
0,490
0,430
7
0,458
0,363
0,691
0,390
0,638
0,108
1,000
0,218
0,314
0,108
0,065
8
0,200
0,075
0,206
0,061
0,374
0,227
0,218
1,000
0,085
0,524
0,421
9
0,425
0,459
0,304
0,528
0,203
0,159
0,314
00,85
1,000
0,114
0,187
1 0
0,091
0,115
0,129
0,026
0,243
0,490
0,108
0,524
0,114
1,000
0,611
1 1
0,078
0,127
0,112
0,022
0,244
0,430
0,065
0,421
0,187
0,611
1,000
Одна из наиболее известных процедур факторизации — метод главных осей
(principa l axis), а самая популярная процедура вращения — варимакс вращение 1 .
Из табл. 3.5 видно, что выделяются три фактора, они представлены в колон- ках, обозначенных А, В, С. Величины, записанные под колонкой каждого факто- ра, — корреляции или нагрузки каждого из 11 заданий по этому фактору.
Например, задание 1 имеет нагрузку по фактору A равную 0,754; - 0,271 по фак- тору В; и 0,250 по фактору С. Сумма квадратов нагрузок по каждому из факторов позволяет определить долю дисперсии этого задания. Таким образом, доля дис- персии задания 1 равна:
(0.754)2 +(-0,271)2 +(0,250)2 =0,704.
Это означает, что 70,4 % вариаций показателей по заданию 1 объясняется дей- ствием этих трех факторов.
Факторно-аналитический подход позволяет также оценить надежность теста. Как известно, полная дисперсия теста равна сумме дисперсий для общих факто- ров, плюс дисперсии специфических факторов, плюс дисперсия погрешности. Следовательно, если мы осуществим факторный анализ теста, возведем в квадрат и суммируем нагрузки его факторов, то мы получим его надежность, поскольку нагрузки факторов представляют корреляцию теста с общими или специфиче- скими факторами. Однако следует помнить, что такой способ установления на- дежности более всего подходит для уже факторизованного теста, нежели для тес- тов, которые могут измерять широкий набор разных факторов, часть которых мо- гут и не входить в батарею изучаемых исследователем.
По вполне понятным причинам здесь опущены этапы ручной факторизации матрицы, поскольку в настоящее время для этой цели используются различные компьютерные программы. Для читателя, желающего ознакомиться подробно с процедурой факторизации матрицы и ее вращением, рекомен- дуем обратиться к книге: Окунь Я. Факторный анализ / Пер. с польск.; Под ред. Г. 3. Давидовича. — М.: Статистика, 1974.
3.7. Факторный анализ 16 5
Таблица3.5
Дата: 2018-12-21, просмотров: 272.