Психометрические характеристики теста

 

Тесты – стандартизированные методики психодиагностики, позволяющие получить сопоставимые количественные и качественные показатели степени развитости изучаемых свойств.

Классификация разновидностей тестов приведена в табл. 2

 

Таблица 2. Классификация тестов

Признак группы Название вида теста Краткая характеристика вида теста
По предмету тестирования (какое качество оценивается) интеллектуальные Предназначены д/оценки уровня развития мышления (интеллекта) человека и отдельных когнитивных процессов – восприятие, внимание, воображение, память, речь.
Личностные Связаны с псидиагностикой устойчивых инд. особенностей чел., определяющих его поступки – темперамент, характер, мотивации, эмоции, способности.  
Межличностные Оценивают чел. отношения в различных социальных группах  
По особенностям используемых задач Практические тестовые задания Задачи и упражнения, кот. испытуемый должен выполнить, практически манипулируя реальными предметами или их заменителями.
Образные задания Упражнения с образами, картинками, рисунками, схемами, представлениями, предполагают активное использование воображения.  
Вербальные тесты Задания на оперирование словами.определение понятий, умозаключений, сравнение объема и содержания разл. слов, и т. п.  
По характеру тестового материала, предъявляемого испытуемым Бланковые Используется тестовый материал в виде бланков: рисунков, схем, таблиц, опросников и т. п.
Аппаратурные С применением различной аппаратуры для предъявления и обработки результатов тестирования – аудио- и ТV техника, ЭВМ.  
По объекту оценки Процессуальные Исследуют какой-либо психологический или поведенческий процесс, напр. процесс запоминания, процесс межличностного взаимодействия в группе.
Тесты достижений Оцениваются успехи человека в различных видах деятельности, или сферах познания – продуктивность памяти, логичность мышления, устойчивость внимания и др.  
Тесты состояний и свойств Диагностика более-менее стабильных психологических качеств человека – черты личности, свойства темперамента, способности и др.  
Особая группа Проективные тесты Основаны на косвенной оценке психологических качеств человека. Оценка – результат анализа восприятия и интерпретации человеком некоторых многознвчных объектов, напр. бесформенных пятен, незавершенных предложений и т. д.

 

Требования, предъявляемые к тестам.

К тестам, как методам точной психодиагностики предъявляется ряд особых требований. Это:

Социокультурная адаптированность теста – соответствие тестовых заданий и оценок особенностям культуры, сложившимся в обществе, где данный тест используется, будучи заимствованным в другой стране.

Простота формулировок и однозначность тестовых заданий – в словесных и иных заданиях теста не должно быть таких моментов, которые могут по-разному восприниматься и пониматься людьми.

Ограниченное время выполнения тестовых заданий – полное время выполнения заданий психодиагностического теста не должно превышать 1,5-2 часов, т. к. сверх этого времени человекцу трудно сохранить свою работоспособность на достаточно высоком уровне.

Наличие тестовых норм для данного теста –репрезентативные средние показатели по данному тесту, - т. е. показатели, представляющие большую совокупность людей, с которыми можно сравнивать показатели данного индивида, оценивая уровень его психологического развития.

Норма теста – средний уровень развития большой совокупности людей, похожих на данного испытуемого по ряду социально – демографических характеристик.

Правила проведения тестирования, обработки и интерпретации результатов.

В этом вопросе существуют определенные строгие правила.

Наиболее важные из них:

Прежде, чем применять тест, психологу необходимо попробовать его на себе или другом человеке, что позволит избежать возможных ошибок из-за недостаточного знания его нюансов.

Важно заранее позаботиться о том, чтобы до начала работы испытуемые хорошо поняли задания и инструкцию к тесту.

Во время тестирования все испытуемые должны работать самостоятельно, не оказывая влияния друг на друга.

Для каждого теста должна быть обоснованная и выверенная процедура обработки и интерпретации результатов. Это позволяет избежать ошибок, возникающих на этом этапе тестирования.

 

Надежность

 

Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности - надёжность как устойчивость и надёжность как внутреннюю согласованность.

Устойчивость результатов теста или ретестовая надежность – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста). В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,7. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тастирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным возможно исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. Получается, что испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако, имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Внутренняя согласованность определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.

Для проверки внутренней согласованности применяются:

1. Метод расщепления или метод автономных частей

2. Метод эквивалентных бланков

3. Альфа Кронбаха

Метод расщепления

Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.

Метод эквивалентных бланков

МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.

Альфа Кронбаха

В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

α Кронбаха определяется как

 

,

 

где N - число элементов в шкале, - дисперсия общего тестового балла, и - дисперсия элемента i.

Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.

Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.

 

Валидность

 

Валидность — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.

Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.

Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).

Виды валидности:

Внешняя валидность — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов.

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Операциональная валидность — частный случай внутренней валидности, степень соответствия методики и плана эксперимента проверяемой гипотезе.

Операциональная валидность определяет степень соответствия используемой экспериментальной методики (экспериментальных утверждений) теоретическим положениям, которые положены в основу организации и проведения данного эксперимента.

Частью операциональной валидности можно считать конструктную валидность.

Констру́ктная вали́дность (концептуальная, понятийная валидность) — частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории.

Конструктная валидность имеет отношение к попыткам обозначения любых аспектов эксперимента. Опасности нарушения конструктной валидности заключаются в неправильном обозначении причины и эффекта с помощью абстрактных терминов, терминов, взятых из обыденного языка или формальной теории.

Внутренняя валидность — вид валидности, степень влияния независимой переменной на зависимую переменную. При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором.

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Экологическая валидность — степень соответствия условий эксперимента исследуемой реальности. Например, в известном эксперименте Курта Левина по изучению типов лидерства отношения в группах подростков мало соответствовали отношениям в государстве, следовательно, была нарушена экологическая валидность.

 


10. Теоретические вопросы психодиагностики Интеллекта

 

Оценка психофизиологического потенциала личности имеет не только научное, но и важнейшее практическое значение. При этом особое значение в такого рода исследованиях приобретают интеллектуальные аспекты, уровень развития таких качеств как внимание, память, логическое мышление. С точки зрения практического психолога очень важно, что существуют методики оценки интеллектуального потенциала, которые базируются на разных методологических основах, позволяя осуществить возможно более полный охват способностей личности при этом сведя к минимуму или даже полностью исключив социокультурный аспект (то есть зависимость успешности прохождения исследования от условий национальных и социальных групп, в которых воспитывается и осуществляет трудовую деятельность объект психодиагностического исследования). Выбор конкретной психодиагностической методики зависит от тех целей, которые ставит перед собой психолог-диагност. С достаточной степенью условности можно выделить три группы задач, успешное решение которых требует применения психодиагностических методик исследования интеллектуальной сферы личности:

Определение целеполагающей деятельности. Это направление психодиагностики интеллекта тесно связано с первым. Индивидуальный интеллектуальный потенциал личности необходимо учитывать для правильной постановки задач (как оперативных, связанных с выполнением конкретной профессиональной деятельности так и стратегических, таких как приобретение определённого социального статуса, достижение жизненного успеха и ещё более глобальных целей определяемых общим понятием «смысл жизни»).

 Не существует какой-либо «идеальной» методики, применение которой давало бы ответы на все вопросы и позволяло решить все задачи, стоящие перед психодиагностикой интеллекта в целом или хотя бы отдельных его составляющих. Тем не менее, имеющиеся методики могут быть широко использованы для решение самого широкого круга практических задач, с их помощью психолог может не только осуществлять диагностику, но и определять пути коррекции интеллектуальной структуры личности, разрабатывать методы купирования неблагоприятных психофизиологических особенностей, то есть оказывать личности практическую помощь, в чём, собственно, и состоит задача практического психолога.


Модели Интеллекта

 

Память - сохранение того, что было познано. Два вида продуктивного мышления порождают новую информацию из уже известной и сохранившейся в памяти информации. При операциях дивергентного мышления мы мыслим в различных направлениях, иногда исследуя, иногда отыскивая различие. В процессе конвергентного мышления информация приводит нас к одному правильному ответу или к узнаванию лучшего или обычного ответа. При оценке мы стремимся решить, каково качество, правильность, соответствие или адекватность того, что мы знаем, помним и создаем с помощью продуктивного мышления.

Второй способ классификации интеллектуальных факторов соответствует виду материала или включенного в него содержания. До сих пор известно три вида материала или содержания: содержание может быть представлено в виде изображений, символов или быть семантическим содержанием. Изображения являются таким конкретным материалом, который воспринимается с помощью органов чувств. В нем нет ничего, помимо него самого. Воспринимаемый материал имеет такие свойства, как величина, форма, цвет, место, плотность. То, что мы слышим или чувствуем, представляет собой примеры различных видов образного, конкретного материала. Символическое содержание состоит из букв, цифр и других условных знаков, обычно объединенных в общие системы, такие, как алфавит или числовые системы. Семантическое содержание выступает в форме значений слов или мыслей, оно не нуждается в примерах.

Когда к определенному содержанию применяется та или иная операция, получается не менее шести видов конечного мыслительного продукта. Достаточно доказательно можно утверждать, что, несмотря на комбинацию операций и содержаний, обнаружена связь тех же шести видов конечного мыслительного продукта. Эти виды следующие: элементы, классы, отношения, системы, преобразования, предвидения. Это лишь основные известные нам виды мыслительного продукта, выявленные факторным анализом. В качестве таковых они могут быть основными классами, которым соответствуют психологически все виды информации.

Эти три вида классификации факторов интеллекта можно представить в виде модели куба, приведенного на рис. I.

На этой модели, каждое измерение представляет собой один из способов измерения факторов. В одном измерении расположены различные виды операций, в другом - разные виды конечного мыслительного продукта, в третьем - разные виды содержания. В измерении, относящемся к содержанию, добавлена четвертая категория, обозначенная как "поведенческая", что сделано исходя из чисто теоретических соображений- представить общую способность, иногда обозначаемую как "социальный интеллект".


 

Каждая клетка этой модели обозначает вид способности, который может быть описан в терминах операции, содержания и продукта, и для каждой клетки в месте ее пересечения с другими имеется единственное сочетание видов операции, содержания и продукта. Тест для определения той или иной мыслительной способности должен давать те же самые три характеристики. При нашем рассмотрении модели мы возьмем сразу весь вертикальный ряд, начав с передней стороны. Передняя плоскость дает нам матрицу из 18 клеток (если мы исключим ряд, связанный со способностями понимания поведения, для которого пока не найдено факторов). Каждая из этих 18 клеток должна содержать познавательную способность.

 


Дата: 2019-07-31, просмотров: 41.