Раздаточный материал для исследований
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой


ИСТОРИЯ ПСИХОЛОГИИ



ОСНОВНЫЕ МЕТОДЫ ПСИХОЛОГИИ

 

Наблюдение Внешнее (наблюдение со стороны) Внутреннее (самонаблюдение) Свободное Включенное Стороннее
Опрос Устный Письменный Свободный Стандартизованный
Тесты Тест-опросник Тест-задание Проективный
Эксперимент Естественный Лабораторный
  Другие методы

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ1

Предыстория тестов уходит в глубину веков. Она связана с испытаниями различных способностей, знаний, умений и навы­ков. Сообщается, что уже в середине III тысячелетия до н. э. в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготов­ленный писец был центральной фигурой месопотамскои циви­лизации благодаря обширным по тем временам знаниям.,,Он был обязан знать все четыре арифметических действия, уметь измерять поля, распределять рационы, делить имущество, владеть искусством пения и игры на музыкальных инструментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях и др. (Дандамаев М. А., 1983).

В Древнем Египте только тот обучался искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кандидат в жрецы проходил собеседование, в процессе которого выяснялись его биографические данные, уровень образо­ванности; кроме того, оценивались внешность, умение вести беседу. Затем следовали проверки умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрач­ных подземелий в полном одиночестве и др. (Аванесов В. С, 1982). Все эти жестокие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому кандидату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм — с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно преодолел знаменитый ученый древности Пифагор. Вернув­шись позже в Грецию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники (цит. по: Голицын Н. Н., 1855, с. 118), Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого дерева можно

1 Цит. с сокр. по кн.: «Общая психодиагностика» Под ред. А. А. Бодалева, В. В. Столина. Изд-во Моск. ун-та, 1987.


выточить Меркурия», и потому, вероятно, придавал большое значение диагностике именно этих способностей. Для этого каждому давалась сравнительно трудная математическая задача. В случае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где ученики, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации харак­теризовалось умением отвечать на выпады, хорошо и достойно держать себя, его принимали в школу (подробнее см., напр.: АванесовВ. С, 1982).

Особенное значение Пифагор придавал смеху и походке молодых людей, утверждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников (там же).

Сообщается (Dubois P., 1970), что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способ­ностей лиц, желавших, занять должности правительственных чиновников.1 Каждые три года чиновники повторно экзаменова­лись лично у императора по шести «искусствам»: музыке, стрельбе из лука, верховой езде, умению писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно способных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на административ­ной службе.

Нередко результаты испытания интеллектуальных способ­ностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать муд­рость иранцев, прислал им шахматы. Предполагалось, что иран­цы вряд ли сумеют разгадать суть этой игры и потому они должны были по условию отослать в Индию подать. Сооб-

' Существует мнение, что подобная практика в Китае сложилась значительно позже (Воскресенский Д. М. Человек в системе государственных экзаменов. История и культура Китая. М., 1974).


щается, однако, что визирь Хосрова Важургмихр понял правила игры и в свою очередь изобрел игру, называемую сейчас нарды. Он послал с новой игрой визиря в Индию, где ее, как выяснилось, разгадать не смогли (Орбели И. А., 1936).

Другим свидетельством использования испытаний тестово­го характера являются материалы, излагающие основы религи­озного учения чань-буддизма. Учителя чань-буддизма использо­вали загадки, вопросы-парадоксы с одновременным созданием ситуации психологического стресса. Отвечать на них необходи­мо было сразу, на раздумывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопросов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды?) создавала драматическое напряжение, которое усилива­лось всем образом действий наставника. Хватая своего оппо­нента и крича на него: «Говори! Говори! Отвечай немедленно!», он создавал ситуацию психического напряжения. Чаньские парадоксальные загадки использовались, по мнению этого же автора, в качестве тестов на определенный «чаньский» ход мышления. В зависимости от того, как тестируемый неофит отвечал на эти загадки, опытный наставник определял, на каком уровне «просветленности» он находился и какие меры нужно принять для углубления его «чаньского опыта», а также выявлял симулянтов, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н. В., 1980).

В созданном чжурчжэнями государстве Цзинь результаты экзаменов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены луч­шие поступали на государственную службу в качестве практи­кующих врачей, преподавателей или исследователей, худшие получали разрешение заниматься частной практикой. Не выдер­жавшим экзамен рекомендовалось либо продолжить подготов­ку, либо сменить профессию (Воробьев М. В., 1983).

Различные конкурсы и экзамены устраивались и в средне­вековом Вьетнамском государстве. Всего за два года в период с 1370 по 1372 г. удалось провести переаттестацию всех военных и гражданских чиновников, что позволило организо­вать проверку государственного аппарата по всей стране. В ре­зультате этого Вьетнам вновь стал сильным и жизнеспособным


феодальным государством; особое внимание было уделено созда­нию боеспособного офицерского корпуса (Берзин Э. О., 1982).

В XV в. конкурсные испытания были упорядочены. Они проводились по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты по­лучали подарки от короля, их имена вносились в «золотой список», который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся высекались на специальных каменных стелах, установленных в Храме Литературы (Берзин Э. О., 1982).

Интересные данные приводятся В.Н. Басиловым о шаман­стве. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманст­ву, но эти претензии отвергались в процессе испытаний. Про­верка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов провер­ка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шаманом, то он по требованию народа должен был, как сообщается, ходить по снегу в трескучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачного претендента считали сумасшедшим. У ульчей шаман подвергал­ся испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В. Н., 1984).

Приведенный здесь краткий исторический экскурс позволя­ет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жизни многих (если не всех) народов мира со времен древнейших цивилизаций и до наших дней. Однако можно ли на основании приведенных данных говорить о глубокой истории и широкой распространенности тестов? Если согласиться с наиболее известными сейчас определениями теста, даваемыми как перевод с английского слова «test» — испытание, проверка, проба, то на поставленный вопрос надо отвечать утвердительно. Дело, однако, в том, можно ли в наше время так определять тест?

В случае с тестами научный анализ дает классический пример видимого совпадения вещей по форме и их действитель­ных различий по существу. Различия начинаются с рассмотре­ния основного понятия. Как отмечал Б. М. Кедров, каждое

in


понятие может быть зафиксировано, во-первых, как сложивше­еся, готовое на данный момент времени, а потом как относитель­но неизменное, постоянное. Во-вторых, научные понятия выра­жают и резюмируют собой на каждом этапе научного развития определенную ступень развития науки. В результате складыва­ются две логические системы: формально-логическая, опериру­ющая относительно неизменными, готовыми понятиями, и диа­лектологическая, оперирующая изменчивыми, развивающимися, текущими понятиями (Кедров Б. М., 1967).

К началу XX в. практические потребности изучения преобла­дающих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта пробле­ма и дала импульс к появлению первых тестов. Ф. Гальтон, известный английский ученый, в течение 1884—1885 гг. провел серию испытаний, в которых посетители лаборатории в возра­сте от 5 до 80 лет могли за небольшую плату проверить свои физические качества (силу, быстроту реакции и др.), ряд физи­ологических возможностей организма и психических свойств по семнадцати показателям. В число последних вошли показа­тели роста, веса, жизненной емкости легких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной программе было обсле­довано 9337 человек. Ф. Гальтон писал, что практика вдумчиво­го и методичного тестирования — не фантазия; она требует рассмотрения и эксперимента (Galton F., 1884).

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Ф. Гальтона можно сравнить с тем, что сделал Г. Галилей для физической науки своими остроумными экспериментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива идеализму, а экспе­римент — как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой, — писал, например, Дж. Кэттелл, — когда она будет иметь своей основой эксперимент и измерения» (Cattell D., 1890).

Дж. Кэттелл, по-видимому, первым увидел в тестах средство измерения, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список

11


50 лабораторных тестов, которые мы бы сейчас назвали не тестами, а контрольными заданиями. Эти задания обладали толь­ко двумя из известных сейчас требований к тестам — имелась инструкция по их применению и подчеркивался лабораторный (т.е. научный) характер испытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допуска­ются зрители во время тестирования; все испытуемые одинаково инструктируются, они должны хорошо усвоить, что и как нужно им делать (Cattell D., 1890).

Надо ли говорить, сколь непривычной казалась идея измере­ния для психологии XIX века. Измерение с помощью тестов казалось тогда, а многим кажется и по сей день, делом если не странным, то претенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматри­вало эти попытки математизации как чуждый для гуманитарной психологии у^клон. Примерно с такими же трудностями сталки­валась и психофизика.

Тем не менее к концу 20-х годов нашего столетия все больше стала ощущаться потребность в создании специфичес­кого направления,связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии — биометрия, в экономике — эконометрия, в науке в целом — наукометрия. К ним следовало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурнич свели к элементарным методам оценки взаимодействий индивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кэттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же противники. В числе сторонников были: в Германии — Г. Мюнстерберг, С. Крепелин, В. Онри, во Фран­ции — А. Бине, в США — Дж. Гилберт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремление к приклад­ным исследованиям в психологии прошлого расценивалось как отход от науки. Дж. Кэттелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуаль­ных различий в 1885 г., но публиковаться не мог из-за противодействия В. Вундта (Cattell D., 1896).


Итак, научный статус тестов не был определен, возмож­ность измерений в психологии подвергалась сомнению. Психо­логия переживала трудный период: она уже не могла развивать­ся на старой основе, но и не научилась еще смотреть на мир по-новому. «Причина кризиса, — писал Л. С. Выготский, — лежит в развитии прикладной психологии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки» (цит. по: Ярошевский М. Г., Гургенидзе Г. С, 1977). Общественная практика требовательно выдвигала одну пробле­му за другой и ни одну из них старая психология решить не могла — у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было случайностью. Ей было дано название психотехника. Прикладное направление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном разви­тии ребенка, в тот период она была в основном прикладной педагогикой. Будучи непринятыми в традиционной науке — в психологии и в педагогике, тесты быстро нашли себе приме­нение в прикладных направлениях.

В общем, произошло так, как говорили в древности: если какой-либо науке не находится место в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий «чистой наукой, созерца­нием истины». Для представителей чистой науки прикладность не имела заметной ценности. За рубежом, например в ЗО-х годах, ученые Кембриджа, как вспоминает Ч. Сноу, больше всего горди­лись тем, что их научная деятельность ни при каких мыслимых обстоятельствах не может иметь практического смысла (Сноу Ч., 1973). Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традицион­ной психологии лежали в области теоретических рассуждений. Различались производительная и познавательная функции этих направлений. То, что имело ценность для психотехники, психоло­гия того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать для психологии.

Размежевание стало заметным в конце 20-х — начале 30-х годов. Вместо объединения усилий обе стороны приступили


к взаимным обвинениям и затяжнымдискуссиям. Психология обвинялась в схоластике, узком академизме, в неспособности воспринять новое и в отрыве от практики жизни. Психотехника в свою очередь осуждалась за узкий практицизм, противореча­щий духу науки, за отрыв от психологии, она обвинялась в голом эмпиризме, прикладности, подражании западным образ­цам, в чрезмерном увлечении тестами. Последние стали узло­вым пунктом критики.

Разрыв между фундаментальным и прикладным направле­ниями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии и, особенно, в педагогике. Даже в исторической науке получили распространение взгляды морализирующих историков, проти­вопоставляющих «чистое и возвышенное познание» различным формам приложения науки, влекущим за собой лишь несчастья и опасности (Шахназаров Г. X., 1981).

Начало 30-х годов характеризуется широким использова­нием тестов во многих странах. Во Франции они стали применяться для дефектологических целей и для профориента­ции, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В СССР тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора — профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в резуль­тате его использования, породили во многих странах, в том числе и в бывшем СССР, письма в правительственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начало 30-х годов характеризуется интенсивным и неконтролируемым использо­ванием тестов в системе народного образования и в промыш­ленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подкреплялись серьезной проверкой качества инструментария. Решения о переводе не­которых учащихся в классы для умственно отсталых детей


принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В промышленно­сти на основе таких же тестов делались попытки классифика­ции работников по различным профессиям без внимательного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извра­щениях в системе наркомпросов» (1936), наложившее запрет на применение бессмысленных (как там отмечалось) тестов и анкет. Это постановление, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А. Смирнова, получило в последующие годы неправомерно расширительное толкование и привело к отказу от разработки научно обоснованных методов психологической диагностики лич­ности (Леонтьев А. Н., Лурия А. Р., Смирнов А. А., 1968).

В те годы были, однако, и другие выступления — в пользу тестов. Так, известный советский психолог М. Я. Басов гово­рил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики... в конце концов, приведет не к ниспровер­жению, не к упразднению этой методики, а напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на применение и существование» (Тесты: теория и практика. М., № 2,1928, с. 54).

Тем не менее, начиная с указанного периода, критика тестов приобрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, «с порога». В США, например, против использования тестов выступали представители основ­ных групп населения США — взрослые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В серии проведенных исследований по социальным последствиям тестирования выяснилось, что 37 % опрошенных возражали против использования тестов при поступлении на работу, 50 % — при продвижении по службе, 25 % — против использования тестов в школе (Brim S., 1965). Случаи наруше­ния этики в использовании тестов оказались столь злободнев­ными, что ими вынужден был заняться конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное использование тестов,


практику вторжения в частную жизнь, как идущую вразрез с моральными нормами (Armor D., 1974). В августе 1966 г. в сенате США обсуждалось предложение о полном запреще­нии тестов, но оно не было поддержано большинством.

В зарубежной литературе выделяется несколько источни­ков критики тестов. Первый источник психолог С. Брим усматривает в личностном портрете критиков, в числе которых чаще других оказываются те, кто не склонен к самопознанию и интроспекции, авторитарен в межличностных отношениях, нетерпим к мнению других и возражает против всяких соци­альных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тес­тов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и поэтому ориентация на этот принцип создает благоприятное отношение к тестам (Brim S., 1965). Третий источник является, по мнению Р. Кэттелла (Cattell R., 1950), следствием эмоционального и сен­тиментального отношения людей эстетического и нарцистичес-кого типа против всякой попытки представить «уникальную, художественную личность» в виде формул и т. п. Четвертый источник критики является научным и касается недостатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возлагавшихся на нее надежд в плане заметного повышения производительности труда. Она и не могла это сделать, потому что на том сравнительно низком уровне промышленного раз­вития прогресс в значительной мере зависел от уровня индус­триализации и автоматизации производства. При достижении необходимого1 уровня развития средств производства челове­ческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличиваться поток прикладных психологических исследований, нацеленных, в частности, на повышение эффективности человека-оператора


в управлении сложными техническими системами. Соответ­ственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной проф­ориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормози­лась, научное изучение действительных возможностей этого метода в СССР не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний и, наоборот, различ­ные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названиях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обоснованным методом эмпирического исследования в психо­логии и в ряде других наук.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследова­ния в таких, например, направлениях психологии, как изучение личности, способностей. Здесь использование тестов позволило преодолеть методологический тупик, в котором оказались авторы многочисленных теорий, концепций, интуитивных дога­док и иных умозрительных построений, не видевших способа обоснования истинности своих суждений. Непосредственное же обращение к практике как к критерию истины дает нередко противоречивые результаты, ибо действительная научная аргу­ментация практикой требует определенного структурирования, опосредования, абстрагирования последней и, кроме того, мето­дической вооруженности исследователя.


Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б. В., 1984;-Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский А. Т., 1985; Практикум по психодиагностике. Дифференциальная психометрика., 1984; Психологические методы исследования личности в клинике, 1978, Шванцара Й. и др., 1978 и др.).

Обоснование качества результатов психологических исследований требует нередко обращения к внепсихологичес-ким понятиям и критериям: философским, логическим, мате-матико-статистическим. В частности, философский элемент в теорию психологических измерений вносит известный тезис о неизбежности погрешности измерений. Критики психологи­ческих тестов нередко апеллируют к этому тезису как к осно­ванию принципиальной порочности тестов в смысле точности измерений. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления этого философского скепсиса является тезис о возможности приближенного измерения с достаточно приемлемой точнос­тью. Применение на практике последнего тезиса позволило получить, например, в физике те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представляющей предмет отдельного рассмотрения, отметим здесь лишь ее связь с понятием «тест». Действительный отход от упрощенного понимания тестов требует наполнения интере­сующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из основ переосмысления сущности теста, а также одну из характеристик его качества. Без упоминания о надежности определение теста не имеет смысла.

С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к опре­делению надежности теста. Это — повторное тестирование, использование параллельных форм одного и того же теста и, наконец, однократное тестирование с последующим разбие­нием матрицы исходных результатов на две или большее число частей. За показатель надежности принимается значение коэф­фициента корреляции.

Значительно позже появились попытки теоретического осмысления этой концепции. Исходным пунктом всех постро-


ений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множествен­ности возможных причин искажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концепции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появ­ление надо рассматривать как реакцию на неприемлемость и искусственность ряда таких условий и ограничений, как, например, параллельность форм одного и того же теста, равенство дисперсий всех высказываний, одинаковая их кор-релируемость друг с другом и др. Д. Армор (Armor D., 1974) использовал известный факт корреляции тестовых высказы­ваний между собой и стал рассматривать ее как аргумент, статистической функцией которого является надежность теста.

Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлече­ния точностью измерения неточно выделенных свойств, соотно­шение между надежностью и валидностью можно образно представить в виде кучной стрельбы, но несколько в стороне от центра мишени, т. е. стрельба из оружия вполне надежного, но прицел стрелок выбрал не совсем точно.

Современный тест — это не только надежный, но и валид­ный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В исто­рическом разрезе концепция валидности, так же как и надежно­сти, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета будто бы годилась для решения поставлен­ных задач. Первые же проявления действительно научной критики развенчали эту, по сути, «веру» в валидность. Они же стимулировали поиск. Привлечение к созданию тестов извест­ных ученых было для научной общественности в начале века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов.


Поскольку в те годы тесты разрабатывались исключитель­но для решения практических проблем, эмпиризм и соответству­ющая-ему методология стали главными для обоснования каче­ства инструментария. Это особенно проявилось в создании тестов для решения кадровых проблем: профотбора, профори­ентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производ­ства или учебного заведения.

С точки зрения истории можно выделить два основных эмпирических подхода к валидизации тестов. Первый назовем прогностическим. Его логика такова. Если те, кто хорошо работают (по критерию Y), показывают высокие результаты по какому-либо тесту (X), значит, здесь есть связь, быть может и причинная. Иначе говоря. Y, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результа­ты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода часто сбыва­ются, но в различной степени. Другой подход к эмпирической валидизации тестов основан на использовании экспертных оценок. Здесь логика еще проще — если эксперты (множество авторитетов) согласованно считают одних более способными, других — менее, значит «это так^. В случае, когда результаты теста указывают на сходную тенденцию, т. е. данные по тесту коррелируют с данными экспертизы, то принимается, что тест валидный и его можно далее применять и в других подобных ситуациях Так проводилась валидизация первого теста для измерения интеллектуальных способностей (Бине А. и Си­мон Т.), а в наше время — некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование соци­альных потребностей молодежи, М., 1978).

Развитие тестов в тесных рамках эмпиризма не могло продолжаться сколь-нибудь долгое время. Обращение к внеэм-пирическим критериям истинности было неизбежным. Отсюда последовали такие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традиционной психологии область научных кон­структов, ключевых психологических понятий. Именно понятия и конструкты стали основным предметом многих исследований с помощью тестов. Последние призваны уточнить эмпири-

20


ческий состав индикаторов (высказываний), соответствующих таким конструктам-понятиям, как личность, темперамент, интел­лект, экстраверт и многих других. В современной психологии они стали предметом эмпирического исследования, и делается это с целью фундаментального обоснования практической зна­чимости теоретических суждений.

Теперь пора ответить на последний вопрос — что же такое современный, психологический тест? Это теоретически и эмпи­рически обоснованная система высказываний (заданий), позво­ляющая получить измерения соответствующих психологических свойств. Теоретическое обоснование предполагает всесторон­ний анализ теста и результатов его применения в свете известных достижений современной психологической науки. Эмпирическое же обоснование связано с обращением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозити­вистским принципом верификации. Этому способствует нали­чие в обоих случаях требования эмпирического согласования теоретических концепций (конструктов). Но, как справедливо отмечал Э.М. Чудинов, наука до и независимо от неопозитивиз­ма руководствовалась требованием принципиальной проверяе­мости своих теорий. Это всегда отличало науку от религии и натурфилософских построений, обеспечивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань, чер­точку научного познания, обратив ее против философии и про­тив самой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непо­мерные ограничения и несовместим с ней (Чудинов Э. М., 1977).

Отмеченными выше критериями надежности и валидности проблема обоснования научности тестов не закрывается. Из используемых сейчас двух критериев первый назовем общенаучным, а второй — специально научным. Их широкое применение всего лишь дань сложившейся в теории тестов традиции. В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, обоснованность, необходи­мость, системность, рациональность и др. Ключевым критери­ем — принципом является истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности знания, указывающего на степень его


соотнесенности к познаваемому. Но все это — область специ­ального исследования, которое еще предстоит провести в про­цессе дальнейшего развития теории и практики применения психологических тестов.

















Дата: 2018-12-21, просмотров: 261.