Измерения в психолого-педагогическом исследовании
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Понятие диагностической шкалы. В результатах педагогической диагностики тесно взаимосвязаны качественные и количествен­ные характеристики. Качество — это совокупность свойств, ука­зывающих на то, что представляет собой предмет, чем он являет­ся. Качеством называется также существенная определенность пред­мета, явления или процесса, в силу которой они являются дан­ным предметом, явлением или процессом. Традиционно качество раскрывается с помощью описания признаков.

Количество определяет размеры и отождествляется с мерой, числом, измерением. При этом измеряется не сам объект, а его свойство или отличительный признак. В широком смысле измере­ние — это особая процедура, посредством которой числа (или порядковые величины) приписываются вещам по определенным правилам. Сами правила состоят в установлении соответствия между некоторыми свойствами чисел и некоторыми свойствами вещей. Возможность данного соответствия и обосновывает важность из­мерения в педагогике.

Анализируя качество, исследователь определяет, к какому клас­су уже известных явлений принадлежит данное качество и в чем его специфика. Затем устанавливает причинно-следственные за­висимости между явлениями. Задача количественного анализа сво­дится к измерению и счету выявленных свойств. Переход от каче­ственного изучения к количественному описанию осуществляет­ся в следующей последовательности действий:

243


- регистрация — выявление определенного качества у явлении данного класса и подсчет количества его проявлений (например, количество выборов при социометрических методиках);

- ранжирование — расположение собранных данных в опреде­ленной последовательности (убывание или нарастание зафикси­рованных показателей), определение места в этом ряду изучаемых объектов (например, составление списка членов группы в поряд­ке убывания их выборов);

- шкалирование — присвоение баллов или других цифровых
показателей исследуемым характеристикам.

Шкала (от лат. зса1а — лестница) представляет собой числовую систему, в которой отношения между различными свойствами объектов выражены свойствами числового ряда. Шкала — это спо­соб упорядочивания объектов произвольной природы. Шкалиро­вание как количественный метод исследования дает возможность ввести цифровые показатели в оценку отдельных сторон педаго­гических явлений.

Это требует глубокого проникновения в суть изучаемых (в том числе педагогических) явлений, логического осмысления про­блемы. Например, чтобы измерить степень развития любого мо­рального качества у школьников, следует установить, в чем кон­кретно оно проявляется. Затем эти конкретные проявления вклю­чаются в шкалу в виде непрерывного ряда от простого к сложно­му. Каждое из конкретных проявлений морального качества оце­нивается количественно.

Измерения можно проводить на четырех уровнях, каждому из которых соответствует своя шкала: 1) шкала наименований (или номинальная шкала), 2) шкала порядка (или ранговая, ординаль­ная шкала); 3) интервальная шкала, 4) шкала отношений (про­порциональная шкала).

При этом каждый тип шкалы может быть охарактеризован со­ответствующими числовыми свойствами. Рассмотрим более под­робно основные свойства разных типов шкал, эмпирические опе­рации, допустимые для каждого типа шкал, а также статистиче­ские приемы обработки и анализа исходных, или, как их чаще называют, первичных, результатов исследования.

Номинальная шкала. Шкалу наименований иначе называют номинальной (назывной), потому что с ее помощью предметы лишь группируются по классам на основании наличия у них об­щего признака или свойства. С помощью шкалы каждой группе приписывается определенный числовой индекс.

Примером таких шкал является группировка людей по полу, социальному положению, месту жительства, семейному положе­нию. Очевидно, что, присвоив, к примеру, девочкам индекс 0, а

244


мальчикам — 1, мы с уверенностью можем сказать лишь то, что эти группы различаются по данному признаку, если их ин­дексы различны (или равны, если равны их индексы). Определить же, на сколько или во сколько раз они отличаются и даже какой показатель больше или меньше, номинальная шкала не позволяет. Цифровые индексы 0 и 1 взяты нами произвольно, вместо них вполне возможно обозначить группы другими цифрами в любом порядке, к примеру: 187 и 59. Эти числа — всего лишь имена. Потому шкала и называется номинальной (от лат. потеп — имя).

Мы выполнили бы номинальное измерение, если бы присвоили число 1 англичанам, 2 — немцам, а 3 — французам. Равна ли одно­му французу сумма одного англичанина и одного немца (1 + 2 = 3)? Конечно, нет. Если процесс присвоения чисел предметам представ­лял собой номинальное измерение, то действия с величиной, по­рядком и прочими свойствами чисел не будут иметь никакого смыс­ла по отношению к самим предметам, поскольку мы не интересо­вались величиной, порядком и другими свойствами чисел, когда присваивали их (В. Г. Максимов).

При построении шкал наименований главными являются ка­чественные различия, а количественные не принимаются во вни­мание. Поэтому числа, используемые для обозначения классов эквивалентности в этих шкалах, не отражают количественных раз­личий выраженности изучаемого признака.

Назначение номинальной шкалы состоит в различении объек­тов по наличию или отсутствию признака, и применяется она для классификации объектов.

Порядковая (или ранговая) шкала измерений. Порядковая шка­ла (ординальная, ранговая) — это упорядоченная номинальная шкала, которая устанавливает не только равенство между объек­тами по выбранным признакам, но и отношения порядка. Она позволяет обнаружить в предметах различия в степени выражен­ности признака или свойства.

Общий вид порядковой шкалы:

а) максимально положительный ответ;

б) положительный ответ;

в) отрицательный ответ;

г) максимально отрицательный ответ.

При помощи порядковой шкалы изучаются отношения опра­шиваемого к различным объектам, измеряется степень оценки им каких-то предметов и явлений, интенсивность проявления неко­торых личностных характеристик, педагогических явлений.

Если ответам на приведенной выше ранговой шкале присвое­ны номера 4, 3, 2, 1, то столь же правомерно и присвоить номера

245


254, 52, 37, 0 — важно лишь, что эти четыре числа идут в поряд­ке убывания. Порядковая шкала не дает возможности изменить расстояние между объектами, проецируемыми на нее, она харак­теризует только порядок расположения объектов по возраста­нию или убыванию их свойств. Данный вид измерения использует два свойства чисел — различие их и порядок расположения. Шка­ла порядка неравномерна. Расстояния между соседними метками шкалы неизвестны. Следовательно, некорректно складывать, вы­читать, умножать, делить порядковые места или с их помощью вычислять среднее арифметическое значение.

То, что Саша в классе первый по росту, а Денис — третий, озна­чает лишь то, что Саша самый высокий и между ним и Денисом есть еще кто-то один. Но знание ранга не дает возможности ответить на такие вопросы, как «на сколько?» или «во сколько раз?». Зато мож­но с уверенностью сказать, что если Сергей выше Артема, а Миха­ил ниже Артема, то Сергей выше Михаила.

Школьные отметки также представляют собой ранговую шкалу, которая позволяет утверждать, что ответ на «5» лучше, чем на «3». Здесь отсутствует равномерность распределения между выстав­ляемыми отметками. Никто не может утверждать, будто различие между отметками «1» и «2» столь же велико, как между «3» и «4» или «4» и «5». Именно поэтому неправомерно выставлять в качестве ито­говой оценки среднюю арифметическую.

Порядковая шкала позволяет различать уровень проявления свойств объекта, но не определяет величину различия проявления свойств, поскольку не имеет эталона (масштабной единицы). Ее применение целесообразно в целях упорядочения совокупности объектов по интенсивности проявления диагностируемого свойства.

Большая часть шкал, широко применяемых в педагогических, социологических, социально-психологических исследованиях, — это шкалы порядка.

Интервальная шкала. Такое присвоение объектам чисел, при котором равные разности чисел соответствуют равным разностям значений измеряемого признака или свойства объектов, стано­вится возможным при использовании интервальной шкалы. Она образуется на основе порядковой шкалы путем присвоения чис­ловых эквивалентов ее делениям. Интервальная шкала характери­зуется тем, что интервалы между объектами могут быть измере­ны, а значит, появляется возможность определять не только при­знаки свойств предметов, но и количественное различие степе­ней свойств этих предметов.

Шкала интервалов имеет отличительные свойства, заключаю­щиеся в следующих возможностях: определение признаков, свойств предметов, выявление различия в степени измеряемых свойств,

246


опора на условно определенную нулевую точку отсчета, произ­вольное определение величины единицы измерения (интерваль­ной величины).

Для интервального измерения устанавливается единица изме­рения (градус, метр, сантиметр, грамм и т.д.). Предмету присваи­вается число, равное количеству единиц измерения, которое при­близительно соответствует количеству измеряемого свойства. На­пример, температура металлического бруска равна 86 °С.

При создании шкал интервалов основная проблема состоит в том, чтобы изобрести такие операции, которые позволили бы уравнять единицы шкал. В шкале имеются интервалы с соответ­ствующими номерами, и характер ответов испытуемого фиксиру­ется на определенной точке шкалы, выражающей его отношение к данному вопросу.

Для получения интервальной шкалы используют вопросы с оценкой: закрытые вопросы, к которым прилагается оценочная характеристика типа «полностью одобряю», «отношусь нейтраль­но», «он вызывает во мне некоторое неодобрение», «...полное неодобрение», «не знаю». В этом случае исследователь получает не только тот ответ, с которым респондент согласен, но и тот, с которым он не согласен, а также видит меру этого согласия и несогласия. В результате появляется возможность провести коли­чественную обработку ответов, дав каждому ответу определенную количественную оценку.

Для построения трехградусной односторонней шкалы на вопрос «Доволен ли ты своей школой?» предлагается три ответа: очень — 10; не очень — 5; не доволен — 0.

Многоградусная односторонняя шкала имеет такой вид: очень доволен — 6; относительно доволен — 4; не очень доволен — 2; совсем не доволен — 0.

Шкалы могут быть и двусторонние, т.е. иметь оценку ответов со знаком «минус». Например, на вопрос «Окончив школу, как ты будешь о ней вспоминать?» даются следующие ответы: очень хорошо «+10»; довольно хорошо «+5»; нейтрально «0»; довольно плохо «-5»; очень плохо «-10».

Шкалам интервалов присущи все те отношения, которые харак­терны для номинальных и порядковых шкал. Кроме того, для них возможно использование операций установления равенства, разно­сти, сопоставления «больше — меньше» в отношении измеряемых свойств, а также утверждение равенства интервалов и равенства раз­ностей между значениями одной шкалы. Однако операции сложе­ния, умножения и деления с этими данными сомнительны. Между показаниями на интервальной шкале нельзя установить пропорций (соотношения). К примеру, предмет, имеющий температуру 30°, не будет втрое теплее того, у которого температура 10°.

247


Эти рассуждения обусловлены тем, что три момента на шкале интервалов устанавливаются произвольно: нуль шкалы (точка от­счета, которая не означает полного отсутствия измеряемого при­знака), величина единицы измерения и направление, в котором ведется подсчет.

Шкала интервалов имеет масштабную единицу, благодаря чему позволяет определять различие, степень проявленности и величину различия измеряемого свойства объекта. Она не определяет уровня исчезновения свойства и пропорций. Эту шкалу целесообразно при­менять в тестовых методиках.

Шкала отношений. Когда нулевая точка на интервальной шка­ле не произвольна, а указывает на полное отсутствие измеряемо­го свойства, эта шкала становится шкалой отношений, или про­порциональной шкалой. Второе название указывает на то, что числа, приравниваемые к классам объектов, пропорциональны степени выраженности измеряемого свойства. В условиях шкалы отношений возможны утверждения, что у А в 2 (5, 7,5) раза боль­ше свойств, чем у В. Измеритель может заметить отсутствие свой­ства и имеет единицу измерения, позволяющую регистрировать различающиеся значения признака.

Шкала отношений характеризуется возможностью определе­ния каждого из следующих четырех соотношений: равенство, ран­говый порядок, равенство интервалов и равенство отношений. Все операции с цифрами (сложение, вычитание, умножение и деле­ние) можно производить без каких-либо ограничений. Примера­ми измерения в шкале отношений могут служить измерение раз­меров и массы предметов, измерение температуры по шкале Кель­вина. Числа, присвоенные объектам, обладают всеми свойствами объектов интервальной шкалы, но помимо этого на шкале суще­ствует абсолютный нуль.

Шкала отношений определяет абсолютно любые отношения между уровнями проявления свойств, имеет масштабную единицу, фиксирует исчезновение свойства.

В психолого-педагогической диагностике она используется край­не редко, например для измерения скорости выполнения зада­ния, количества сделанных однородных ошибок, количества за­поминаемых при первоначальном изучении слов иностранного языка и т.д.

Специфика использования разных типов шкал. Разработка шка­лы для измерения требует учета таких условий, как соответствие измеряемых объектов, явлений измерительному эталону; выявле­ние возможности измерения интервала между различными про-

248


явлениями измеряемого свойства; определение конкретных пока­зателей различных проявлений измеряемых явлений.

Различие уровней измерения качества можно проиллюстриро­вать простым примером:

- если в диагностике используется критерий факта , т.е. выяв­ляется наличие или отсутствие какого-либо свойства, то получает­ся номинальная шкала (к подобным свойствам, например, относит­ся пол испытуемого);

- если можно установить и степень выраженности этого свой­ства («больше» — «меньше»), то строится ранговая шкала (приме­ром таких свойств является степень произвольности внимания);

- если фиксируется, насколько диагностируемое свойство у од­них испытуемых выражено больше, чем у других, то можно полу­чить интервальную шкалу (большинство тестов успеваемости, на­пример, дают такую возможность);

- если же выясняется, во сколько раз больше свойство выраже­но у одних испытуемых чем у других, то получим пропорциональ­ную шкалу (например, антропометрические параметры: рост, мас­са, объем легких и т.д.).

Шкалы наименований самые «слабые». Числа в них использу­ются только для обозначения принадлежности исследуемого объек­та к определенному классу. В ранговых шкалах устанавливается порядок следования, отношения «больше» и «меньше», общая иерархия. Интервальная шкала дополнительно предусматривает определенные расстояния между отдельными (двумя любыми) числами на шкале, а в шкале отношений, кроме того, определена еще и нулевая точка (точка отсчета). Однако по мере возрастания точности и функциональности шкал возрастает и трудность в их разработке, усложняются соответствующие диагностические ме­тодики. Поэтому в соответствии с решаемыми конкретными зада­чами каждый раз следует выбирать минимально достаточную шкалу.

Выделение уровней развития исследуемого свойства — одна из типичных проблем при выборе оптимальной шкалы. При целост­ном подходе к изучению педагогических явлений и процессов раз­витие понимается как переход качества от низших уровней к выс­шим. При выделении уровней чаще всего берут за основу струк­турно-функциональный признак: измеряемое качество (например, отношение) при переходе на другой уровень меняет свою струк­туру и функции.

Применяя категорию целостности, можно рассматривать каж­дый новый уровень развития как качественно определенное со­стояние целого. Считается, что переход качества на более высо­кий уровень означает не исчезновение интегративных свойств предшествующего уровня, а преобразование их в более совершен­ные. Некоторые ученые отмечают, что путь развития есть систем-

249


но-целостный процесс и включает следующие четыре уровня си­стемности.

Первый уровень — аморфность системы, разрозненность ее элементов, отсутствие устойчивых связей между ними, когда нет еще возможности говорить о сколько-нибудь сложившейся структуре. Система ведет себя непредсказуемо, велика ее зависи­мость от условий внешней среды.

Второй уровень — появление связей между группами эле­ментов в системе, в ней образуются «фрагменты структуры», ус­танавливаются причинно-следственные связи, поведение систе­мы становится предсказуемым в определенных ситуациях, но ос­тается неустойчивым.

Третий уровень — наличие связей практически между все­ми элементами системы, выстраивание ее внутренней структуры, более устойчивое поведение системы, т. е. оно проявляется на уров­не тенденций в большинстве ситуаций жизнедеятельности. Это уровень связного целого, однако система еще неустойчива, ее структура с большой степенью вероятности может быть разруше­на внешними воздействиями.

Четвертый уровень — оптимально связное целое, связи между элементами системы устойчивы, выстраиваются в иерар­хическую структуру; устойчивым и автономным (относительно не­зависимым от внешней среды) становится и поведение системы. Это стадия саморазвития системы, когда усиливаются внутрен­ние факторы ее развития, а внешние отступают на второй план, когда система включает освоенную среду в качестве элементов своей структуры.

Выделенные уровни могут стать основой для построения ран­говой шкалы, которую при соответствующей статистической об­работке можно перевести в интервальную.

9.2. Математическая и статистическая обработка данных1

Использование статистики в исследовании. Там, где это возмож­но, качественный анализ результатов диагностики стремятся до­полнить количественным — математической обработкой и стати­стическим анализом. Методы статистики позволяют не только ус­тановить причинно-следственную связь, но и прогнозировать про­текание процессов на основе статистических моделей. Имеются три главных раздела статистики.

Описательная статистика позволяет описывать, подытожи­вать и воспроизводить в виде таблиц или графиков данные того

В разделе использованы материалы и разработки М.И.Еременко.

250


или иного распределения, вычислять среднее для данного рас­пределения, его размах и дисперсию.

Индуктивная статистика необходима тогда, когда требуется проверить, можно ли распространить результаты, полученные на данной выборке, на всю популяцию, из которой выборка взята. Иначе говоря, она позволяет установить, до какой степени мож­но путем индукции распространить на большее число объектов ту или иную закономерность, обнаруженную при изучении ограни­ченной группы в ходе какого-либо наблюдения или эксперимента. Следовательно, индуктивная статистика необходима после полу­чения эмпирических данных, на этапе обобщения и конструиро­вания выводов.

Корреляция показывает вероятностную или статистическую зависимость. В отличие от функциональной зависимости корреля­ция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов.

Выбор методов обработки данных, полученных в результате диагностики, во многом определяется тем, какой шкалой (номи­нальной, ранговой, интервальной или шкалой отношений) пользовались при измерениях; подчиняются ли полученные дан­ные закону нормального распределения; являются ли сравнивае­мые выборки зависимыми или независимыми.

Соответственно ответом на эти вопросы при анализе и матема­тической обработке массового материала применяются статисти­ческие методы, в число которых входят вычисление средних вели­чин, а также подсчет степеней рассеивания около этих величин — дисперсии, среднего квадратичного отклонения, коэффициента вариации и др.

Основные этапы обработки результатов. Полученные в резуль­тате диагностики данные — это основные элементы, подлежащие анализу. Данными могут быть количественные результаты, другая информация, которую можно классифицировать или разбить на категории с целью обработки.

Применение в педагогическом исследовании статистических методов включает в себя следующие этапы.

Сбор эмпирических данных методами наблюдения, тестирования, эксперимента, анкетирования и других в целях получения коли­чественных сведений о каких-либо явлениях, заполнение матема­тической модели конкретными цифрами.

Сводка полученных сведений, нахождение обобщающих число­вых данных и их обработка в пределах формальной математиче­ской модели.

Составление математической модели для последующего описа­ния с помощью цифр существенных свойств изучаемого объекта.

Анализ и интерпретация данных, конструирование содержатель­ных педагогических выводов.

9^1


Статистическая обработка цифровых данных начинается с груп­пировки. Для этого прежде всего необходимо расположить данные каждой выборки в возрастающем порядке. Многие данные прини­мают одни и те же значения, причем одни из них встречаются чаще, другие — реже. Графически распределение можно предста­вить в виде столбиковых диаграмм. При этом распределение дан­ных по их значениям дает больше информации, чем простое пред­ставление в виде рядов. Подобную группировку используют в ос­новном для качественных данных, четко разделяющихся на обо­собленные категории.

Количественные данные отличаются от качественных своей многочисленностью и располагаются на непрерывной шкале. По­этому такие данные предпочитают группировать по классам, что­бы яснее была видна основная тенденция распределения. Группи­ровка по классам заключается в объединении данных с одинако­выми или близкими значениями в классы и определении частот для каждого класса. Способ разделения на классы и частота каж­дого класса зависят от того, что именно экспериментатор хочет выявить при разделении измерительной шкалы на равные интер­валы.

Распределение данных. Многочисленные методы статистической и математической обработки данных, относящихся к интерваль­ной шкале, исходят из гипотезы, что их значения подчиняются нормальному распределению, при котором большая* часть значений группируется около некоторого среднего значения, по обе сторо­ны от которого частота наблюдений равномерно снижается.


252


Если построить график такого распределения, когда горизон­тальная ось показывает значение признака, а вертикальная — ко­личество соответствующих результатов, то получится симметрич­ная кривая, похожая на колокол (рис. 2). В тех случаях, когда ка­кие-либо причины препятствуют более частому появлению зна­чений, которые выше или ниже среднего, образуются асиммет­ричные распределения (рис. 3, 4). Чем больше значений признака находится вблизи среднего, тем острее вершина кривой; при раз-


бросе результатов (когда многие из них существенно отличаются от среднего) кривая становится более пологой (рис. 5).

Распределение может быть представлено и гистограммой, т.е. последовательностью столбцов, каждый из которых опирается на один разрядный интервал, а высота его отражает число случаев, или частоту, в этом разряде. На рис. 6 и 7 приведены примеры гистограмм распределения данных с разными значениями интер­валов. Применение гистограмм удобно при оценках распределе­ния непрерывной величины (например, распределение учащихся по уровням доходов на одного члена семьи). Если визуальное срав­нение реальной гистограммы с кривой нормального распределе­ния кажется недостаточным, можно использовать разработанные в математической статистике таблицы и формулы оценки нор­мальности распределения, а также методы приведения распреде­ления к нормальному виду.


253


Кривую нормального распределения называют также «колоко­лом Гаусса» или Гауссовой кривой, по имени впервые описавшего ее немецкого математика К. Ф. Гаусса. Эта математическая модель показывает, каким образом значения величин, называемых случай­ными переменными, распределяются относительно среднего зна­чения. Одна из таких случайных переменных — рост человека. Ко-


личество людей с ростом, средним для исследуемой группы, скон­центрировано вблизи средней части кривой, а количество людей с более низким и более высоким ростом распределено с обеих сто­рон от центра кривой.

Другой пример из области социальной жизни — стремление людей выглядеть представителями «среднего класса». «Нормаль­ный» доход имеют большинство из тех, с кем общается конкретный человек (количество людей, имеющих такой доход, сконцентриро­вано в средней части кривой), а количество людей с чрезвычайно большим и практически отсутствующим доходом распределено соответственно на противоположных концах кривой. Человек, до­ход которого отстоит далеко от центра и приближается к одному из концов кривой нормального распределения, естественно, хочет иметь более «нормальный» имидж. Легко понять желание малоиму­щего выглядеть «поприличнее»; также естественным кажется же­лание богатого человека в повседневном общении выглядеть «по­проще». Однако странным (эпатажным) выглядит желание кого-либо, находящегося на одном конце кривой нормального распре­деления, передвинуться еще дальше.

Реальное распределение частот измеряемых величин может иметь не одну, а несколько вершин. В этом случае предпочтитель­но рассматривать интервальные распределения, когда в каждом из интервалов имеется одна вершина.

Меры центральной тенденции. В зависимости от характера дан­ных (по какой шкале они были получены: номинальной, ранго­вой или интервальной) для количественной характеристики со­вокупностей используют средние показатели: моду, медиану или среднее арифметическое.

Мода — наиболее просто получаемая мера центральной тен­денции. Это такое значение во множестве наблюдений, которое встречается особенно часто. Например, в совокупности значений (2; 8; 8; 3; 5; 3; 10; 5; 5; 5) модой является 5, потому что это значение встречается чаще любого другого.

Необходимо подчеркнуть, что мода представляет собой наибо­лее частое значение признака, а не то, сколько раз оно встречает­ся (частота этого значения). Мода соответствует либо наиболее частому значению (если анализируются дискретные величины), либо среднему значению класса с наибольшей частотой (если анализируются интервальные значения).

Мода используется в тех случаях, когда необходимо получить общее представление о распределении. Она необходима там, где требуется быстро охарактеризовать совокупность на основе явле­ния, встречающегося чаще всего. При изготовлении детской ме­бели, например, за основу берется мода (рост, масса ребенка, встречающиеся в данной возрастной группе чаще всего), а не сред­ние арифметические данные детей.

254


В некоторых случаях у распределения могут быть две моды. На­пример, в совокупности 2, 3, 3, 4, 5, 5 модами являются оценки 3 и 5. В этом случае говорят, что совокупность оценок является бимодальной. Большие совокупности оценок рассматриваются как бимодальные, если они образуют полигон частот с двумя верши­нами даже тогда, когда частоты не строго равны.

Принято считать, что в том случае, если все значения оценок встречаются одинаково часто, совокупность данных моды не име­ет. Например, в совокупности 2, 2, 3, 3, 4, 4, 5, 5 моды нет.

Моду как меру центральной тенденции интерпретируют следу­ющим образом: она имеет такое значение, которое наилучшим образом заменяет все значения; когда модой заменяют любое зна­чение ряда чисел, мы имеем наибольшую частоту совпадений с числами ряда.

При использовании номинальных шкал можно определить, какой номинальный класс имеет самый большой состав, и на­звать этот класс модой распределения. В данном случае мода явля­ется статистической мерой центральной тенденции: если продол­жить наблюдения, изменяя условия, в которых они проводились ранее, то мода будет представлять наблюдения, которые можно ожидать с максимальной вероятностью.

Предположим, что в классе 14 детей являются единственными детьми в семье (эту категорию условно обозначим нулем — 0); 11 детей имеют брата или сестру (обозначим единицей — 1); 5 де­тей — двух братьев или сестер (присвоим данной категории детей цифру 2); 3 ребенка — трех (обозначим цифрой 3) и 1 ребенок — четырех братьев и сестер (обозначим цифрой 4). Следовательно, показатель 0 («единственный ребенок в семье») является здесь мо­дальной величиной. В данном примере упорядочить по возрастаю­щей номинальные величины условно можно следующим образом: 0,0, 0,0, 0, 0,0,0,0,0, 0, 0,0,0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,2, 2, 2, 2, 2,3,3,3,4.

Следует заметить, что для малых групп часто о такой замене не может быть и речи. Например, группа из пяти учащихся имеет следующую успеваемость: 2, 2, 2, 5, 5. Модальный актив группы составляет величину 2. Эта цифра точно характеризует успевае­мость трех учащихся группы, но является чрезвычайно некоррект­ной в отношении двух других.

Мода для больших групп данных — достаточно стабильная мера центра распределения. Во многих распределениях значительного числа измерений, используемых в педагогике и психологии, мода близка к двум другим мерам — медиане и среднему арифметическому.

Медиана это число, обозначающее середину множества чи­сел, т.е. половина чисел имеют значения большие, чем медиана,

255


а половина чисел — меньшие, чем медиана. При нечетном числе членов ранжированного ряда медиана соответствует центральной величине ряда.

Например, мы имеем следующий ранжированный ряд: 4, 5, 7, 9, 11, 13, 15, 17, 18. В середине данного ряда находится число 11, следовательно, оно и является медианой. Число, которое является серединой множества чисел, совсем не обязательно должно нахо­диться посередине числового массива данных, например медиана числового ряда:1, 2, 8, 15, 7, 5, 9 — равняется 7, потому что для ее нахождения нужно первоначально упорядочить множество по воз­растанию входящих в него значений (1, 2, 5, 7, 8, 9, 15) или по их убыванию (15, 9, 8, 7, 5, 2, 1).

Если рассмотреть совокупность отметок (2, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5), то аналогично можно обнаружить, что ее медиана равна 4. Однако для больших совокупностей данных, где есть объединенные классы (по нескольку одинаковых значений), медиану проще находить с использованием табличной записи. Пусть мы имеем 16 отметок.

 

Оценка Частота Накопленная частота
2 1 1
3 3 4
4 8 12
5 4 16

Примечание. Частота показывает, сколько раз встречается это значение в совокупности. Накопленная частота, как это видно из таблицы, равна сумме частот данной отметки и всех предыдущих. Таким образом, накопленная частота самой высокой отметки равна общему количеству отметок.

Медиана выбирается 8-й и 9-й оценками в приведенной выше таблице, поскольку всего отметок 16. По таблице видно, что она располагается в интервале «четверок». Поскольку в верхней гра­нице ряда оценок накоплено 4 оценки (I +3 = 4), мы должны еще накопить 8-4 = 4 частоты, а всего в интервале 8 «четверок». По­этому медиана делит интервал «четверок» пополам. В интервале между значениями 3,5 и 4,5 лежит 8 «четверок». Следовательно, медиана равна 3,5 + 4: 8 = 4.

Интерпретируем значение медианы на следующем примере. Пусть мы получили следующий ряд отметок: 2, 2, 3, 4, 5, 5, 5, где медиана равна оценке 4 (поскольку именно 4 — расположена посередине упорядоченной сокупности отметок). Разность между 4 и 2 составляет два, между 4 и 5 — минус один. Сумма этих разно­стей, взятых по абсолютному значению (т.е. без знака), равна

256


2 + 2+1 + 1 + 1 + 1=8и всегда меньше суммы разностей относи­тельно любого другого числа данного ряда. В самом деле, разности между 5 и другими числами соответственно равны: 3, 3, 2, 1, О, О, а сумма абсолютных разностей всех значений относительно меди­аны всегда меньше суммы разностей относительно любой другой точки. Из этого следует, что если вместо каждой оценки ряда выбрать медиану, то будет допущена минимальная суммарная ошибка.

Медиана — один из членов ряда распределения или, как это бывает в четных рядах, очень близкая к нему величина. Опираясь на значение медианы, можно охарактеризовать структуру ряда: имеются ли равномерное распределение вокруг среднего, накоп­ление величин по возрастающим или убывающим интервалам?

Среднее арифметическое совокупности значений определяется суммированием всех данных и последующим делением на их ко­личество. Среднее арифметическое дает возможность охарактери­зовать исследуемую совокупность одним числом; сравнить отдель­ные величины со средним арифметическим; определить тенден­цию развития какого-либо явления; сравнить разные совокупно­сти; вычислить другие статистические показатели, так как многие статистические вычисления опираются на средние арифметиче­ские.

В качестве меры центральной тенденции при анализе данных используют понятие среднего, которое может быть не связано с каким-то цифровым показателем, а представляет обобщенную ка­тегорию мышления, например: «средний ученик», «средний учи­тель», «средняя успеваемость». Но среднее может быть и в цифро­вой форме, когда отражаются те или иные средние величины сово­купности, вычисляются средние величины объема. Они характери­зуются тем, что их числовое значение изменяется при изменении значения любого члена совокупности.

Кроме арифметического среднего в педагогическом исследова­нии применяют гармоническое, квадратическое и хронологиче­ское среднее. Для вычисления различных средних и статистиче­ского анализа количественных данных в среде \\тпао\У8 можно ис­пользовать табличный процессор Ехсе1.

Выбор меры центральной тенденции. Решая вопрос о предпоч­тении определенной меры центральной тенденции, следует по­мнить, что при нормальном распределении все три основных по­казателя центральной тенденции близки по значению, а при асим­метричном распределении — различаются. При этом каждая мера центральной тенденции обладает своими характеристиками, ко­торые особенно значимы в определенных условиях.

В малых совокупностях чисел мода, как правило, нестабильна.

257


Например, для совокупности 2, 2, 2,3,4,4 мода равна 2, но если одну из оценок 2 заменить оценкой 4, то мода будет равна 4.

Медиана более стабильна, на нее не влияют «большие» и «малые» оценки. Например, для больших совокупностей оценок медиана останется прежней, если число минимальных или мак­симальных оценок резко изменится.

Например, совокупности 2, 2, 2, 3, 3, 3, 3,4,4,4, 5, 5, 5, 5 и 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5 имеют одинаковые медианы.

На величину среднего влияет изменение каждого значения оценки. Особенно влияют результаты, которые можно назвать «вы­бросами», т.е. данные, находящиеся далеко от центра группы оце­нок. Преимущество это или нет — зависит от конкретных вопро­сов, которые решаются при анализе результатов диагностики. Для многих числовых совокупностей педагогических измерений мода и медиана — более стабильные показатели.

Например, дано множество значений: 1; 3; 3; 5; 6; 7; 8. Найдем среднее, медиану и моду: среднее равно 4,7; медиана равна 5; мода равна 3. Теперь удвоим максимальное значение во множестве зна­чений: 1; 3; 3; 5; 6; 7; 16, в результате получим: среднее равно 5,9; медиана равна 5; мода равна 3.

Некоторые совокупности результатов педагогических измере­ний просто не имеют центральной тенденции. Это наблюдается для многомодальных совокупностей оценок (имеющих две и бо­лее моды).

Например, для совокупностей оценок: 2, 2, 2, 2, 2, 4, 4, 4, 4, 4 — среднее равно 3, несмотря на то что в этом ряду нет такой оценки. Ни среднее, ни медиана не в состоянии дать правильного представ­ления об успеваемости этой группы. Более правильное представ­ление в данном случае дает словесное описание: «50 % в группе имеют оценки "2", а остальные — "4"». Последнее на языке стати­стики может быть выражено так: гистограмма бимодальна, т. е. име­ет две моды, одна равна 2, другая — 4.

Центральная тенденция групп данных, содержащих крайние значения, наилучшим образом измеряется медианой.

Например, у 99 учащихся показатель социальной адаптации из­меняется от 44 до 85 (среднее значение — 64,5), а показатель од­ного учащегося равен 156. Средний показатель для 100 учащихся в этом случае будет 95. Это число не позволяет судить обо всей груп­пе. В этом примере в качестве меры центральной симметрии сле­довало бы избрать медиану.

258


Медиану применяют в том случае, когда хотят определить точ­ную середину ряда. Некоторые интервалы особенно большой час­тоты могут в значительной мере повлиять на среднее арифмети­ческое. Преимущество медианы в том, что на нее такие чрезвы­чайные интервалы не влияют. Центральная тенденция совокупно­сти данных с большими крайними выбросами наилучшим обра­зом характеризуется медианой, когда распределение результатов унимодально.

Средние показатели не всегда подводят к верным выводам, источником достоверной научной информации они становятся лишь тогда, когда при их вычислении учитывается закон больших чисел, сущность которого заключается в следующем:

- закономерности совокупностей равномерного состава можно вычислить только при наличии достаточно большого количества данных;

- точность измерения закономерностей возрастает с увеличе­нием количества элементов объекта исследования;

- отклонения отдельных явлений от среднего в ту или другую сторону, обусловленные несущественными, случайными обстоя­тельствами, при большом количестве элементов взаимно компен­сируются;

- эти закономерности можно количественно выразить только в виде средних показателей.

Необходимо иметь в виду, что результаты вычисления средних значений можно использовать лишь при нормальном распределе­нии данных, полученных при измерениях по шкале отношений или равномерной интервальной шкале.

Из сказанного становятся очевидными те ограничения, кото­рые накладываются на использование статистических приемов об­работки результатов, полученных на уровне шкалы наименований (номинальной шкалы). Поскольку операции арифметического ха­рактера не допускаются, то в качестве меры центральной тенден­ции можно использовать лишь моду. Модальный класс объектов определяют после подсчета абсолютных или относительных час­тот, т. е. встречаемости того или иного результата в каждом клас­се.

В порядковых (ранговых) измерениях значения чисел, присваива­емых предметам, отражают количество свойства, принадлежаще­го предметам. При обработке приписанных баллов используется медиана.

Совокупность характеризуется посредством среднего арифме­тического в том случае, если распределение параметров располо­жено симметрично по отношению к середине. При асимметрич­ном или многовершинном распределении среднее арифметиче­ское не подходит для описания совокупности. В таких случаях для характеристики совокупности лучше пользоваться модой.

?^ д


Меры связи. Исследователей часто интересует, как связаны между собой две переменные в различных массивах диагностиче­ских данных (успеваемость, учебные умения, учебная деятельность, самообразование и т.д.). Например: имеют ли ученики, научив­шиеся читать раньше других, тенденцию к более высокой успева­емости в последующие годы обучения? Наблюдаются ли в боль­ших классах меньшие успехи в приобретении знаний, чем в не­больших? Связана ли средняя продолжительность работы педаго­га в школе непосредственно со средней заработной платой? Для ответов на такие вопросы мы должны провести наблюдения по каждой переменной для группы объектов.

В табл. 12 приведены данные, собранные для ответов на вопро­сы: связаны ли показатель успеваемости по учебным предметам и социальная адаптация? Как выявить наличие связи между этими двумя характеристиками?

Для выявления связи двух переменных можно использовать анализ диаграммы рассеивания. Для этого на плоскости ХО К по го­ризонтальной оси X откладываются значения одной величины (в

нашем примере это показатель

социальной адаптации), по вер­тикальной оси У — другой ве­личины (в нашем примере — ус­певаемость). Каждый ученик изображается точкой, одна ко­ордината которой равна показа­телю социальной адаптации, другая — успеваемости. Если по­лучившаяся совокупность точек близка к графику линейной за­висимости у - ах + Ъ (примерно так, как показано на рис. 8), то можно утверждать, что между двумя величинами существует значимая положительная связь (говорят, что эти величины име­ют значимую корреляцию).

Связь двух величин можно выразить с помощью коэффици­ ента корреляции Пирсона. Иначе его еще называют коэффициен­том регрессии. Он представляет собой безразмерный индекс в интервале от -1,0 до 1,0 вклю­чительно, который отражает сте­пень линейной зависимости меж­ду двумя множествами данных.

260


В математической статистике вы­водятся соответствующие форму­лы для его вычисления. Однако с помощью компьютера можно вычислить коэффициент корре­ляции Пирсона в табличном процессоре Ехсе1, программном пакете 8ТАТ18Т1СА или других программах, не зная формул. Нужно только знать, как оцени­вать полученные числовые дан­ные. Для этого можно использо­вать табл. 13.

При коэффициенте от +0,5 до 1 и -1 до -0,5 говорят о значи­мой связи, величина коэффициента от 0,00 до ±0,50 показывает незначимую связь величин.

В приведенном выше примере (см. табл. 12) анализ полученных данных показал, что обнаруживается значимая положительная кор­реляция, равная 0,81. Такую корреляцию называют значимой пря­мой связью. Но применение корреляции как единственного мето­да анализа причинности рискованно и может ввести в заблужде­ние.

Во-первых, даже в тех случаях, когда можно предположить су­ществование причинной связи между двумя переменными, кото­рые коррелированы, и коэффициент корреляции больше 0,50, еще нельзя говорить о том, что одна является причиной, а другая — следствием, например, что высокий уровень успеваемости по учеб­ным предметам вызывает актив-

ную социальную адаптацию.

Во-вторых, часто наблюда­емая связь существует благода­ря и другим переменным, а не только двум рассматриваемым.

В-третьих, взаимосвязи мас­сивов переменных в психологии и педагогике слишком сложны, чтобы объяснением их мог слу­жить лишь один числовой пока­затель. Успеваемость в школе — результат многочисленных вли­яний, да и сама по себе она — сложное явление, которое нельзя описать адекватно при помощи какого бы то ни было одного из­мерения.


261


Хотя корреляция прямо не указывает на причинную связь (она лишь говорит об одновременности наступления двух событий), она может служить ключом к разгадке причин.

При благоприятных условиях на ее основе можно сформулиро­вать гипотезы, проверяемые экспериментально, когда возможен контроль других влияний, помимо тех, которые подлежат иссле­дованию. К тому же аналогично можно вычислить корреляцию между собой не двух, а многих величин (так называемую корре­ляционную матрицу), построив на ее основе статистическую мо­дель исследуемого явления. Но для этого нужно овладеть метода­ми математической статистики.

Иногда отсутствие корреляции может иметь более глубокое воздействие на исследуемую гипотезу причинной связи, чем на­личие сильной корреляции. Нулевая или близкая к нулю корреля­ция двух переменных может свидетельствовать о том, что никако­го влияния одной переменной на другую не существует.

Репрезентативность выборки. Можно ли на основе диагности­ки, например, части учащихся класса делать выводы обо всем классе или о школе в целом? Такой вопрос обращает исследова­теля к оценке репрезентативности выборки.

Репрезентативность (от франц. гергезепШН/— показательный) в статистике — соответствие характеристик, полученных в резуль­тате выборочного наблюдения, показателям, характеризующим всю генеральную совокупность. Расхождение между указанными показателями представляет собой ошибку репрезентативности, которая может быть случайной или систематической.

Основная проблема репрезентативности выборки — величина и верность образцов.

Величина представленности образцов зависит от степени од­нородности целого (чем однороднее целое, тем меньше требуется образцов); от численности категорий и классов, на которые под­разделяются результаты исследования (чем их больше, тем боль­ше должно быть образцов); от количества работников, привле­ченных к исследованию.

Выборки называются статистически однородными, если их распределения сходны, а различия между ними пренебрежимо малы. В противном случае, когда различия велики, а сходство пре­небрежимо мало, выборки статистически неоднородны.

Размер выборки находится в зависимости от размера генераль­ной совокупности, подлежащей изучению, а также от цели иссле­дования. Когда цель исследования заключается в изучении состо-

262


яния знаний ограниченного количества учащихся, например одно­го класса, объем выборки не может превысить численность этого класса. В отдельных случаях объем выборки может быть меньше численности учащихся класса из-за того, что не учитываются ре­зультаты учения тех из них, кто пришел в данный класс во время между двумя измерениями (или, наоборот, перешел в другой класс или школу), пропустил много занятий по болезни.

При изучении больших по объему совокупностей проблема от­бора решается с учетом количественной и качественной предста­вительности выборки, это называется требованием репрезентатив­ ности.

Во-первых, следует определить минимальное число объектов, необходимых для того, чтобы при измерении их характерных осо­бенностей начал действовать закон больших чисел или условие массовости выборки. Соблюдение данного условия необходимо для получения надежных выводов.

Во-вторых, требуется обдумать соблюдение качественной пред­ставительности выборки. Под качественной представительностью выборки понимается подбор такой группы объектов, в которой отражены все основные свойства генеральной совокупности.

Репрезентативная выборка имеет достаточно большой объем и отражает основные свойства генеральной совокупности. Требова­ние репрезентативности соблюдается лишь при случайном отборе объектов в выборке.

Метод случайного отбора характеризуется двумя отличитель­ными особенностями: 1) каждый объект генеральной совокупно­сти имеет одинаковый шанс быть избранным; 2) отбор одного объекта не влияет на отбор какого-либо другого объекта. К данно­му методу относятся следующие виды отбора: простой случайный отбор, отбор методом случайных чисел, стратифицированный отбор, систематический отбор.

Простой случайный отбор применяют в тех случаях, если вы­борка составляется из совокупности небольшого объема. Каждому элементу совокупности присваивается порядковый номер. Все но­мера записываются на одинаковые карточки, которые тщательно перемешиваются. Затем выбирается число карточек, требуемое объемом выборки. Выборку составят те объекты, порядковые но­мера которых оказались на вынутых карточках.

Отбор методом случайных чисел отличается от предыдущего только процессом отбора карточек. При отборе карточек приме­няется таблица случайных чисел. С любого места таблицы выписы­вают столько случайных чисел, сколько объектов необходимо взять в выборку. Те объекты, порядковые номера которых соответству­ют этим числам, составят нужную выборку. Данный метод отбора учащихся непригоден при объеме генеральной совокупности боль-

263


ше 1 тыс. учащихся из-за большой сложности в организации и финансового обеспечения усилий многих людей.

Стратифицированный отбор необходим, если рассматриваются некоторые качественные или количественные характеристики от­дельных групп изучаемой совокупности. Например, требуется ис­следовать учащихся младших, средних и старших классов, а также учащихся с плохой, средней и хорошей успеваемостью с учетом их места жительства в городе или сельской местности. Во избежа­ние увеличения объема выборки стратифицированный отбор пред­полагает обследование каждой из этих групп учащихся в отдель­ности с последующим объединением результатов обследования.

Методика стратифицированного отбора включает в себя три этапа:

1) деление совокупности на типические группы (страты);

2) составление случайной выборки из каждой страты;

3) объединение статистических оценок, полученных по каж­дой выборке, в составную статистическую оценку, взвешенную пропорционально объему страт.

Систематический (систематизированный, интервальный) отбор заключается в том, что выборку из совокупности производят пу­тем отбора объектов через фиксированный интервал, что можно применить при исследовании упорядоченных объектов (таких, например, как пачка тетрадей с контрольными работами) или переписанных объектов (список фамилий учащихся).

Использование метода систематического отбора может приве­сти к ошибочным выводам, если объекты совокупности располо­жены в циклическом порядке (например, в стопке тетрадей кон­трольные работы каждого класса сложены по оценкам: сначала отличные работы, затем хорошие, посредственные и неудовлет­ворительные). При совпадении величины интервала отбора с пе­риодом цикла (например, в середине каждой пачки находятся посредственные работы) в выборку могут попасть объекты, кото­рые составят непредставительную выборку.

К методам неслучайного отбора относятся бессистемный от­бор, доступная и целенаправленная выборки.

Бессистемный отбор заключается в изучении объектов, случай­но встретившихся исследователю.

Доступная выборка составляется из объектов, изучение кото­рых находится в возможностях исследователя; от предыдущего отличается систематизированностью.

Целенаправленная выборка составляется в тех случаях, когда исследователь прибегает при отборе объектов измерения к помо­щи лица, хорошо знающего всех членов совокупности (напри­мер, учителя или директора).

В процессе психолого-педагогического исследования невозмож­но устранить влияние всех случайных или не подлежащих изуче-

264


нию факторов на конечные результаты. Очень большое множество как объективных, так и субъективных факторов оказывают воз­действие в ходе эксперимента на те или иные стороны учебно-воспитательного процесса. Это влияние может быть ограничено, если при составлении выборки учащихся будут соблюдаться сле­дующие условия: объем выборки устанавливается в зависимости от цели исследования и составляет достаточно большую часть объе­ма той совокупности, которая подлежит изучению; объекты из­мерения максимально вариативны по состоянию измеряемого признака; объекты измерения максимально однородны по состо­янию общих (не подлежащих изучению) признаков; выводы, полученные на основе изучения репрезентативной выборки, мож­но распространить на учащихся, не включенных в выборку, если они принадлежат к той же совокупности, из которой сделана выборка.

Дисперсия, стандартное и среднее отклонения. Меры централь­ной тенденции говорят о концентрации группы значений на чис­ловой шкале. Каждая мера дает такое значение, которое представ­ляет все оценки группы. При этом пренебрегают различиями, су­ществующими между отдельными значениями. Для измерения ва­риации оценок внутри группы требуются описательные статис­тические методы: дисперсия, стандартное отклонение, среднее отклонение.

Некоторые из наиболее важных функций статистики связаны с процедурами, позволяющими уменьшить, объяснить или ин­терпретировать изменчивость, которая в известном смысле явля­ется неопределенностью. Всякая научная деятельность связана с понятием изменчивости. Когда есть много необъяснимых причин вариабельности, прогнозы не будут очень точными. Зато когда объяснения причин различий, каких-либо характеристик у уча­щихся (учителей) представлены в виде модели, неопределенность можно уменьшить, а часть вариаций устранить.

Например, если бы было совсем неизвестно, почему люди раз­личаются между собой по умственному развитию, то попытка про­гнозировать интеллект наталкивалась бы на большую неопределен­ность: некоторые люди выглядели бы «смышлеными», а другие — «глупыми», и никто не знал бы почему. Однако если известно, что наследственность и окружающая среда оказывают количественное влияние на Ю, то информация о происхождении ребенка и его вос­питании в раннем детстве позволила бы дать более точный прогноз его умственного развития в зрелости. Другими словами, вариабель­ность Ю у лиц со сходной наследственностью и окружающей сре­дой меньше, чем у людей вообще.

Дисперсия показывает значение отклонения, которое несет ин­формацию о вариации совокупности значений. Совокупность с

965


большой неоднородностью будет иметь несколько больших от­клонений. Каковы были бы отклонения, если бы все значения в совокупности равнялись 9? Каждое отклонение равнялось бы нулю, т. е. в предельно однородной совокупности все отклонения равны нулю.

Разброс полученных данных в положительную и отрицатель­ную стороны от средней величины представляет собой ее сред­нюю арифметическую всех отклонений, зафиксированных в диа­гностируемой группе, и вычисляется путем сложения их значе­ний и деления на количество испытуемых. Чем больше ее средняя арифметическая, тем больше разброс данных и тем более разно­родна выборка. Если ее средняя арифметическая невелика, то это свидетельствует в пользу того, что данные близки к среднему зна­чению и выборка более однородна.

Вычисление среднего отклонения в выборке из 6 элементов про­водится следующим образом.

В результате такого расчета получают дисперсию.

Из дисперсии извлекается квадратный корень, и получается стандартное отклонение. В данном примере стандартное отклоне­ние равно 3,74.

Чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выраже­ния под корнем надо использовать не п, а п - 1. Стандартное от­клонение рассчитывается по формуле:

где а1дисперсия, п — количество элементов выборки.

Стандартное отклонение показывает, как далеко в положитель­ную и отрицательную стороны от средней разбросаны результа­ты, а также укладывается ли этот разброс результатов в стандарт­ное отклонение, которое равно 68 % популяции.

266


Степень корреляции значений двух переменных может быть вычислена двумя способами: с применением параметрических и непараметрических методов (тестов). Наиболее широкое примене­ние находят параметрические методы, когда возможно сравнение распределения средних показателей параметров, таких, как сред­нее арифметическое или дисперсия данных. Непараметрические методы (когда среднее арифметическое неприменимо) использу­ют в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; их достоинство — в простоте расчетов и применения.

Обоснованный выбор как параметрических, так и непарамет­рических методов в процессе психолого-педагогического иссле­дования во многом определен полученными экспериментальны­ми данными.

Статистическая гипотеза. Статистической гипотезой называет­ся предположение относительно сходства или различия функцио­нальных и числовых характеристик случайных величин или собы­тий.

Статистические гипотезы в психолого-педагогических иссле­дованиях делят на четыре основные группы:

1) гипотезы о типах вероятностных законов распределения слу­чайных величин;

2) гипотезы о свойствах тех или других числовых параметров;

 

3) гипотезы о стохастической (вероятностной) зависимости двух или более признаков (факторов);

4) гипотезы о равенстве или различии законов распределения случайных величин, характеризующих изучаемое свойство в двух или более совокупностях рассматриваемых явлений.

В математической статистике проверка гипотез о случайных величинах и событиях базируется на принципе так называемой практической невозможности событий. Сущность данного прин­ципа в том, что задается заранее некоторая вероятность а (напри­мер, а = 0,10; а = 0,05), именуемая уровнем значимости. При этом случайные события, вероятность которых меньше или равна а, считаются практически невозможными, но если они происходят, то наступление этого рода событий следует рассматривать как не­случайное. Такое событие становится для нас значимым. Выявлена следующая закономерность: чем меньше расчетная вероятность осуществления события, тем больше его неслучайность и тем важ­нее раскрыть принципы этой закономерности.

Уровень значимости, выраженный в процентах, показывает, в скольких случаях из 100 мы можем ошибиться, объявив изучае­мое событие неслучайным. В гуманитарных науках общепринят 5-процентный уровень значимости, при котором допускается ошибка в 5 случаях из 100. При более высоком уровне значимо­сти (10-процентном) большее число событий нельзя рассматри-

267


вать как неслучайные, но достоверность такого вывода будет ниже (90 % против 95 %). Наоборот, более низкий уровень значимости (1-, 0,999-процентный) приводит к более осторожным, но и бо­лее достоверным выводам.

Статистическая гипотеза представляет собой утверждение, ко­торое объективно может оказаться либо истинным, либо ложным. Следовательно, уже на этапе выдвижения гипотезы мы обязаны одновременно и отрицать ее в форме противоположной (альтер­нативной) гипотезы.

Подлежащую контролю гипотезу называют гипотезой частот или нулевой гипотезой. Согласно нулевой гипотезе, существует равенство теоретических вероятностей двух предположений Рг и Р2. Справедливость гипотезы означает, что наблюдаемое различие частот объясняется случайными причинами.

Нулевой гипотезе противопоставляется альтернативная гипоте­ за. Альтернативной является рабочая гипотеза научного исследова­ния, согласно которой наблюдаемое различие частот неслучайно, значимо, обусловлено влиянием независимой переменной. Основ­ной принцип метода проверки гипотез заключается в том, что ну­левая гипотеза выдвигается для того, чтобы попытаться опроверг­нуть ее и тем самым подтвердить альтернативную гипотезу.

Чтобы судить о вероятности ошибки при выборе позиции от­носительно нулевой гипотезы, применяют статистические мето­ды, соответствующие особенностям выборки. Так, для количествен­ных данных при распределениях, близких к нормальным, исполь­зуют параметрические методы, основанные на таких показателях, как средняя величина и стандартное отклонение. При работе с неколичественными данными или слишком малыми выборками для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, используют непара­метрический метод — коэффициент корреляции Пирсона для ка­чественных данных.

От того, являются ли выборки, средние величины которых сравниваются, независимыми (например, взятыми из двух раз­ных групп испытуемых) или зависимыми (т. е. отражающими ре­зультаты одной и той же группы испытуемых до и после воздей­ствия или после двух различных воздействий), также зависит вы­бор статистического метода.
































Дата: 2018-12-21, просмотров: 261.