Модуль № 1. Описательная статистика
Тема 1. Математическая статистика и психология. Измерения в психологии и виды шкал
Предмет математической статистики, её исторические предшественницы. Структура и разделы математической статистики. Значение знания математической статистики для психолога.
Понятие измерения. Исходная содержательная проблема. Значение измерения в психологии. Аддитивность функций при измерении и её следствия. Способы измерения и основные операции, с помощью которых производится измерение: регистрация, упорядочивание, сопоставление. Основные требования каждого способа измерения. Типы шкал: номинальная (шкала наименований), ординальная (шкала порядка или ранговая), интервальная (шкала равных интервалов), пропорциональная (шкала равных отношений). Сравнительная характеристика и примеры типов измерительных шкал.
Основные этапы статистической обработки результатов психологических исследований. Достоинства и недостатки математико-статистического анализа экспериментальных данных. Понятие репрезентативности экспериментальных данных.
Методические рекомендации к изучению темы
При изучении данной темы необходимо обратить внимание на специфику использования математической статистики в психологических исследованиях. И здесь следует обратить внимание на материалы, приводимые в книге Резника А. Д.
Особое внимание следует обратить на измерительные шкалы, так как весь дальнейший аппарат математической статистики будет «привязан» к типам измерения и измерительным шкалам. Внимательно изучите этот материал и попытайтесь самостоятельно придумать примеры каждой измерительной шкалы в психологических исследованиях.
После изучения материала лекции ответьте на контрольные вопросы, ответы занесите в конспект и сохраните его до итоговой аттестации.
Материалы лекции.
Математическая статистика — это наука о случайных явлениях. Под явлением понимается любой подлежащий изучению объект независимо от его конкретного содержания. По степени количественной определенности явления рассматриваются как отдельные события, величины, функции и как системы событий, величин, функций. Если изучаемые объекты можно трактовать как следствия многочисленных разнообразных по действию причин, то интересующие исследователя свойства этих объектов определяются неоднозначно и могут быть предсказаны лишь в результате массовых наблюдений не полностью, а с большей или меньшей вероятностью. Такие объекты и характеризуются как случайные явления (случайные события, величины, функции или их системы).
Математическая статистика занимается математическим описанием случайных явлений, т. е. построением вероятностных моделей, а также проверкой их пригодности. Поэтому выделяют два раздела: описательную статистику и статистику «проверяющую» (статистическую проверку гипотез); соответственно разделяется методический аппарат. Понятия и методы описательной статистики создаются в теории вероятностей, а понятия и методы статистической проверки гипотез создаются в специальных теориях
Статистика появилась более ста лет назад. Бельгийский математик Адольф Кетле был первым, кто применил статистические методы и законы нормального распределения случайных величин к анализу биологических и социальных процессов. Ранее этот закон обычно использовался при определении ошибок измерений при наблюдениях и экспериментах в естественных науках. А. Кетле впервые показал, что величина роста, измеренного у 10 тысяч человек приблизительно подчиняется закону нормального распределения. Он использовал выражение l'homme moyen (средний человек) , чтобы отразить тот факт, что большинство результатов группируются вокруг их среднего значения или центра распределения, а количество остальных данных уменьшается по мере отклонения их от этой средней величины.
Результаты, полученные А. Кетле, произвели огромное впечатление на Френсиса Гальтона (1822-1911 г.), который во 2-й половине XIXека создал новую науку евгенику, имевшую дело с факторами, которые могли, по мнению Ф. Гальтона, улучшить наследуемые качества людей. В своей первой книге по психологии «Наследственный гений» (1869 г.) Ф. Гальтон, пытаясь проверить свою евгеническую теорию («у гениев рождаются гении»), обратился к статистике. И далее в продолжение всей своей научной карьеры Ф. Гальтон никогда не был удовлетворен исследованием проблемы, если не мог получить количественных данных и провести их статистическую обработку. Для этого он создавал свои оригинальные разработанные методы.
Ф. Гальтон первым использовал статистические методы в психологии, например, он показал, что разброс оценок на экзаменах подчиняется закону нормального распределения. Из-за простоты нормального распределения и удобства его применения к описанию разнообразных характеристик Ф. Гальтон предположил, что достаточно большое число человеческих характеристик может быть описано двумя основными величинами: средней арияметической оценкой (математическое ожидание) и диапазоном разброса вокруг средней оценки (стандартное отклонение).
Работы Ф. Гальтона в области статистики привели к открытию одной из самых важных величин — корреляции, первое упоминание о которой появилось в 1888 г. Современные методы обоснованности и надежности тестов, как и методы факторного анализа, напрямую связаны с гальтоновским открытием корреляции, которое стало результатом наблюдений за тем, как количественные характеристики наследуемых признаков регрессируют к своему среднему значению, например, сыновья очень высоких людей ниже отцов, а сыновья людей маленького роста выше отцов. Ф. Гальтон разработал графические методы для отражения основных свойств корреляции и нашел формулу для его расчета (эта формула в настоящее время не используется). Его студент Карл Пирсон вывел использующуюся и сейчас формулу коэффициента корреляции — коэффициента линейной корреляции Пирсона. Символически она обозначается как r — регрессия (первая буква слова regression). Что является фактом признания гальтоновского открытия: тенденции регрессирования наследственных признаков к среднему значению. Корреляция стала основным инструментом исследований в социальных, естественных и инженерных науках. Впоследствии на основании работ Ф. Гальтона были разработаны и другие методики статистических оценок.
В настоящее время, не смотря на столь давнюю историю использования статистики в психологии, распространенное отношение к статистике среди психологов — смесь благоговения с цинизмом, подозрением и презрением. Статистиков поместили в нелестную для них компанию лгунов и обвинили в «статисти-куляции» — искусстве обмана с помощью статистики, сохраняющего видимость объективности и разумности. Однажды кто-то заметил, что, «если бы всех статистиков мира скрутили одной цепью, это принесло бы только пользу». Статистика насмешливо сравнивают с человеком, который тонет, переходя вброд реку со средней глубиной 90 см, или сидит, держа голову в холодильнике, а ноги в печи, и говорит: «В среднем я чувствую себя прекрасно».
Лицам, начинающим изучение статистики, полезно отказаться от широко распространенного представления о статистике и статистиках. Они должны понимать, что абсурд может найти свое выражение как в словесной, так и в цифровой форме. Однако знание логики является надежной гарантией от некритичного принятия словесного абсурда, а знание статистики представляет собой лучшую защиту от абсурда цифрового. Первый шаг к замене привычных представлений о статистике на более реальные — это изучение структуры дисциплины «статистические методы» и ее исторических предшественниц.
На первоначальное развитие статистических методов оказало влияние их происхождение. У статистики были «мать», которой нужно было предоставлять регулярные отчеты правительственных подразделении (штат и статистика происходят одного латинского корня — status), и «отец» — честный карточный игрок, который полагался на математику, усиливавшую его ловкость — умение брать решающие взятки в азартных играх. От матери ведут свое происхождение счет, измерение, описание, табулирование, упорядочение и проведение переписей, то есть все то, что привело к современной описательной: статистике. От предприимчивого интеллектуала-отца возникла. в конечном счете. современная теория статистического вывода, непосредственно базирующаяся на теории вероятностей. Недавнее дополнение, называемое планированием экспериментов, опирается в основном на сочетание теории вероятностей с несколько элементарной, но удивительной логикой.
Описательная статистика включает в себя табулирование, представление и описание совокупностей данных. Эти данные могут быть либо количественными, как, например, измерения роста и веса, либо качественными, как, например, пол и тип личности. Огромные массивы данных, как правило, должны обобщаться или свертываться, прежде чем они будут интерпретироваться человеком. Обезьяна беспомощна в своей неуклюжей попытке развязать простой узел, так как сложность этой задачи: превосходит разрешающую способность бедного в творческом отношении интеллекта. Безуспешная попытка рыбака разобраться в причинах люфта спиннинга аналогична попытке обезьяны. Для рыбака этот люфт — гордиев узел; он дает слишком сложную задачу для его ограниченного интеллекта. Точно так же, но на ином уровне человеческий разум не может извлечь полной информации из массы данных без помощи специальных методов (мечей, разрубающих гордиев узел): Как варьируют данные? И как велики эти вариации? Нельзя ли уменьшить неопределенность в этих вариациях? Таким образом, описательная статистика служит инструментом, описывающим, обобщающим или сводящим к желаемому виду свойства массивов данных.
Теория статистического вывода — это формализованная система методов решения задач другого рода, создающих значительные трудности для невооруженного человеческого разума. Этот общий класс задач, как правило, характеризуется попытками вывести свойства большого массива данных путем обследования выборки. Например, школьная медсестра хочет определить долю учеников пятых классов в большой школе, которые никогда не болели ветрянкой. Излишне было бы опрашивать каждого ребенка, если бы можно было надежно определить такую долю по выборке минимальным объемом, скажем в 100 детей. Но какова доля тех детей, которые никогда не болели ветрянкой, в этой выборке по отношению к доле во всей совокупности пятиклассников? Ответ можно получить благодаря теории статистического вывода. Итак, задача статистического вывода состоит в том, чтобы предсказать свойства всей совокупности, зная свойства только выборки из этой совокупности. Статистические выводы строятся на описательной статистике. Они делаются от частных свойств выборок к частным свойствам совокупности; описания свойств как выборок, так и генеральных совокупностей производятся с помощью методов описательной статистики.
Планирование и анализ экспериментов представляет собой третью важную ветвь статистических методов, разработанную для обнаружения и проверки причинных связей между переменными. Исследователи в области общественных наук имеют дело с причинностью — очень сложным философским понятием. План эксперимента настолько важен при изучении причинных связей, что в некоторых философских системах эксперимент представляет собой их операциональное определение. Люди делают заключения о причинах на протяжении всей своей жизни. Частота употребления слов «потому что» подтверждает это: «Школьная лотерея потерпела неудачу, потому что она не была достаточно разрекламирована» или «Он получил мало очков при выполнении интеллектуального теста, потому что очень беспокоился о своих результатах».
Предложение «Лекарство А снимает боль быстрее лекарства Б» не содержит слов «потому что», но подразумевает, что «Большая часть пациентов одной группы по сравнению с пациентами другой группы гораздо скорее избавилась от боли, потому что первым было прописано лекарство А, а последним — лекарство В». Недостаточность объяснения посредством «потому что» — в его потенциальной неопределенности. Эта неопределенность служит любимой отговоркой маленьких детей, когда на дологических ступенях мышления им предъявляют свидетельства их дурного поведения. Если их спрашивают: «Почему ты сделал это?», они отвечают: «Потому что». Очевидно, эти слова имеют множество оттенков и сопутствующих значений.
Статистические методы помогают исследователям описывать данные, делать выводы в отношении больших массивов данных и изучать причинные зависимости. Они могут оказаться полезными при ответе на вопросы типа: Каков средний возраст учащегося колледжа к моменту получения степени бакалавра искусств? Какой процент этих новых выпускников имеет голубые глаза? Какой процент из них в этот момент женат? Сколько из них уже имеют 0, 1, 2, ... детей? Составляют ли те, кто добился значительных успехов, будучи студентами, большинство в аспирантуре по сравнению с теми, кто получал посредственные оценки? Влияет ли международная обстановка на посещаемость студентов в высших школах? Будут ли студенты, принятые группой доброжелательно, больше приспосабливаться к суждениям этой группы, чем студенты, которых группа отвергает? Зависит ли такая различная реакция (если она будет установлена) от пола студента? Например, подвержены ли женщины влиянию группы в большей степени, чем мужчины?
Овладение статистическими методами требует некоторой математической подготовки. Статистика — это ветвь прикладной математики. Ее неправильно определяют в словаре как «науку сбора данных». Более строго статистику обычно называют математической статистикой. Для специалистов в области общественных наук и других нематематиков она определяется как «прикладная статистика» и предполагает использование интуиции, элементарной арифметики и элементарной алгебры. Для более серьезного изучения математической статистики требуется известная подготовка, включающая, по крайней мере, вычислительные методы и теорию матриц; однако логическую сторону прикладной статистики и многие ее методы можно изучить и без такой математической подготовки, хотя и не столь глубоко. Возможно, в этом отчасти и кроется причина тенденции различных общественных наук к технизации, В крупных университетах отдельные курсы по «педагогической и психологической статистике», «социологической статистике», «экономической статистике» и т. п. обычно далеки от статистики как области знания. К счастью, однако, большинство основных принципов применимо почти ко всем дисциплинам — от сельскохозяйственной науки до зоологии. Знание статистики становится необходимым для успешной деятельности в любой эмпирической области. Во многих высших школах признали ее важность.
В основе отдельных статистических методик лежит единый главный принцип. Мы попытаемся продемонстрировать это единство и взаимосвязи как можно яснее, пользуясь только элементарной математикой, которую читатель изучил в средней школе. По мере надобности будут введены некоторые специальные обозначения; они будут сопровождаться подробным объяснением. Их нужно усвоить с самого начала, поскольку подобные обозначения облегчают изучение статистики.
Прежде чем излагать дальнейший материал, необходимо обратиться к теории измерений, так правильный выбор тех или иных методов математической статистики зависит от того, каким образом были получены фактические данные, каким образом были измерены те или иные явления.
Дата: 2019-11-01, просмотров: 322.