Курс: «МЕТОДИКА ПСИХОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ»
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

(Материалы для самостоятельного изучения студентами)

Лекция № 9

ОБРАБОТКА ЭМПИРИЧЕСКИХ ДАННЫХ

Вопросы № 1

ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

В ходе математико-статистической обработки данных (на специальном жаргоне) термины «признак», «показатель», «параметр» и «переменная» не­редко употребляются как синонимы. Важно отличать от них понятие «зна­чение». Каждое значение - это эмпирически выявленная, вполне опреде­ленная числовая величина того или иного показателя у конкретного испы­туемого. Например, время реакции на раздражитель в третьей (первой, вто­рой, десятой) пробе, время решения пятой задачи в третьей серии, вы­бранный испытуемым вариант ответа из семи предложенных и т. п.

Составление таблиц

В большинстве случаев обработку целесообразно начать с составления таблиц (сводных таблиц) полученных данных. В таблицу можно свести не только числовые данные. К данным качественного характера также могут быть применены простейшие способы количественной обработки. Для всей выборки и отдельных подвыборок могут быть подсчитаны частоты встре­чаемости (количество случаев появления события), а затем и частости (от­носительные частоты, то есть частоты, деленные на количество испыта­ний) интересующих вас индикаторов, проявлений некоторого вида.

 

Так, например, при использовании рисуночного теста «Дерево» можно в качестве параметра рассматривать наличие/отсутствие листьев на ветках в рисунке. Если этот параметр будет определен у всех испытуемых, это по­зволит подсчитать частость его появления по всей выборке и для отдель­ных групп внутри ее. В таблицу могут быть сведены данные и по другим параметрам теста «Дерево», а затем подсчитаны частости. Далее можно со­ставить таблицу, в которой будут представлены данные не по отдельным испытуемым, а для всей вашей выборки и отдельных групп. Это позволит сделать шаг к более целостному представлению информации.

 

Основной для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испыту­емого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемых. Таким образом, в каждой ячейке (клетке) таблицы запи­сано только одно значение одного показателя одного испытуемого.

В самой верхней строке дана нумерация всех столбцов. Во второй стро­ке названы измеренные вами показатели, шкальные оценки и т. п. Вторая строка облегчает вам ориентировку в таблице. Оператору, который будет вводить ваши данные через клавиатуру компьютера, эта строка не нужна. В каждой последующей строке записана фамилия испытуемого и значения всех, измеренных у него параметров; разумеется, для всех испытуемых в одном и том же порядке показателей. Все строки и все столбцы должны быть пронумерованы. Последовательность признаков может быть упоря­дочена по разным основаниям. В первых столбцах лучше разместить де­мографические или социально-демографические показатели: пол, возраст, уровень образования (если важен) и т. д. Затем по убывающей значимости (предполагаемой информативности) приведены измеренные в эксперимен­те параметры. Параметры, полученные с помощью одной методики, удоб­нее располагать компактно - в одной группе (рядом друг с другом), напри­мер, все шкалы одной методики, шкалы следующей и т. д.

 

Испытуемых можно перечислить в алфавитном порядке, но лучше ис­пользовать этот принцип на самом нижнем уровне деления. Сначала лучше разделить испытуемых по их принадлежности к каким-либо подгруппам, которые будут сравниваться между собой. Внутри этих подгрупп полезно упорядочить испытуемых по полу, возрасту или другому, важному для вас, параметру (см. табл. 8).

 

Таблица 8

 

 

Форма

Сводной таблицы данных

      № 1 2 3 4 5 б 7 8 9 - № п/п Фамилия, имя, отчество Пол Ио Ид Ин А В С Е - 1 Глухарь П. И. 1 38 9 9 12 9 17 16 - 2 Орел С. С. 1 37 10 9 12 10 17 18   3 Петух И. И. 1 35 7 9 14 10 17 8 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 33 Кура Н. Н. 2 39 10 8 10 9 15 15 - 34 Сова Т. О. 2 37 10 9 10 9 12 11 - 35 Утка Л. А. 2 31 9 8 9 7 5 7 -

 

Таблицам необходимо давать заголовки, достаточно полно отража­ющие их содержание и специфику. При большом количестве таблиц без заголовков по ходу ознакомления с текстом трудно понять их назна­чение.

 

И для ручной, и для компьютерной обработки в исходную сводную таб­лицу чаще всего заносят начальные данные. Сейчас преимущественной фор­мой математико-статистической обработки стала компьютерная. Если фор­ма распределения эмпирических данных незначительно отличается от нор­мального распределения, то предварительное центрирование, нормирова­ние или перевод в шкальные (стандартизированные) оценки по имеющим­ся в данной методике таблицам не требуется. В начальный период обработ­ки данных можно предположить, что собранный вами материал подходит для обработки средствами параметрической статистики. Получив на пер­вом шаге компьютерных вычислений первичные статистики признаков, можно сделать дальнейшие, более точные, предположения о форме распре­деления каждого признака.

 

В ходе обработки данных весьма вероятно, что потребуются несколько пользовательских программ. Современные программы предоставляют до­вольно широкие возможности перевода данных из одной в другую. Однако не будет лишним соблюсти некоторые правила, чтобы облегчить преобра­зование формата данных.

 

Старайтесь без особой необходимости не заносить в таблицу различ­ные текстовые символы (точки, запятые, тире и т. п.). Всю информацию, которую можно закодировать числами, лучше перевести в числовую фор­му. Это даст больше возможностей для разных видов обработки данных. Исключением является строка, в которой записаны названия (чаще краткие названия - аббревиатуры) измеренных показателей.

 

До начала набора данных в электронную таблицу узнайте, в каком виде должны записываться десятичные дроби - какой знак (точка или запятая) должен разделять целую дробную части.

 

Не объединяйте без необходимости ячейки рабочей таблицы. Эстети­ческому чувству полезно дать проявиться при оформлении таблицы в тек­сте рукописи, когда все подсчитано, но не ранее. Особо внимательно отне­ситесь к первым ячейкам - в левом верхнем углу таблицы. Лучше запол­нить их произвольными числами, чем оставлять пустыми. Без этого при экспорте в другой формат может быть не считана вся первая строка или может измениться структура всей таблицы.

 

1.2. Преобразование формы информации

В таблицу целесообразно внести все интересующие вас признаки в фор­ме десятичного числа, то есть предварительно пересчитать минуты в деся­тичные доли часа, секунды - в десятичные доли минуты, количество меся­цев - в десятичную долю года и т. д. Это необходимо, поскольку формат данных для большинства используемых сейчас компьютерных программ накладывает свои ограничения.

 

В виде чисел в таблицу можно вписать информацию и о тех параметрах выборки, которые предположительно могут оказаться значимыми фактора­ми, но имеются у вас в качественных показателях. Наиболее простыми опе­рациями могут быть: числовое кодирование (мужчины - 1, женщины - 2; прошедшие обучение - 1, не прошедшие - 2 и т. п.) и перевод качествен­ных показателей в ранги. Число 0 для кодирования лучше не использовать, поскольку некоторые статистические компьютерные программы не смогут обработать такие данные. Это не значит, что в таблицу вообще не могут быть записаны нулевые значения. Имеются в виду те случаи, когда в сфор­мированной рабочей подвыборке какой-либо признак имеет только нуле­вые значения.

 

Уровень образования, ранжируя, можно следующим образом перевес­ти в числа (см. табл. 9).

Таблица9

Ранжирование уровней образования

 

Ранг Уровень образования
1 Менее 5 классов школы
2 5-8 классов или училище с дипломом о неполном среднем образовании
3 9-11 классов или училище с дипломом о полном среднем образовании
4 Техникум или колледж, или 1-2 курса вуза
5 3-6 курсов вуза без диплома о высшем образовании
6 Вуз с дипломом
7 Аспирантура, ординатура или другие формы постдипломного образо­вания со сроком обучения 2 года и более

 

Разумеется, включая в обработку полученные таким образом числовые величины, мы не всегда обнаруживаем ясно выраженную зависимость этих параметров от остальных. Тем не менее мы получаем возможность хотя бы приблизительной оценки взаимосвязей. Эту оценку можно сделать и други­ми способами. Например, при компьютерной обработке и использовании системы управления базой данных можно формировать подвыборки по раз­ным основаниям деления, в том числе и по уровню образования или долж­ностному статусу, и проверять различия между отдельными категориями выборки.

Таблица 10

Дата: 2019-03-05, просмотров: 204.