Статистический анализ данных
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Формат данного учебного пособия не предполагает описание математико-статистического аппарата, поэтому ниже будут рассмотрены только возможности использования инструментов статистики для анализа эмпирических социологических данных.

Средние величины

 Для того чтобы в полученной числовой информации можно было выявить типичные характеристики, рассчитывают средние величины. Средние величины – это обобщающие показатели, в основе которых могут лежать как количественные, так и качественные признаки. В первом случае, это может быть средний возраст сотрудников, средняя оценка на курсе по какой-то дисциплине и т.д. Во втором – типичный для большинства группы респондентов мотив получения образования, уровень удовлетворенности учебой и проч.

Одним из важнейших условий применения средних величин является их расчет на качественно однородной совокупности. Это требование предполагает, например, что намереваясь выявить отношение к учебе типичного студента, мы не будем усреднять оценки отличников и тех, кто еле-еле переползает с курса на курс.

Виды средних величин:

Простая среднеарифметическая величина применяется в том случае, если в исходных данных значение каждого варианта встречается один раз.

Средняя арифметическая взвешенная используется, если имеется некоторая повторяемость значений единиц совокупности, то есть имеет место частота проявления.

Таким образом, простая среднеарифметическая величина как бы распределяет поровну между отдельными объектами общую величину признака. Взвешенная средняя арифметическая учитывает различное значение отдельных вариантов в пределах совокупности. Поэтому она должна употребляться во всех тех случаях, когда варианты имеют различную численность. Употребление простой среднеарифметической в этих случаях недопустимо, так как это неизбежно приводит к искажению.

Для характеристики структуры совокупности применяются особые показатели, которые называются структурными средними. К таким показателям относятся мода и медиана.

Мода представляет собой наиболее часто встречающееся или типичное значение. Мода – это именно то число, которое в действительности встречается чаще всего (является величиной определенной), а в практике имеет самое широкое применение (например, размер обуви, пользующийся наибольшим спросом).

Медиана – это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая – большие. Понятие медианы легко уяснить из следующего примера. Для ранжированного ряда (т.е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является вариант, расположенный в центре ряда. В интервальном вариационном ряду медиану определяют следующим образом: располагают индивидуальные значения признака по ранжиру; определяют для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находят медианный интервал.   

Индексы. Для определения средних значений качественных признаков, выраженных в порядковых шкалах, строятся индексы. Индексы функционально значимы для анализа, поскольку способны «сворачивать» эмпирическую информацию, представлять ее в компактном, сжатом виде, служить базой для процедур сравнения. Пример построения социоэкономического индекса дан в Приложении 6.

Вариация признака. Если средняя величина дает обобщающую характеристику совокупности, представляет типичный уровень варьирующегося признака, то с помощью показателей вариации можно количественно измерить колебания признака в совокупности. Таким образом, показатель вариации позволяет оценить совокупность с точки зрения ее однородности.

Корреляционная зависимость

Корреля́ция – статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. По видам различают функциональную и корреляционную зависимость.

Функциональной называют такую зависимость, при которой одному значению факторного признака X соответствует одно строго определенное значение результативного признака Y.

Корреляционная зависимость, в отличие от функциональной зависимости, выражает такую связь между явлениями, при которой одному значению факторного признака X могут соответствовать несколько значений результативного признака Y.

По направлению различают прямую и обратную зависимость.

Прямой называют такую зависимость, при которой значение факторного признака X и результативного признака Y изменяются в одном направлении. Т.о. при увеличении значения X, значения Y в среднем увеличиваются, а при уменьшении X – Y уменьшается.

Обратная зависимость между факторным и результативным признаками имеет место, если они изменяются в противоположных направлениях.

Коэффициеты корреляции

Математической мерой корреляции двух случайных величин служат коэффициенты корреляции. При анализе эмпирических социологических данных чаще всего используют ранговый коэффициент Спирмена и линейный коэффициент корреляции Пирсона.

Коэффициент Спирмена используется при оценке тесноты связи между количественными признаками, значения которых можно проранжировать. Значение коэффициента меняется от -1 до +1. Коэффициент, равный +1, означает полную идентичность в ранжировании двух сравниваемых признаков. Коэффициент, равный -1, показывает, что ранжирование признаков у двух сравниваемых групп прямо противоположно.

Коэффициент линейной корреляции Пирсона отражает меру линейной зависимости между двумя переменными. Предполагается, что переменные измерены в интервальной шкале либо в шкале отношений. Значения коэффициента также меняются от -1 до +1. Коэффициент, равный 0, означает отсутствие связи между признаками. Знак, в свою очередь, указывает на направление связи. Знак «плюс» свидетельствует о наличии прямой корреляции, «минус» – обратной. Соответственно, чем ближе значение к единице, тем теснее корреляционная связь.

    Не следует забывать, что корреляционная зависимость обладает вероятностным характером, она не является абсолютно полной и точной, как, например, функциональная зависимость, когда значению одной величины соответствует вполне определенное значение другой.

    Корреляционная зависимость показывает, что, если две величины изменяются совместно, то по значению одной из них можно предсказать тенденцию развития другой. Но само по себе это не означает наличие причинно-следственной связи. Более того, результаты исследований нередко дают примеры так называемых ложных корреляций, когда совместное изменение признаков вызвано случайным совпадением, либо недочетами проведения корреляционного анализа.

    Известный отечественный социолог В.А.Ядов в работе «Стратегия социологического исследования» так описывает подобный случай.

«В книге "Человек и его работа" мы совершили именно такую ошибку – приняли некоторые связи за прямые и пришли к заключению, что в простых видах труда высокое образование отрицательно коррелирует с продуктивностью. Впоследствии было установлено, что поскольку в 1964 г. подавляющее число молодых рабочих имело преимущественно более высокое образование в сравнении с большинством рабочих среднего и старшего возрастов, а те, в свою очередь, обладали большим опытом и стажем, тогда как первые – малым, то прямая связь между образованием и продуктивностью рабочего фактически была ложной. Она опосредована возрастом, стажем работы, уровнем производственного опыта. Все обнаружилось, как только из всей совокупности обследованных были выделены подгруппы разного стажа и возраста: в каждой возрастной подгруппе по правилам, описанным выше (введение контрольной переменной, в нашем случае – возраста), обнаружились усиленные прямые связи уровня образования и деловитости, продуктивности рабочих, т. е. чем выше образование, тем выше и производственные результаты».

    Вместе с тем, сам факт выявления корреляции может подразумевать наличие и причинных связей, а это, в свою очередь, становится основанием рассмотрения уже причинно-следственных отношений.

Дата: 2019-03-06, просмотров: 168.