Статистический анализ данных решает множество задач, для которых могут быть использованы различные статистические методы.
Средняя величина является в большинстве случаев весьма информативной мерой «центрального положения» наблюдаемой переменной. При этом следует помнить, что процедура поиска средних величин будет зависеть от типа переменной.
Если переменная номинальная, то в качестве средней величины следует использовать моду – наиболее часто встречающееся значение.
Например, при контент-анализе «Нижнекамского времени» в 24 страницах, была выявлена следующая тематика печати ( 1 – «реклама», 2 – «социальные проблемы населения», 3 – «на разные темы», 4 – «культура, искусство и спорт», 5 - социальная безопасность населения») следующим образом: (1, 2, 2, 3, 1, 2, 3, 4, 1, 1, 3, 1, 2, 2, 1, 5, 2, 2, 5, 5, 1, 1, 1, 1).
Для превращения этих данных в осмысленную статистическую картину необходимо рассчитать частотное распределение, а затем процентное соотношение страниц к пяти вышеназванным группам.
тематика публикаций | номера страниц, посвященных данной публикации | количество страниц | количество страниц в процентном соотношении |
1 – реклама | 1, 5, 9, 10, 12, 15, 21, 22, 23, 24 | 10 | 41% |
2 – социальные проблемы населения | 2, 3, 6, 13, 14, 17, 18 | 7 | 29% |
3 – на разные темы | 4, 7, 11 | 3 | 13% |
4 – культура, искусство и спорт | 16, 19, 20 | 3 | 13% |
5 – социальная безопасность | 8 | 1 | 4% |
Всего | 24 | 24 | 100% |
Модой в данном примере будет альтернатива 1, частота которой равняется 10. Иными словами, в газете распространены статьи и очерки посвященные рекламе и объявлениям.
Теперь необходимо выяснить, насколько средняя в действительности отражает характер распределения. Показателем типичности средней для номинальной шкалы является коэффициент вариации, показывающий существенность разброса.
Его высчитывают на основании отношения всех немодальных (не соответствующих моде) значений к общему числу значений (14:24). Такое соотношение равняется 0,5 (0,58). Чем ближе значение коэффициента к 0, тем лучше мода описывает реальное распределение; чем ближе к 1 – тем менее она репрезентативна.
На порядковом уровне измерения основной средней величиной является медиана. Медиана представляет собой середину ранжированного числового ряда: ниже и выше медианы должно быть равное число элементов. В случае четного числа элементов медианой будет среднее арифметическое двух, стоящих в середине чисел ряда. Например, для ряда (1, 2, 3,….23, 24) медианой будет 12,5=(12+13)/2.
Для измерения разброса значений используется вычисление квартилей – серединных значений числового ряда между медианой, началом и концом ряда. Таким образом, квартилей бывает два – нижний (Q1) и верхний (Q2). Разница между ними называется квартильным рангом, она служит мерой вариации для порядковых переменных.
Как уже было выявлено медианой является 12,5, однако вычисление квартилей (в ряду это подчеркнутые числа) и квартильных рангов опровергают этот вывод. Нижний (Q1) – 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 = 6,5, верхний (Q2) – 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24= 18,5 Квартильный ранг – (18,5 – 6,5) =12
На интервальном уровне измерения наиболее распространенной средней величиной является среднее арифметическое. Среднее арифметическое – это результат деления суммы всех элементов совокупности на общее их число.
Среднее арифметическое:
1+2+3+4+5+6……+24 = 12*25 = 300 = 150 = 75 = 12,5
24 24 24 12 6
Мерой разброса значений вокруг средней на интервальном уровне выступает стандартное отклонение, которое вычисляется по следующей формуле:
Ѕ=√∑(Х¡ - Х̃)²,
(N-1)
где Х¡ - текущее значение переменной,
Х̃ – среднее арифметическое текущих значений,
N – количество всех значений.
Ѕ=√∑(Х¡ - 12,5)² + (1-12,5)² + (2-12,5)² + (3-12,5)² +…+ (24-12,5)²
(24-1) 23 23 23 23
При одномерном анализе распределений интервальных переменных используют и такие показатели, как минимум (наименьшее значение), максимум (наибольшее значение), размах (разница между минимумом и максимумом).
Минимум 1.
Максимум 24.
Размах 24-1=23.
При выборе метода вычисления средних величин на различных уровнях измерения могут использоваться все вычисления, применимые на более простых уровнях, но не наоборот.
Таким образом можно сделать вывод:
– модой в данном примере будут статьи посвященные рекламе и объявлениям;
– коэффициент вариации равен 0,5;
– медианой является 12,5;
– нижний квартильный ряд равен 6,5, верхний квартильный ряд равен 12;
– среднее арифметическое число равно 12,5;
– минимум 1;
– максимум 24;
– размах 23.
Дата: 2019-05-28, просмотров: 238.