Математическое и статистическое обеспечение выпускной квалификационной работы
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Статистический анализ данных решает множество задач, для которых могут быть использованы различные статистические методы.

Средняя величина является в большинстве случаев весьма информативной мерой «центрального положения» наблюдаемой переменной. При этом следует помнить, что процедура поиска средних величин будет зависеть от типа переменной.

Если переменная номинальная, то в качестве средней величины следует использовать моду – наиболее часто встречающееся значение.

Например, при контент-анализе «Нижнекамского времени» в 24 страницах, была выявлена следующая тематика печати ( 1 – «реклама», 2 – «социальные проблемы населения», 3 – «на разные темы», 4 – «культура, искусство и спорт», 5 - социальная безопасность населения») следующим образом: (1, 2, 2, 3, 1, 2, 3, 4, 1, 1, 3, 1, 2, 2, 1, 5, 2, 2, 5, 5, 1, 1, 1, 1).

Для превращения этих данных в осмысленную статистическую картину необходимо рассчитать частотное распределение, а затем процентное соотношение страниц к пяти вышеназванным группам.

 

тематика публикаций номера страниц, посвященных данной публикации количество страниц количество страниц в процентном соотношении
1 – реклама 1, 5, 9, 10, 12, 15, 21, 22, 23, 24 10 41%
2 – социальные проблемы населения 2, 3, 6, 13, 14, 17, 18 7 29%
3 – на разные темы 4, 7, 11 3 13%
4 – культура, искусство и спорт 16, 19, 20 3 13%
5 – социальная безопасность 8 1 4%
Всего 24 24 100%

 


Модой в данном примере будет альтернатива 1, частота которой равняется 10. Иными словами, в газете распространены статьи и очерки посвященные рекламе и объявлениям.

Теперь необходимо выяснить, насколько средняя в действительности отражает характер распределения. Показателем типичности средней для номинальной шкалы является коэффициент вариации, показывающий существенность разброса.

Его высчитывают на основании отношения всех немодальных (не соответствующих моде) значений к общему числу значений (14:24). Такое соотношение равняется 0,5 (0,58). Чем ближе значение коэффициента к 0, тем лучше мода описывает реальное распределение; чем ближе к 1 – тем менее она репрезентативна.

На порядковом уровне измерения основной средней величиной является медиана. Медиана представляет собой середину ранжированного числового ряда: ниже и выше медианы должно быть равное число элементов. В случае четного числа элементов медианой будет среднее арифметическое двух, стоящих в середине чисел ряда. Например, для ряда (1, 2, 3,….23, 24) медианой будет 12,5=(12+13)/2.

Для измерения разброса значений используется вычисление квартилей – серединных значений числового ряда между медианой, началом и концом ряда. Таким образом, квартилей бывает два – нижний (Q1) и верхний (Q2). Разница между ними называется квартильным рангом, она служит мерой вариации для порядковых переменных.

Как уже было выявлено медианой является 12,5, однако вычисление квартилей (в ряду это подчеркнутые числа) и квартильных рангов опровергают этот вывод. Нижний (Q1) – 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 = 6,5, верхний (Q2) – 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24= 18,5 Квартильный ранг – (18,5 – 6,5) =12

На интервальном уровне измерения наиболее распространенной средней величиной является среднее арифметическое. Среднее арифметическое – это результат деления суммы всех элементов совокупности на общее их число.

Среднее арифметическое:

1+2+3+4+5+6……+24 = 12*25 = 300 = 150 = 75 = 12,5

    24       24  24 12 6             

Мерой разброса значений вокруг средней на интервальном уровне выступает стандартное отклонение, которое вычисляется по следующей формуле:

Ѕ=√∑(Х¡ - Х̃)²,

(N-1)

где Х¡ - текущее значение переменной,

Х̃ – среднее арифметическое текущих значений,

N – количество всех значений.

Ѕ=√∑(Х¡ - 12,5)² + (1-12,5)² + (2-12,5)² + (3-12,5)² +…+ (24-12,5)²

(24-1)    23 23  23      23

При одномерном анализе распределений интервальных переменных используют и такие показатели, как минимум (наименьшее значение), максимум (наибольшее значение), размах (разница между минимумом и максимумом).

Минимум 1.

Максимум 24.

Размах 24-1=23.

При выборе метода вычисления средних величин на различных уровнях измерения могут использоваться все вычисления, применимые на более простых уровнях, но не наоборот.

Таким образом можно сделать вывод:

 – модой в данном примере будут статьи посвященные рекламе и объявлениям;

– коэффициент вариации равен 0,5;

– медианой является 12,5;

– нижний квартильный ряд равен 6,5, верхний квартильный ряд равен 12;

– среднее арифметическое число равно 12,5;

– минимум 1;

– максимум 24;

– размах 23.

 


Дата: 2019-05-28, просмотров: 238.