Статистическая совокупность как группа изучаемых явлений обладает особыми групповыми свойствами. Эти свойства присущи только статистической совокупности (табл. 4).
Таблица 4
Основные групповые свойства и статистические критерии совокупности
Групповые свойства | Статистические критерии |
Распределение признака | Частота, доля (%, ‰, относительные величины) |
Средний уровень признака | Мо – мода, Ме– медиана М – средняя арифметическая величина |
Разнообразие признака | Lim – лимит; Am – амплитуда σ – среднее квадратическое отклонение |
Репрезентативность признака | mM – средняя ошибка средней арифметической m% - средняя ошибка относительной величины (%) χ2 – коэффициент соответствия (хи – квадрат) |
Взаимосвязь между признаками | rxy – коэффициент корреляции |
К основным групповым свойствам статистической совокупности относятся следующие: распределение признака, его средний уровень, разнообразие и репрезентативность, взаимосвязь между признаками.
Распределение признака – это одно из важных свойств совокупности; оно заключается в том, что элементы совокупности распределяются неодинаково, по величине признака, образуя определенную внутреннюю структуру группы. Анализ структуры позволяет вскрыть важнейшие закономерности, присущие тому или иному явлению.
Средний уровень признака как свойство совокупности дает обобщенную характеристику различным величинам количественного признака, выразив его одним числом.
Средним уровнем характеризуют количественные признаки, т.е. признаки, имеющие числовые значения (рост, масса и др.).
Разнообразие признака указывает, что группа состоит из объектов, различных по величине изучаемого признака.
Репрезентативность признака (представительность, типичность) означает способность выборочных совокупностей отражать свойства генеральных совокупностей. Для измерения этого свойства используются ошибки репрезентативности (m).
Ошибки репрезентативности показывают, насколько результаты выборочного исследования отличаются от результатов, которые могли бы быть получены при сплошном изучении генеральной совокупности.
Взаимосвязь между признаками – это степень зависимости размеров признаков друг от друга.
1.4.1. Первое свойство статистической совокупности - распределение признака в статистической совокупности
Основными величинами, которыми оперирует статистика, являются абсолютные и относительные величины, отражающие качественную структуру статистической совокупности и характеризующие распределение признаков (первое свойство статистической совокупности).
Абсолютные величины используют очень широко. Они нужны для общей характеристики явления, признака: например, это численность населения в мире, в конкретной стране, в городе, районе и т. д.; при учете редких инфекционных заболеваний (малярия, полиомиелит и др.); число врачей, учреждений здравоохранения, коек и пр.
Однако при сравнении данных возникает необходимость применения относительных величин (или показателей), которые получают при соотношении, сопоставлении двух сравниваемых чисел. Типы распределения признаков в статистической совокупности представлены на рис. 3.
Рис. 3. Типы распределения признаков в статистической совокупности
В целом относительные величины, характеризующие распределение признаков и применяемые в медицине, представлены следующими показателями:
• экстенсивные показатели
• интенсивные показатели
• показатели соотношения
• показатель наглядности
• показатели динамического ряда.
Для удобства сопоставления, обычно перечисленные показатели вычисляют на 100, 1000, 10 000, 100 000, для чего умножают на круглое число (100, 1000, 10 000, 100 000 и т. д.), называемое основанием. В результате полученные коэффициенты приобретают форму "процентов" (%), "промилле" (‰), "продецимилле" (‰о) и т. д. Чем реже встречается изучаемое явление, тем больше числовое основание следует выбрать, чтобы не было коэффициентов меньше единицы, которыми неудобно пользоваться. Принято, например, структуру какого-то явления выражать в процентах, а демографические показатели (рождаемость, смертность) — в промилле; распространенность заболеваний — на 100000 населения.
Экстенсивные показатели (коэффициенты) характеризуют распределение явления на его составные части, определяют его внутреннюю структуру, удельный вес части в целом, долю признака в статистической совокупности. При вычислении экстенсивных показателей используют только одну статистическую совокупность и ее состав. Большинство экстенсивных показателей определяют в процентах (%), реже в промилле (%>) и долях единицы. Вычисление осуществляют по формуле:
Экстенсивный показатель = *100%
Например, в прошедшем году среди учащихся 1-го класса было зарегистрировано 387 случаев заболеваний желудочно- кишечного тракта, в том числе 224 случая заболеваний гастритом. Удельный вес лиц, страдающих гастритом, составил 57,9 % .
В качестве примеров экстенсивных показателей, используемых в здравоохранении, можно назвать структуру заболеваемости, смертности, инвалидности и т. д. Следует помнить, что экстенсивными показателями следует пользоваться в тех случаях, когда необходимо охарактеризовать статистическую совокупность в данном месте и в данное время. Для сравнения показателей в динамике коэффициенты экстенсивности непригодны. Для этой цели нужно знать численность среды, в которой происходит явление, и пользоваться интенсивными показателями.
Интенсивные показатели (коэффициенты) характеризуют частоту (интенсивность, уровень, распространенность) явления за определенный промежуток времени (чаще за год) в среде, в которой это явление происходит и с которой оно непосредственно связано. При вычислении интенсивных показателей необходимо знание двух статистических совокупностей, одна из которых представляет среду, другая — явление. В демографической и санитарной статистике в качестве среды чаще всего рассматривают население и в расчете на него вычисляют то или иное явление, например число рождений, число заболеваний, общее число смертей за год на определенную численность населения. Показатель интенсивности рассчитывают на 100, 1000, 10 000 или 100 000) по формуле:
Интенсивный показатель =
Типичными интенсивными показателями являются демографические показатели и коэффициенты заболеваемости, вычисляемые для населения в целом или для отдельных определенных групп людей, например, в одном из регионов страны за год родились живыми 3000 детей, в течение 1-го года умерли 52ребенка. Показатель младенческой смертности составил 17,3 ‰ ( ).
Показатели соотношения (коэффициенты) характеризуют частоту встречаемости признака в статистической совокупности, его распространенность и применяются при сравнении двух, не связанных между собой статистических совокупностей, но сопоставимых логически и по содержанию. К ним относят такие показатели, как число врачей, число больничных коек на 1000 населения, количество различных исследований, переливаний крови на 100 (или 1000) больных. По методике вычисления показатели соотношения схожи с показателями интенсивности, но различны по содержанию.
Динамический ряд — это совокупность однородных статистических величин, показывающих изменение какого-либо явления (признака) во времени. Числа, из которых составляется динамический ряд, могут быть представлены абсолютными, средними и относительными величинами. Если динамический ряд состоит из абсолютных величин, то он называется простым, если он составлен из средних или относительных чисел, то такой динамический ряд называется сложным или производным.
Динамические ряды бывают двух видов:
• моментными, состоящими из величин, характеризующих явление на определенный момент времени (на конец года, месяца, декады и т. д.);
• интервальными, состоящими из величин, которые характеризуют явление за определенный промежуток (интервал) времени (за год, месяц и т. п.). |
С целью изучения особенностей изучаемого процесса и достижения наглядности в характеристике рассматриваемого явления рассчитывают специальные показатели динамического ряда, среди которых следует назвать абсолютный прирост, темп прироста (убыли), показатель роста (снижение), показатель наглядности (табл. 3.6).
Абсолютный прирост представляет собой разность между последующим и предыдущим уровнем. Он измеряется в тех же единицах, что и уровни динамического ряда.
Темп прироста (убыли) показывает отношение абсолютного прироста (снижения) каждого последующего уровня к пре
Динамический ряд, как правило, позволяет проследить основную закономерность явления, проявляющуюся в последовательном снижении или увеличении показателей динамического ряда.
Анализ динамического ряда включает в себя вычисление ряда показателей, при необходимости проведение выравнивания и графическое изображение.
1.4.2. Второе свойство статистической совокупности — средний уровень признака в статистической совокупности
В медицине и здравоохранении при анализе, кроме распределения, довольно часто используют средние величины, характеризующие физическое развитие пациентов (рост, масса тела, окружность груди и т. д.), данные их обследования (частота дыхания и пульса, артериальное, внутриглазное и внутричерепное давление и т. д.), результаты анализов (содержание гемоглобина, число эритроцитов, лейкоцитов, СОЭ) и др. В каждой совокупности и в данных конкретных условиях один и 'тот же признак отличается от величины этого же признака в другой совокупности, при наличии других условий. Так, величина пульса, артериального давления, температуры тела, длительность временной нетрудоспособности и другие критерии отличаются (варьируют) даже у больных с одним диагнозом. Иными словами, признаки могут принимать различные числовые значения у разных единиц совокупности, при этом нередко могут повторяться у нескольких единиц наблюдения.
Полученные при исследовании одного и того же признака у единиц наблюдения статистической совокупности абсолютные величины сначала записывают в том порядке, как их получает исследователь, т. е. хаотично.
Каждое числовое значение изучаемого признака называется вариантой (V), а числа, показывающие, как часто повторяются одни и те же варианты, называют частотой (Р).
Ряд вариант одного и того же признака, расположенных в определенном порядке (по степени возрастания или убывания), с соответствующими им частотами, образуют вариационный ряд.
Вариационные ряды бывают простые или несгруппированные, которые составляют, как правило, при малом числе наблюдений (до 30 единиц наблюдения), и сгруппированные, которые составляют при большом числе наблюдений (более 30 единиц наблюдения).
Обобщенной характеристикой вариационного ряда являются средние величины, положительные качества которых заключаются в том, что они характеризуют большую совокупность однородных явлений.
Различают несколько видов средних величин:«Мода, медиана, средняя арифметическая, средняя геометрическая,средняя гармоническая и т. д.
Модой (Мо) называется варианта, встречающаяся с наибольшей частотой.
Медианой(Me) — варианта, которая делит вариационный ряд пополам и расположена в середине вариационного ряда, если ряд нечетный, и если ряд четный, то определяется как полусумма двух средних вариант.
Наиболее часто в характеристике вариационного ряда используют среднюю арифметическую. Средняя арифметическая, которая рассчитана в вариационном ряду, где каждая варианта встречается только 1 раз, называется средней арифметической простой. Ее определяют по формуле:
где М — средняя арифметическая,
V — варианта изучаемого признака,
п — число наблюдений.
Если в исследуемом ряду одна или несколько вариант повторяются несколько раз, то вычисляют среднюю арифметическую взвешенную, когда учитывается вес каждой варианты в зависимости от частоты ее встречаемости. Расчет такой средней проводят по формуле:M =
где М - средняя арифметическая взвешенная,
V - варианты (числовые значения изучаемого признака), р — частота, с которой встречается одна и та же варианта признака, т. е. сумма вариант с данным значением признака,
п - число наблюдений, т. е. сумма всех частот или общее число всех вариант (𝞢р).
Например, при определении среднего пульса у студентов перед экзаменом следует сначала вычислить 𝞢V• р, а затем среднюю величину, которая составила М = 76,9 уд/мин (2000/26) (табл. 5).
Таблица 5
Определение среднего пульса у студентов-мужчин 20-22 лет
Пульс у студентов-мужчин (V) | Число студентов (p) | |
68 69 72 76 77 79 80 84 86 | 1 1 4 5 4 7 1 2 1 𝞢p = n = 26 | 68 69 288 380 308 553 80 168 86 = 2000 |
Нередко при большом числе наблюдений для вычисления средней арифметической взвешенной используют сгруппированный вариационный (или разбитый на равные интервалы) ряд. Такой вариационный ряд должен быть непрерывным, варианты, расположенные в определенном порядке (возрастания или убывания), следуют друг за другом (табл. 6).
При группировке вариационного ряда следует учитывать, что интервал выбирает исследователь, величина интервала зависит от цели и задач исследования.
Число групп в сгруппированном вариационном ряду определяют в зависимости от числа наблюдений. При числе наблюдений от 31 до 100 рекомендуется иметь 5-6 групп, от 101 до 300 - от 6 до 8 групп, от 301 до 1000 наблюдений можно использовать от 10 до 15 групп. Расчет интервала (i) производится по формуле (округление в сторону увеличения):
i =
где i - величина интервала,
Vmax - максимальное значение варианты,
Vmin - минимальное значение варианты.
Таблица 6
Определение среднего роста студентов-мужчин 20-22 лет
Рост студентов-мужчин (V), см. | Центральная варианта группы ( ) | Число студентов (p) | |
160-164 165-169 170174 175-179 180-184 185-189 | 162 167 172 177 182 187 | 4 21 47 68 54 18 𝞢p = n = 212 | 648 3507 8084 12036 9828 3366 |
Расчет средней взвешенной в сгруппированном (или интервальном) ряду требует определения середины интервала, которую вычисляют как полусумму крайних значений группы.
Пример составления сгруппированного вариационного ряда представлен в табл. 6, а расчет средней величины производят по формуле:
Однако при большом числе наблюдений, достаточно протяженном вариационном ряду рекомендуется среднюю взвешенную вычислять по способу моментов (табл. 7).
Таблица 7
Определение среднего роста студентов-мужчин 20-22 лет
Рост студентов-мужчин (V), см. | Центральная варианта группы ( ) | Число студентов (p) | а p | |
160-164 165-169 170174 175-179 180-184 185-189 | 162 167 172 177 182 187 | 4 21 47 68 54 18 𝞢p = n = 212 | -3 -2 -1 0 +1 +2 | -12 -42 -47 0 +54 +36 𝞢а p = -11 |
Этот способ основан на том, что средняя равна любой произвольно (условно) взятой средней (M1) за которую чаще всего принимается мода (Мо), плюс среднее отклонение всех вариант от условно средней (первый момент средней):
,
где М - средняя арифметическая (взвешенная),
А1 - условно взятая средняя величина (наиболее чаще встречающееся величина),
i- величина интервала,
а - отклонение между центральными вариантами групп и условной средней
величиной, выраженное в интервалах ,
р - частота (число раз, с которым встречается одна и та же варианта признака),
п — число наблюдений, т. е. сумма всех частот или общее число всех вариант (𝞢р);
Таким образом, средняя взвешенная, вычисленная по способу моментов, составила 176,74 см, что практически совпало с расчетами средней обычным методом - 176,7 см. Однако при вычислении средней по способу моментов используют простые цифры, вычисления менее громоздки, что значительно облегчает и ускоряет расчеты.
Средняя арифметическая (средняя взвешенная) имеет ряд свойств, которые используют в некоторых случаях для упрощения расчета средней и получения ориентировочной величины.
1. Средняя арифметическая занимает срединное положение в строго
симметричном вариационном ряду (М = Mo= Me).
2. Средняя арифметическая имеет абстрактный характер и является
обобщающей величиной, выявляющей закономерность.
3. Алгебраическая сумма отклонений всех вариант от средней равна нулю.
На этом свойстве основан расчет средней по способу моментов.
4. Если к каждой варианте вариационного ряда прибавить или отнять одно
и то же число, то на столько же увеличится или уменьшится средняя
арифметическая величина.
5. Если каждую варианту разделить или умножить на одно и то же число,
то во столько же раз уменьшится или увеличится средняя
арифметическая.
Два последних свойства используют в тех случаях, когда варианты представлены очень малыми или наоборот большими числами.
В медицине и здравоохранении средними величинами оценивают отдельные показатели (параметры физического развития), сравнивая данные лабораторных и других исследований с нормой. Следует учитывать, что средние рассчитывают на большой однородной группе, поскольку нарушение этого принципа приводит к искажению реальных процессов.
Графическое изображение вариационного ряда может быть представлено в виде графиков симметричного асимметричного распределения в зависимости от числа наблюдений и изучаемого признака.
Дата: 2018-11-18, просмотров: 899.