Разобьем наши данные на три группы. В первую группу войдут данные полученные до лечения. во вторую данные после 2 месяцев лечения а в третью после трех месяцев.
Так как ранее мы уже проводили исследование на проверку распределения выборок то мы можем воспользоваться параметрическим методом дисперсионного анализа для проверки различий средних. Проверка необходима для подтверждения целесообразности разделения данных, если это подтвердится, то затем мы рассчитаем для каждой группы уравнение зависимости ВАШСП и ВАШБП от показателей активности заболевания.
Дисперсионный анализ
Таблица 2.1.1. Зависимость Hb от стадии лечения
Группа
Группа
Группа
124
125
134
124
115
104
110
118
130
93
117
136
133
114
150
129
123
136
149
150
105
122
125
146
145
103
146
124
142
138
99
150
158
125
140
154
137
94
141
156
129
134
148
156
150
138
141
150
144
148
114
133
141
109
145
135
157
121
150
161
126
150
133
128
127
166
120
158
168
150
131
136
123
162
142
150
121
118
160
144
126
139
160
140
152
140
101
146
110
123
142
135
117
137
106
151
148
126
142
130
154
144
152
140
120
126
110
107
118
116
114
140
136
124
166
122
120
128
150
115
165
112
143
124
132
137
130
130
126
160
166
150
168
128
126
114
142
156
170
119
128
163
135
120
120
106
130
156
114
137
142
121
140
121
136
125
138
150
154
127
153
120
171
128
124
130
127
130
138
122
160
104
121
131
127
109
158
132
134
164
После вычислений получаем:
p =0.7913
Запишем выходные данные в таблицу дисперсионного анализа
Таблица №2.1.2. Дисперсионный анализ по одному признаку.
Компонента дисперсии | Сумма квадратов | Степень свободы | Средний квадрат |
Между выборками | 136,7 | 2 | 68,326 |
Остаточная | 51587,5 | 177 | 291,455 |
Полная | 51724,2 | 179 | ----- |
p>p кр
Вывод:
Следовательно мы принимаем нулевую гипотезу, т.е. можно предположить что при 5% уровне значимости уровень гемоглобина в крови не зависит от стадии лечения.
Таблица 2.2.1. Зависимость СОЭ от стадии лечения
Группа |
Группа |
Группа |
18 | 14 | 5 |
19 | 4 | 10 |
42 | 12 | 15 |
66 | 17 | 3 |
25 | 14 | 3 |
10 | 5 | 38 |
13 | 2 | 49 |
28 | 40 | 5 |
3 | 30 | 3 |
26 | 6 | 19 |
28 | 3 | 2 |
38 | 26 | 3 |
28 | 69 | 10 |
1 | 25 | 5 |
52 | 3 | 3 |
48 | 35 | 5 |
26 | 6 | 16 |
14 | 3 | 5 |
12 | 5 | 4 |
48 | 1 | 4 |
19 | 5 | 10 |
28 | 5 | 1 |
25 | 7 | 4 |
6 | 6 | 15 |
11 | 3 | 2 |
26 | 10 | 10 |
2 | 2 | 10 |
51 | 2 | 10 |
24 | 12 | 34 |
13 | 37 | 38 |
6 | 18 | 25 |
10 | 58 | 2 |
2 | 10 | 10 |
30 | 4 | 17 |
2 | 10 | 15 |
3 | 23 | 8 |
46 | 12 | 5 |
56 | 5 | 10 |
3 | 12 | 35 |
11 | 12 | 39 |
4 | 10 |
|
4 | 30 |
|
24 | 24 |
|
11 | 40 |
|
7 | 2 |
|
1 | 2 |
|
7 |
|
|
9 |
|
|
20 |
|
|
34 |
|
|
4 |
|
|
24 |
|
|
1 |
|
|
35 |
|
|
16 |
|
|
1 |
|
|
36 |
|
|
22 |
|
|
34 |
|
|
50 |
|
|
28 |
|
|
14 |
|
|
64 |
|
|
30 |
|
|
9 |
|
|
32 |
|
|
10 |
|
|
21 |
|
|
3 |
|
|
7 |
|
|
22 |
|
|
26 |
|
|
12 |
|
|
6 |
|
|
1 |
|
|
18 |
|
|
1 |
|
|
2 |
|
|
10 |
|
|
26 |
|
|
6 |
|
|
4 |
|
|
12 |
|
|
25 |
|
|
4 |
|
|
40 |
|
|
52 |
|
|
18 |
|
|
62 |
|
|
40 |
|
|
7 |
|
|
5 |
|
|
3 |
|
|
8 |
|
|
После вычислений получаем:
p = 0.0219
Запишем выходные данные в таблицу дисперсионного анализа
Таблица №2.2.2. Дисперсионный анализ по одному признаку.
Компонента дисперсии | Сумма квадратов | Степень свободы | Средний квадрат |
Между выборками | 136,7 | 2 | 68,326 |
Остаточная | 51587,5 | 177 | 291,455 |
Полная | 51724,2 | 179 | ----- |
p<p кр
Вывод:
Следовательно мы отвергаем нулевую гипотезу, т.е. можно предположить что при 5% уровне значимости СОЭ зависит от стадии лечения. Используя функцию multcompare, целесообразно определить для какой пары выборок средние арифметические значения имеют статистически значимое различие. Для проверки такой параметрической гипотезы используется процедура множественного сравнения. При проверке простой параметрической гипотезы (нулевой гипотезы) о равенстве средних одной группы выборок по отношению к другой по статистике t необходимо задать уровень значимости , определяющий критическое значение статистики
. Примем
равным 0,05. Это означает, что в 5% случаев будет неверно отвергнута нулевая гипотеза.
При увеличении групп выборок, увеличивается число проверяемых гипотез.
При использовании простой параметрической гипотезы по статистике t, уровень значимости будет применяться к каждой гипотезе отдельно, что повлечет к росту вероятности неверно отвергнуть нулевую гипотезу пропорционально количеству выполненных проверок. Т.е., неверно определить значимое отличие выборочных средних. Процедура множественного сравнения обеспечивает заданный уровень значимости для каждой проверки.
Выходной параметр с представляет результаты множественного сравнения в виде матрицы из 5 столбцов. Срока матрицы с соответствуют результатам проверки одной параметрической гипотезы. Таким образом, каждая строка с соответствует одной паре выборок. Первые два значения в строке с показывают номера сравниваемых выборок, пятый - величину разности средних арифметических сравниваемых выборок, четвертый и третий столбцы - 95% доверительный интервал полученной разности средних арифметических.
Таблица 2.2.3 Различия между средними для СОЭ
№ группы | № группы | Дата: 2019-07-30, просмотров: 207. |