Предположим, что этап спецификации модели пройден, в результате выдвинута гипотеза о линейной зависимости между объясняющей и объясняемой переменными. В этом случае говорят о простой линейной регрессии, или о линейной регрессионной модели с двумя переменными, которую в общем виде можно представить так:
. (1)
Для того чтобы получить явный вид модели необходимо знать неизвестные параметры этой модели.
Переходим к следующему этапу эконометрического анализа – к параметризации. Рассуждения будем проводить, используя форму представления модели в виде (1).
Построение линейной регрессии сводится к оценке ее параметров – а и b. Определить эти параметры можно различными способами. Как правило, оценка регрессионных коэффициентов эконометрической модели проводится на основе анализа остатков модели . Рассмотрим классический метод оценки параметров, называемый обычным или одношаговым методом наименьших квадратов (1МНК), Ordinary Least Squares, OLS.
Замечание. Применение одношагового метода наименьших квадратов возможно при выполнении некоторых предпосылок, о которых речь пойдет в следующей главе. Там же будет показано, что параметры модели, оцененные с помощью 1МНК являются наиболее эффективными линейными оценками параметров a и b.
При графической интерпретации задача определения параметров модели сводится к отысканию такой прямой, которая как можно "точнее" будет отображать положение точек поля корреляции, т.е., разности между эмпирическими точками и точками построенной прямой (остатками) должны быть минимальными.
| |||
Рис.6. Остатки линии регрессии |
Минимизировать сумму остатков не имеет смысла, так как остатки имеют различные знаки и при суммировании "аннулируют" друг друга и если выбрать в качестве параметра а среднее значение регрессанта ( ), а b принять равной нулю (b=0), то сумма будет автоматически равна своему минимальному значению – нулю. Для того чтобы "нейтрализовать" действие противоположных знаков, в качестве меры адаптации регрессионной модели к эмпирическим данным применяется сумма квадратов остатков (ошибок), error sum of squares, (ESS):
(2)
Запишем необходимые условия экстремума (First Order Conditition, FOC):
; (3)
,
или (4)
После раскрытия скобок получаем стандартную форму нормальных уравнений (индекс суммирования опущен):
(5)
решая систему (3.14) находим оценки параметров модели:
(6)
Параметр можно получить:
(7)
Полученные формулы (3.16)-(3.17) чаще других используют при определении параметров простой линейной эконометрической модели.
Из уравнения (3.17) следует
(8)
или (9)
где средние значения .
Таким образом, прямая линия регрессии проходит через точку средних значений .
Учитывая этот факт, можно воспользоваться и альтернативным способом отыскания параметров модели, основанном на том факте, что линия регрессии проходит через точку средних значений .
Разделим обе части системы уравнений (3.14) на n, получим
(9)
где средние определяются по известным формулам:
Решая систему (3.18), получим:
(10)
(11)
Коэффициент называется выборочным коэффициентом регрессии или просто коэффициентом регрессии у по х. Он показывает, на сколько единиц в среднем изменится переменная у при увеличении переменной х на одну единицу.
Для оценоки точности модели, мерой качества уравнения регрессии и характеристикой прогностической силы анализируемой регрессионной модели используют коэффициент детерминации R2.
Коэффициентом детерминации называется величина
, (3.41)
Величина R2 показывает какая часть вариации регрессанта может быть объяснена вариацией выбранного регрессора и характеризует качество подгонки регрессионной модели к наблюдаемым значениям y. В следующей главе будет показано, что Если , то это означает точную подгонку, между переменными существует линейная связь, все . Если то говорят, что функция регрессии не объясняет ничего. Если , то регрессионное уравнение оценено тем лучше, чем больше при прочих равных условиях R2.
Задача 2. Найти корреляционную зависимость между временем решения наглядно-образных (Х), и вербальных У заданий тестов по данным из задачи 1. Оценить качество модели.
Решение.
Коэффициент корреляции между Х и У высокий ( ). Выдвигаем гипотезу о линейной зависимости между переменными. Уравнение будем искать в виде:
y = a + bx .
Параметры будем находить по формулам:
(6)
(функция НАКЛОН(известные_значения_y;известные_значения_x)
Параметр можно получить:
(7)
(функция ОТРЕЗОК(известные_значения_x;известные_значения_y))
Будем использовать расчетную таблицу из задачи 1
№ испытуемого | Среднее время решение наглядно-образных заданий | Среднее время решение вербальных заданий | XY | X2 | Y2 |
Х | Y | ||||
... | ... | ... | ... | ... | ... |
Сумма | 731 | 525 | 20464 | 27873 | 15805 |
,
.
Уравнение регрессии имеет вид:
y=–14,1+1,1х.
Рассчитаем теоретические значения y и построим полученную прямую на корреляционном поле
Для оценки качества модели рассчитаем коэффициент детерминации:
№ испытуемого | y | |||||
1 | 10 | 6,9 | -19,4 | 375,51 | -16,25 | 264,06 |
2 | 20 | 21,2 | -5,0 | 25,24 | -6,25 | 39,06 |
3 | 17 | 22,3 | -3,9 | 15,36 | -9,25 | 85,56 |
4 | 28 | 34,5 | 8,2 | 67,67 | 1,75 | 3,06 |
5 | 27 | 16,8 | -9,4 | 89,12 | 0,75 | 0,56 |
6 | 31 | 24,5 | -1,7 | 2,93 | 4,75 | 22,56 |
7 | 20 | 29,0 | 2,7 | 7,32 | -6,25 | 39,06 |
8 | 25 | 29,0 | 2,7 | 7,32 | -1,25 | 1,56 |
9 | 35 | 34,5 | 8,2 | 67,67 | 8,75 | 76,56 |
10 | 43 | 34,5 | 8,2 | 67,67 | 16,75 | 280,56 |
11 | 10 | 12,4 | -13,9 | 192,02 | -16,25 | 264,06 |
12 | 28 | 26,7 | 0,5 | 0,25 | 1,75 | 3,06 |
13 | 13 | 17,9 | -8,3 | 69,50 | -13,25 | 175,56 |
14 | 31 | 30,1 | 3,8 | 14,51 | 4,75 | 22,56 |
15 | 40 | 32,3 | 6,0 | 36,21 | 13,75 | 189,06 |
16 | 24 | 21,2 | -5,0 | 25,24 | -2,25 | 5,06 |
17 | 45 | 38,9 | 12,6 | 159,84 | 18,75 | 351,56 |
18 | 26 | 32,3 | 6,0 | 36,21 | -0,25 | 0,06 |
19 | 16 | 22,3 | -3,9 | 15,36 | -10,25 | 105,06 |
20 | 36 | 37,8 | 11,5 | 133,14 | 9,75 | 95,06 |
Сумма | 525 | 525 | 0,00 | 1408,08 | 0,00 | 2023,75 |
Среднее | 26,25 |
|
|
|
|
|
Коэффициент близок к 1, следовательно, модель достаточно точно демонстрирует корреляционную связь между временем решения наглядно-образных (Х), и вербальных (У) заданий тестов и имеет большую прогноститескую силу.
Дата: 2019-03-05, просмотров: 213.