Лабораторная работа 10. Построение модели регрессии при наличии  гетероскедастичности и автокорреляции
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

При построении эконометрических моделей часто сталкиваются с таким явлением, как гетероскедастичность. Гетероскедастичность - это непостоянство отклонений фактических значений от расчетных, т.е. непостоянство дисперсий отклонений. Разберем сущность данного явления на конкретных примерах.

С целью изучения влияния минеральных удобрений на урожайность зерновых культур нами была собрана соответствующая информация по 25 предприятиям региона.

Таблица – Дозы минеральных удобрений и урожайность зерновых культур

Доза удобрений, кг д.в./га Урожайность зерновых, ц/га Доза удобрений, кг д.в./га Урожайность зерновых, ц/га
1 55 32 14 84 34
2 110 65 15 115 61
3 58 37 16 87 45
4 103 36 17 93 52
5 100 52 18 105 34
6 77 42 19 125 38
7 95 33 20 122 67
8 54 25 21 109 45
9 75 28 22 118 43
10 119 40 23 130 40
11 103 59 24 127 70
12 62 33 25 88 32
13 65 32      

Построим регрессию. В окне регрессии установите флажок вывод графика.

В результате расчетов получена линейная эконометрическая модель вида:

Yx = 12,0 + 0,33X, где

Х – доза минеральных удобрений, кг действующего вещества на 1 га;

Yx – ожидаемая урожайность зерновых культур, ц/га.

Вышеприведенное уравнение регрессии не отличается очень высоким качеством (коэффициент детерминации  R2 = 0,37).

На основании фактической информации, приведенной в таблице, изобразим поле корреляции и построим график эконометрической модели.

 

 

Из рисунка видно, что точки корреляционного поля расположены по обе стороны от расчетного уравнения регрессии. При этом абсолютные величины отклонений фактических значений результативного показателя от его расчетных значений нельзя считать постоянными. При небольших дозах минеральных удобрений изучаемые отклонения являются относительно небольшими (хотя и разными по модулю). Однако по мере роста факторного признака наблюдается увеличение размаха отклонений фактической урожайности от расчетной. Проявление гетероскедастичности может быть в самых различных формах. Нами был рассмотрен только один из множества возможных вариантов. Отсутствие гетероскедастичности свидетельствует о наличии гомоскедастичности.

Если отклонения фактических значений результативного показателя от линии уравнения регрессии находятся в определенных границах то в этом случае говорят об отсутствии гетероскедастичности. Каждое конкретное отклонение может быть большим или меньшим, положительным или отрицательным, но все отклонения заключены в некотором не очень широком ”коридоре”.

Гетероскедастичность может привести ко многим негативным последствиям. В частности, выводы, сделанные на основе характеристик эконометрических моделей, будут необъективными. Как следствие этого, анализ и прогноз развития экономической системы дадут во многом искаженные результаты.

Данную проблему приходиться решать после построения эконометрической модели. Наиболее хорошие результаты дает графический анализ отклонений и тест ранговой корреляции Спирмена.

Графический анализ отклонений позволяет наглядно отразить наличие гетероскедастичности. При использовании данного теста необходимо предварительно найти отклонения фактических значений результативного показателя от его расчетных значений, а затем полученные разности возвести в квадрат. Иными словами, необходимо использовать несложную формулу:

 

где yi и - фактические и расчетные значения результативного показателя, соответственно. После этого по оси абсцисс откладываются значения факторной переменной X, а по оси ординат – квадраты отклонений ei2.

Если квадраты отклонений ei2 возрастают по мере увеличения значений факторного признака Хi.- это свидетельствует о высокой вероятности наличия гетероскедастичности.

Графический анализ отклонений является удобным и достаточно эффективным в случае парной регрессии. Если проводится множественный регрессионный анализ, то необходимо построить соответствующие графики для каждой из независимых переменных. Однако в таких ситуациях лучше поступить иначе. Не стоит рассматривать несколько графиков, что требует больших затрат времени. Вместо независимых переменных по оси абсцисс нужно отложить расчетные значения результативного показателя. Тем самым, можно определить наличие или отсутствие гетероскедастичности на основании одного графика (даже если мы рассматриваем многофакторную эконометрическую модель).

Тест ранговой корреляции Спирмена.

При использовании данного теста предполагается, что величина отклонения ei будет либо повышаться, либо уменьшаться по мере увеличения значений факторной переменной. Отмеченная выше закономерность позволяет сделать вывод, что абсолютные величины отклонений ei и значения факторного признака xi будут коррелированны, т.е. взаимосвязаны между собой. Для оценки силы связи следует рассчитать коэффициент ранговой корреляции Спирмена:

 

, где

 

di – разность между рангами xi и ei;

n – число опытов.

Рассмотрим фрагмент таблицы, в которой рассчитываются значения di.

Внесем в таблицу столбец |ei| и заполним его данными используя функцию ABS(ei)

 

Таблица – Расчет разности между рангами

xi

yi

|ei|

Ранг

xi |ei|
1 55 32 2,09 2 3
2 110 65 17,16 18 25
3 58 37 6,11 3 9
4 103 36 9,55 14,5 14
25 88 32 8.67 10 13

 

Для расчета рангов переменных xi и |ei| воспользуемся функцией ранг.св(), установив значения параметров адрес первой ячейки столбца xi ; абсолютные адреса ячеек всего просматриваемого массива xi ; 1 константа определяющая порядок сортировки

Для расчета суммы разности квадратов между рангами , воспользуемся функцией СУММКВРАЗН() , параметры столбцы рангов xi и еi получим число 539,5

Вычислим коэффициент ранговой корреляции Спирмена

 

 

Полученное значение превышает 0,7 и поэтому можно сделать вывод о наличии гетероскедастичности в рассматриваемом примере.

При обнаружении гетероскедастичности возникает необходимость преобразования эконометрической модели с целью устранения данного недостатка. Для смягчения гетероскедастичности часто применяется метод взвешенных наименьших квадратов. При этом для каждого опыта, наблюдения необходимо знать отклонения фактических значений результативного показателя от его расчетных значений. Обозначим данное отклонение через σi = |ei|.

Метод взвешенных наименьших квадратов включает два этапа. Сначала (первый этап) все значения результативного и факторного показателей делятся на соответствующую величину σi ( . Кроме того, для каждого опыта необходимо рассчитать значения

Расчеты, характерные для первого этапа, приведены в следующей таблице.

Таблица – Преобразование исходных данных в целях уменьшения гетероскедастичности

xi yi
1 55 32 0,480 26,374 15,345
2 110 65 0,058 6,409 3,787
3 58 37 0,164 9,496 6,058
4 103 36 0,105 10,780 3,768
25 88 32 0,115 10,153 3,692

 

Выполненные преобразования позволяют уменьшить значимость тех опытов, которые характеризуются высокими отклонениями расчетных значений от фактических. Напротив, если абсолютная разность между фактическим и расчетным значением результативного показателя относительно невелика, то соответствующему опыту придается большая значимость.

На втором этапе с помощью программы ”Регрессия” определим параметры двухфакторной модели вида:

В результате вычислений получена следующая эконометрическая модель:

Для нового уравнения регрессии коэффициент детерминации  R2 почти равен единице. При использовании вышерассмотренной методики свободный член эконометрической модели будет всегда практически равен нулю. Таким образом, для устранения гетероскедастичности вместо линейного однофакторного уравнения регрессии рассчитали параметры двухфакторной эконометрической модели без свободного члена. Заметим, что коэффициент регрессии при факторной переменной снизился с 0,33 до 0,27. Это произошло вследствие того, что нами была уменьшена значимость опытов с высокими отклонениями ei.

Автокорреляция это ситуация, когда наблюдаемые в данный момент значения зависимой переменной коррелируют с их значениями в предыдущие моменты времени, т. е. наблюдается корреляция между возмущениями в разные моменты времени.

Различают временную и пространственную автокорреляцию. Временная автокорреляция представляет собой корреляцию между показателями, которые упорядочены во времени (временные ряды). Соответственно, пространственная автокорреляция может встретиться в случаях, когда исходная информация за небольшой отрезок времени размещена в табличной форме с учетом определенных условий.

Сущность временной автокорреляции поясним на основе следующего примера. Пусть изучается объем продажи мороженного в магазине (тыс.денежных единиц) на протяжении года. Исходная информация приведена в таблице 1.

Таблица 1 – Спрос на мороженное в течение года, тыс. денежных единиц

Месяцы январь февраль март апрель май июнь июль август сентябрь октябрь ноябрь декабрь
Продажа продукции,.   25   32   37   40   49   55   52   44   41   38   35   32

 

С помощью программы ”Регрессия” была рассчитана трендовая линейная модель Yt = 37,77 + 0,34t, где

t – номер месяца (для января t = 1);

Yt – ожидаемая продажа продукции за месяц t, денежных единиц.

Коэффициент детерминации  данной модели составляет 0,014.

Проверьте.

На координатной плоскости изобразим корреляционное поле и график полученного уравнения регрессии.

 

Из рисунка видно, что фактические точки наблюдений в первые три месяца находятся ниже линии уравнения регрессии. В период с апреля по сентябрь наблюдается противоположная тенденция, а именно, точки корреляционного поля расположены выше прямой линии. Наконец, в последние 3 месяца года точки снова опускаются ниже линии уравнения регрессии.

Анализ показывает, что между отклонениями ei существует определенная закономерность. Иными словами, в данном случае присутствует автокорреляция.

При изучении экономических процессов и явлений встречается положительная и отрицательная автокорреляция. Положительная автокорреляция означает, что за отрицательным отклонением следует положительное и наоборот.

К основным причинам, которые вызывают появление автокорреляции следует отнести ошибки спецификации, инертность экономических показателей, эффект паутины и сглаживание исходных данных.

Ошибки спецификации. Неправильный выбор формы связи между факторным и результативным показателями часто приводит к появлению автокорреляции. Если вернуться к рисунку то очевидно, что в этом случае параболическая зависимость более адекватно отражает изучаемый экономический процесс. Поэтому расчет параметров параболы и последующее использование этой линии для анализа экономических явлений позволит существенно снизить влияние автокорреляции и, соответственно, повысить качество эконометрической модели.

Инертность экономических показателей. Многие экономические показатели обладают определенной цикличностью. Известно, что экономический цикл – это динамическая характеристика экономики, включающая периодические взлеты и падения в развитии экономической системы.

Обычно выделяют 4 фазы экономического цикла: оживление, бум, спад, подъем. Понятно, что переход от одного цикла к последующему не может произойти мгновенно. Иными словами, динамика развития экономической системы обладает определенной инертностью.

Эффект паутины. Очень часто производственно-экономические показатели реагируют на изменение внешних условий с запаздыванием. Например, увеличение цены на зерно в начале года не приведет сразу же к улучшению финансового состояния сельскохозяйственного предприятия. Должно пройти определенное время, чтобы созрел урожай и продукция была реализована по новым ценам.

Сглаживание исходных данных. В некоторых случаях данные по некоторому достаточно продолжительному интервалу времени получают усреднением данных по отдельным подынтервалам. Это приводит к определенному уменьшению колебаний внутри изучаемого периода и может вызвать автокорреляцию.

Автокорреляция имеет несколько негативных моментов. Данное явление, прежде всего, снижает качество эконометрической модели. В некоторых случаях характеристики полученного уравнения регрессии будут завышенными и, следовательно, использование таких эконометрических моделей для анализа и прогнозирования экономики даст нам искаженные результаты.

Методы определения автокорреляции могут быть использованы только после расчета параметров эконометрической модели и отклонений ei.

Графический метод.

При использовании графического метода по оси абсцисс откладываются либо время получения данных, либо порядковый номер наблюдения. Ось ординат, в свою очередь, служит для указания отклонений ei. Анализ отклонений показывает отсутствие или наличие связи между отклонениями и, следовательно, в этом случае вероятность наличия или отсутствия автокорреляции. Графический метод не всегда может дать однозначный ответ на вопрос о наличии автокорреляции и её направлении.

Критерий Дарбина-Уотсона (DW).

Общая схема критерия Дарбина-Уотсона состоит в следующем.

1. Строится уравнение регрессии и определяются отклонения для каждого наблюдения, общее количество которых составляет T.

2. Рассчитывается критерий DW по формуле:

       На примере информации из таблицы 1 покажем методику расчета рассматриваемого критерия.

            Таблица 3 – Схема расчета критерия Дарбина-Уотсона

t yt et et2 (et – et-1)2
1 25 38,115 -13,115 171,9 44,36
2 32 38,458 -6,458 41,6 21,72
3 37 38,801 -1,801 3,2 7,08
4 40 39,143 0,857 0,8 75,00
5 49 39,486 9,514 90,8 32,04
6 55 39,829 15,171 230,7 11,16
7 52 40,171 11,829 140,4 69,56
8 44 40,514 3,486 12,3 11,16
9 41 40,857 0,143 0,0 11,16
10 38 41,199 -3,199 10,0 11,16
11 35 41,542 -6,542 42,4 11,16
12 32 41,885 -9,885 97,0  
      Итого: 841,1 305,51

 

            Расчетные значения были определены на основании уравнения регрессии =37,77 + 0,34t.

Значения столбца et-1 получаются путем перемещения значений колонки et на один уровень вниз. Из этого следует, что при заполнении столбца et-1 первое значение теряется.

            После заполнения таблицы и нахождения соответствующих сумм легко рассчитать критерий Дарбина-Уотсона:

3. На заключительном этапе анализа необходимо сравнить фактическое значение критерия Дарбина-Уотсона с табличными данными. Существуют специальные таблицы определения критических точек для распределения Дарбина-Уотсона. С помощью этих таблиц можно определить критические точки d1 и d2 при требуемом уровне значимости (например, 0,05). Конкретные значения d1 и du зависят от количества наблюдений (опытов) n, а также от числа факторных переменных эконометрической модели m. В нашем примере значения d1 и du2 составляют 0,971 и 1,331, соответственно (n=12; m=1; уровень значимости принят равным 0,05).

При сравнении фактических и расчетных значений критерия Дарбина-Уотсона можно сделать вывод о наличии автокорреляции и её направленности. Для этого следует руководствоваться следующими правилами:

0 ≤ DW < d1 – существует положительная автокорреляция;

d1 ≤ DW < d2 – невозможно сделать вывод о наличии автокорреляции;

d2  ≤ DW < 4 – d2 – автокорреляция отсутствует;

4 – d2 ≤ DW < 4 – d1 - невозможно сделать вывод о наличии автокорреляции;

4 – d1 ≤ DW < 4 – существует отрицательная автокорреляция.

d1 d2  значение статистики Дарбина-Уотсона. Приложение 3

Таким образом, выполняется первое неравенство: 0 ≤ DW=0,364 < d1=0,971 и это подтверждает факт наличия положительной автокорреляции в нашем примере.

 

 

Можно воспользоваться более грубым способом

DW близко к нулю  существует положительная автокорреляция;

DW близко к двум  автокорреляция отсутствует;

DW близко к 4 – существует отрицательная автокорреляция

Автокорреляция, как указывалось ранее, представляет собой негативное явление, которое ухудшает качество эконометрических моделей. Поэтому, необходимо знать и уметь применять на практике различные способы смягчения автокорреляции. Чаще всего автокорреляция вызывается неправильной спецификацией модели. Следовательно, для уменьшения автокорреляции необходимо попытаться изменить форму эконометрической модели.

Иногда автокорреляция связана с отсутствием в модели какого-нибудь важного фактора. Поэтому, необходимо данный фактор (или несколько факторных переменных) включить в уравнение регрессии. Однако, если уменьшить автокорреляцию наиболее очевидными методами не получается, то данное явление обусловлено какими-то внутренними особенностями исходных данных.

Дата: 2018-12-21, просмотров: 258.