Коррелиционно-регрессионный анализ
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Данный многофакторный анализ занимает центральное место в моделировании. Многофакторные модели служат основным средством прогнозирования экономических результативных признаков, а также средство оценки роли каждого отдельного фактора в объяснении вариации результативных признаков.

Для многофакторного анализа и моделирования необходимо прежде всего необходимо соблюдения некоторых условий: достаточной численности совокупности (выборки), близости распределения ее по результативному и по всем факторным признакам к нормальному закону распределения, соблюдение гомоскедастичности.

 

Имеем исходные данные задачи.

 

год Всего безработных, Y  мужчин, Х1  женщин, Х2 Время, X3=t

1995

6712

3616

3096

1

1996

6732

3662

3070

2

1997

8058

4371

3687

3

1998

8902

4792

4110

4

1999

9094

4801

4293

5

2000

6999

3781

3219

6

2001

6303

3411

2893

7

2002

6268

3385

2883

8

2003

5951

3148

2803

9

2004

6116

3076

3040

10

 


Теперь рассмотрим систему показателей тесноты - построим корреляционную матрицу.

 

 

Y

X1

X2

X3

Y

1,00

0,99

0,99

-0,47

X1

0,99

1,00

0,96

-0,54

X2

0,99

0,96

1,00

-0,38

X3

-0,47

-0,54

-0,38

1,00

 

Особенностью многофакторной системы является недопустимость слишком тесной связи между факторными признаками. Это условие часто именуется проблемой коллинеарности факторов. Коллинеарность означает достаточно тесную неслучайною линейную корреляцию одних факторов с другими. Часто рекомендуют исключать фактор, связанный с другим фактором при . Так же есть рекомендации исключать фактор уже при . Мы будем придерживаться варианта не более 0,7.

Из матрицы видно, что факторы Y, X1, X2 сильно коррелируют между собой. Фактор X3 слабо влияет на все остальные, поэтому его сразу можно исключить.

Оставляем факторы Y и X1.

Также для сравнения рассчитаем подобную корелляционую матрицу, но через относительные поазатели.

 

год Всего безработных, Y  мужчин, Х1  женщин, Х2 Время, X3=t

1995

8,81165

8,193124

8,03786623

0

1996

8,81463

8,205765

8,02943284

0,69314718

1997

8,99442

8,382747

8,2125684

1,09861229

1998

9,09403

8,474703

8,32117831

1,38629436

1999

9,11537

8,47658

8,36474107

1,60943791

2000

8,85352

8,237744

8,07682603

1,79175947

2001

8,74878

8,134761

7,9700493

1,94591015

2002

8,74321

8,127109

7,9665867

2,07944154

2003

8,69131

8,054523

7,93844555

2,19722458

2004

8,71866

8,031385

8,01961279

2,30258509

 

 

Y

X1

X2

X3

Y

1,00

0,99

0,99

-0,29

X1

0,99

1,00

0,95

-0,35

X2

0,99

0,95

1,00

-0,21

X3

-0,29

-0,35

-0,21

1,00

 

Зависимость коэффициентов уменьшилась по сравнению с предыдущей матрицей, но общая зависимость факторов практически не изменилась.

Прежде чем начать анализ, построим график зависимости Y и X1, а также проведем тренд:

 

 

Из графика видно, что между экономическими явлениями существует нелинейное соотношение. Таким образом она выражена с помощью нелинейной регрессии, следующим полиномом:


y = a + b*x + c*x2

 

Для нашей параболы второй степени заменяем переменные x=x1, x2=x2, и получаем двухмерное уравнение линейной регрессии:

 

y = a + b*x1 + c*x2

 

Для оценки параметров линейной множественной регрессии используем метод наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии.

Согласно МНК неизвестные параметры a,b и c получают таким образом, чтобы сумма квадратов отклонений фактических значений y от значений yр, найденных по уравнению регрессии, была минимальной:

 

 

Чтобы найти минимум функции, надо вычислить частные производные по каждому из параметров a,b и c и приравнять их к нулю, тогда:

 

 

В результате преобразования получим следующую систему нормальных уравнений для оценки параметров a, b и с:

 

t

y x1

y*x1

(x1)^2

x1*x2

(x1)^4

(x1^2)*Y

1

6712

3616

24270592

13075456

47280848896

170967549607936

87762460672

2

6732

3662

24652584

13410244

49108313528

179834644139536

90277762608

3

8058

4371

35221518

19105641

83510756811

365025518020881

153953255178

4

8902

4792

42658384

22963264

110039961088

527311493533696

204418976128

5

9094

4801

43660294

23049601

110661134401

531284106259201

209613071494

6

6999

3781

26463219

14295961

54053028541

204374500913521

100057431039

7

6303

3411

21499533

11634921

39686715531

135371386676241

73334907063

8

6268

3385

21217180

11458225

38786091625

131290920150625

71820154300

9

5951

3148

18733748

9909904

31196377792

98206197289216

58973838704

10

6116

3076

18812816

9461776

29104422976

89525205074176

57868222016

Сумма

71135

38043

277189868

148364993

593427651189

2433191521665030

1108080079202

 

Получим систему:

 

yр = 6368,97 - 1,34665*x + 0,0004x2

 

Посчитаем Yр. Сумма полученных отклонений расчетных значений от фактических должна быть равна 0.

 

x1

y(р)

Y

y-y(р)

(x1)^2

3616

6670,61

6712

41,39

45050944

3662

6741,07

6732

-9,07

45319824

4371

8038,73

8058

19,27

64931364

4792

8997,42

8902

-95,42

79245604

4801

9019,45

9094

74,55

82700836

3781

6931,10

6999

67,90

48986001

3411

6376,96

6303

-73,96

39727809

3385

6342,10

6268

-74,10

39287824

3148

6048,92

5951

-97,92

35414401

3076

5968,65

6116

147,35

37405456

Сумма полученных отклонений

0,000

 

 



Дата: 2019-07-30, просмотров: 225.