Находится оценка уравнения регрессии вида

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

y*=b₀+b₁x₁+b₂x₂+…+b_jx_j+…+b_kx_k.

Cогласно методу наименьших квадратов вектор оценок коэффициентов регрессии определяется по формуле

b=(X^TX)^-1X^TY ,

где

	1	x₁₁	…	x_1k		y₁		b₀
	.	.		.		.		.
	.	.		.		.		.
X=	1	x_i1	…	x_ik	Y=	y_i	b=	b_j
	.	.		.		.		.
	.	.		.		.		.
	1	x_n1	…	x_nk		y_n		b_k

X^T– транспонированная матрица X; (X^TX)^–1 – матрица, обратная к матрице X^TX.

Оценка ковариационной матрицы коэффициентов регрессии вектора b определяется из выражения

S*(b)=S*²(X^TX)^–¹,

где S*²=(Y-Xb)^T(Y-Xb)/(n-k-1).

Учитывая, что на главной диагонали ковариационной матрицы находятся дисперсии коэффициентов регрессии, имеем

S*²_b_(j–1)= S*²[(X^TX)^–¹]_jj для j=1,2,…,k, k+1.

Значимость уравнения регрессии, т.е. гипотеза H₀: b=0 (b₀=b₁=…=b_k=0), проверяется по F-критерию, наблюдаемое значение которого определяется по формуле

F_набл=(Q_R/(k+1))/(Q_ост/(n-k-1)),

где Q_R=(Xb)^T(Xb), Q_ост=(Y-Xb)^T(Y-Xb).

По таблице F-распределения (Приложение 1) для заданных a, n₁=k+1, n₂=n-k-1 находят F_кр.

Гипотеза H₀ отклоняется с вероятностью a, если F_набл>F_кр. Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии отличен от нуля.

Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотез H₀: b_j=0, где j=1,2,…,k, используют t-критерий и вычисляют t_набл(b_j)=b_j/S*_b_j. По таблице t-распределения (Приложение 1) для заданных a, n=n-k-1 находят t_кр.

Гипотеза H₀ отвергается с вероятностью ошибки a, если êt_наблê>t_кр. Из этого следует, что соответствующий коэффициент регрессии b_j значим, т.е. b_j¹ 0. В противном случае коэффициент регрессии незначим и соответствующая переменная в модель не включается. После этого реализуется алгоритм пошагового регрессионного анализа, состоящий в том, что исключается одна из незначимых переменных, которой соответствует минимальное по абсолютной величине значение t_набл. После этого вновь проводят регрессионный анализ с числом факторов, уменьшенным на единицу. Алгоритм заканчивается получением уравнения регрессии со значимыми коэффициентами.

Для решения задачи требуется:

1. Найти оценку уравнения регрессии вида y=b₀+b₁x₁+b₂x₂.

2. Проверить значимость уравнения регрессии при a=0,05 или a=0,01.

3. Проверить значимость коэффициентов регрессии.

4. Дать экономическую интерпретацию коэффициентам регрессии и оценить адекватность полученной модели по величине абсолютных e_i и относительных d_i отклонений.

5. При необходимости перейти к алгоритму пошагового регрессионного анализа, отбросив один из незначительных коэффициентов регрессии.

6. Построить матрицы парных и частных коэффициентов корреляции.

7. Найти множественные коэффициенты корреляции и детерминации.

8. Проверить значимость частных и множественных коэффициентов корреляции.

9. Провести содержательный экономический анализ полученных результатов.

Пример решения задачи 1

По данным годовых отчетов десяти (n=10) предприятий (табл.4) провести анализ зависимости себестоимости товарной продукции y (млн. р.) от объема валовой продукции x₁ (млн. р.) и производительности труда x₂ (тыс. р. на чел.).

Таблица 4

Исходная информация для анализа и результаты расчета

Исходная информация

Результаты расчета

№ x_i1 x_i2 y_i y*_i (y*_i)² e_i=y_i-y*_i (e_i)² d_i= e_i / y*_i 1 3 1,8 2,1 2,31572 5,36255 -0,21572 0,04653 -0,09315 2 4 1,5 2,8 3,48755 12,16300 -0,68755 0,47273 -0,19714 3 5 1,4 3,2 4,35777 18,99015 -1,15777 1,34043 -0,26568 4 5 1,3 4,5 4,50907 20,33171 -0,00907 0,00008 -0,00201 5 5 1,3 4,8 4,50907 20,33171 0,29093 0,08464 0,064521 6 5 1,5 4,9 4,20647 17,69439 0,69353 0,48098 0,164872 7 6 1,6 5,5 4,77408 22,79184 0,72592 0,52696 0,152054

Окончание табл. 4

	Исходная информация			Результаты расчета
№	x_i1	x_i2	y_i	y*_i	(y*_i)²	e_i=y_i-y*_i	(e_i)²	d_i= e_i / y*_i
8	7	1,2	6,5	6,09821	37,18816	0,40179	0,16144	0,065887
9	15	1,3	12,1	11,6982	136,84905	0,40175	0,16140	0,034343
10	20	1,2	15,0	15,4441	238,52177	-0,44415	0,19727	-0,02876
	Сред. знач.			S=	530,22437	S=	3,47247
	7,5	1,41	6,14
y*_i – значения, вычисленные по уравнению регрессии
e_i – абсолютные ошибки аппроксимации
d_i – относительные ошибки аппроксимации

Решение

1. Определение вектора b оценок коэффициентов

уравнения регрессии

Расчет оценок коэффициентов уравнения регрессии y*=b₀+b₁x₁+b₂x₂ производится по уравнению b=(X^TX)^–1X^TY:

	n	Sx_i1	Sx_i2		10	75	14,1
X^TX =	Sx_i1	Sx²_i1	Sx_i1x_i2	=	75	835	100,4
	Sx_i2	Sx_i1x_i2	Sx²_i2		14,1	100,4	20,21

	Sy_i		61,4		b₀		2,88142
X^TY =	Sx_i1y_i	=	664,5	b =	b₁	=	0,71892
	Sx_i2y_i		82,23		b₂		-1,51303

Таким образом, оценка уравнения регрессии примет вид

y*=2,88142+0,71892x₁-1,51303x₂.

2. Проверка значимости уравнения y*=2,88142+0,71892x₁-1,51303x₂.

а) Q_R=(Xb)^T(Xb)=Sy*_i =530,224365;

б) Q_ост=(Y-Xb)^T(Y-Xb)= Se²_i =3,472465;

в) несмещенная оценка остаточной дисперсии:

S*²= Q_ост/(n-3)=3,472465 / 7 = 0,496066;

г) оценка среднеквадратичного отклонения:

S*= 0,7043195;

д) проверяем на уровне a=0,05 значимость уравнения регрессии, т.е. гипотезу H₀: b=0 (b₀=b₁=b₂=0). Для этого вычисляем

F_набл=(Q_R/(k+1))/(Q_ост/(n-k-1))=(530,224365 / 3))/(3,472465 / 7))=356,32776.

Далее по таблице F-распределения для a=0,05, n₁=k+1=3, n₂=n-k-1=7 находим F_кр=4,35. Так как F_набл>F_кр (356,32776>4,35), то гипотеза H₀ отвергается с вероятностью ошибки 0,05. Т.о. уравнение является значимым.

3. Проверка значимости отдельных коэффициентов регрессии

а) Найдем оценку ковариационной матрицы вектора b:

	5,52259	-0,08136	-3,44878
S(b)=S²(X^TX)^–¹=0,496066(X^TX)^–¹=	-0,08136	0,00267	0,04348
	-3,44878	0,04348	2,21466

Так как на главной диагонали ковариационной матрицы находятся дисперсии коэффициентов уравнения регрессии, то получим следующие несмещенные оценки этих дисперсий:

S*²_b₀=5,52259; S*²_b₁=0,00267; S*²_b₀=2,21466;

S*_b₀=2,35002; S*_b₁=0,05171; S*_b₂=1,48818.

Найдем оценку корреляционной матрицы вектора b. Элементы этой матрицы определяются по формуле:

r_j-1l-1=cov*(b_j-1,b_l-1)/(S*_b_j-1S*_b_l-1),

где cov*(b_j-1,b_l-1) – элементы матрицы S*(b), стоящие на пересечении j-той строки и l -того столбца ( j,l =1,2,3).

Корреляционная матрица вектора b имеет вид:

	1	-0,66955	-0,98614
R*(b)=	-0,66955	1	0,56504
	-0,98614	0,56504	1

Далее, для проверки значимости отдельных коэффициентов регрессии, т.е. гипотез H₀: b_m=0 (m=1,2), по таблицам t-распределения для a=0,05, n=7 находим t_кр=2,365. Вычисляем t_набл для каждого из коэффициентов регрессии по формуле t_набл(b_j)=b_j/S*_b_j:

t_набл(b₁)=b₁/S*_b₁=0,71892/0,05171=13,903

t_набл(b₂)=b₂/S*_b₂=1,51303/1,48818=1,01667.

Так как t_набл(b₁) > t_кр (13,903 > 2,365), t_набл(b₂) < t_кр (1,01667< 2,365), то коэффициент регрессии b₁¹0, а коэффициент регрессии b₂=0. Следовательно переходим к алгоритму пошагового регрессионного анализа.

4. Пошаговый регрессионный анализ

Будем рассматривать оценку нового уравнения регрессии вида

y*=b’₀+b’₁x₁. Вектор оценок b’ определим по формуле b=(X^T ¢ X ¢ )^–1X^T ¢ Y, где

	n	Sx_i1		10	75
X^T¢X¢ =	Sx_i1	Sx²_i1	=	75	835

	Sy_i		61,4		b’₀		0,52534
X^T¢Y¢ =	Sx_iy_i	=	664,5	b¢ =	b’₁	=	0,74861

Таким образом, оценка уравнения регрессии примет вид:

y*=0,52534+0,74861x₁.

Повторив далее вычисления по пп 2 и 3, определяем, что новая оценка уравнения регрессии и его коэффициент значимы при a=0,05.

5. Нахождение матрицы парных коэффициентов корреляции

(на примере без исключения переменной)

а) находим вектор средних:

X _ср=(x₁_ср; x₂_ср; y_ср)=(7,5; 1,41; 6,14);

б) находим вектор среднеквадратических отклонений S=(s₁; s₂; s_y) по формуле s_j=([S(x_ij- x_j_ср)²]/n)^0,5, i=1…n:

S=(5,22; 0,18; 3,91);

в) формируем корреляционную матрицу

	1	r₁₂	r_1y
R=	r₂₁	1	r_2y
	r_y1	r_y2	1

где r₁₂=r₂₁=[(x₁x₂)_ср-x_1срx_2ср]/(s₁s₂), r_yj=r_jy=[(x_jy)_ср-x_jсрy_ср]/(s_js_y):

	1	-0,565	0,997
R=	-0,565	1	-0,612
	0,997	-0,612	1

6. Расчет оценок частных коэффициентов корреляции

Оценки частных коэффициентов корреляции определяются по формулам:

r_12/y=(r₁₂-r_1yr_2y)/[(1-r_1y²)(1-r_2y²)]^0,5=0,738;

r_1y/2=(r_1y-r₁₂r_y2)/[(1-r₁₂²)(1-r_y2²)]^0,5=0,998;

r_2y/1=(r_1y-r₁₂r_y2)/[(1-r₁₂²)(1-r_y2²)]^0,5=-0,762.

Составим матрицу частных коэффициентов корреляции:

1	0,738	0,998
0,738	1	–0,762
0,998	–0,762	1

Следует иметь в виду, что частный коэффициент корреляции может резко отличаться от соответствующего парного коэффициента и даже иметь противоположный знак. Любой из частных коэффициентов может быть равен нулю, в то время, как парный – отличен от нуля.

В данном примере r_12/y=0,738, а r₁₂=-0,565. Такое различие вызвано тесной связью объема валовой продукции (x₁) и себестоимостью товарной продукции (y): r_1y=0,997. В случае независимости величин частный и парный коэффициенты корреляции равны нулю.

7. Проверка значимости парных и частных

коэффициентов корреляции

Проверка осуществляется с помощью таблиц t-распределения Стьюдента.

Для r₁₂: |t_набл|=|(10-2)^0,5(-0,565)/(1-(-0,565)²)^0,5|=1,93683<t_кр_(8;0,05)=2,306; гипотеза H₀: r₁₂=0 принимается с вероятностью ошибки 0,05; отвергается с вероятностью ошибки 0,1 (|t_набл|=1,93683>t_кр_(8;0,1)=1,86).

Для r_2y: |t_набл|=|(10-2)^0,5(-0,612)/(1-(-0,612)²)^0,5|=2,20621<t_кр_(8;0,05)=2,306; гипотеза H₀: r_2y=0 принимается с вероятностью ошибки 0,05; отвергается с вероятностью ошибки 0,1 (|t_набл|=1,93683 > t_кр_(8;0,1)=1,86).

Для r_1y: |t_набл|=|(10-2)^0,50,997/(1-0,997²)^0,5|=36,43263>t_кр_(8;0,05)=2,306; гипотеза H₀: r_1y=0 отвергается с вероятностью ошибки 0,05.

Для r_12/y: |t_набл|=|(n-3)^0,50,738/(1-0,738²)^0,5|=2,893542>t_кр_(7;0,05)=2,365; гипотеза H₀: r_12/y=0 отвергается с вероятностью ошибки 0,05.

Для r_1y/2: |t_набл|=|(n-3)^0,50,998/(1-0,998²)^0,5|=41,77023>t_кр_(7;0,05)=2,365; гипотеза H₀: r_1y/2=0 отвергается с вероятностью ошибки 0,05.

Для r_2y/1: |t_набл|=|(n-3)^0,5(-0,762)/(1-(-0,762)²)^0,5|=3,11324>t_кр_(7;0,05)=2,365; гипотеза H₀: r_2y/1=0 отвергается с вероятностью ошибки 0,05.

8. Расчет оценок множественных коэффициентов

корреляции и детерминации

Оценки множественных коэффициентов корреляции детерминации рассчитываются по формулам:

r_y/12= (r_y1²+ r_y2²+ 2r_y1r_y2r₁₂)/(1-r₁₂²)(1-r_y2²)]^0,5=0,999;

r_y/12² =0,999²=0,997.

9. Проверка значимости множественных коэффициентов

корреляции и детерминации

Проверим гипотезу H₀: r²_y/12=0 по F-критерию. Наблюдаемое значение находится по формуле:

F_набл= [r²_y/12/(k-1)]/[(1-r_y/12)/(n-k)]=[0,997/(3-1)]/[(1-0,997)/(10-3)]=1163.

По таблице F-распределения для a=0,05, n₁=k-1=2, n₂=n-k=7 находим F_кр=4,74. Так как F_набл>F_кр, то гипотеза о равенстве r²_y/12=0 отвергается.

Аналогично осуществляется проверка гипотезы r_y/12=0 (в данном примере опущено).

Тем самым доказана значимость множественного коэффициента корреляции, что говорит о наличии зависимости y от x₁ и x₂, т.е. себестоимость действительно зависит от объема валовой продукции и производительности труда.

Литература к задаче 1

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей.–М.:Финансы и статистика, 1985

2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичной обработки данных.–М.:Финансы и статистика, 1983

3. Львовский Е.Н. Статистические методы построения эмпирических формул.–М.:Высш.шк., 1988.

4. Шепелев И.Г. Математические методы и модели управления в строительстве.–М.:Высшая школа, 1980.

Задача 2

Динамическое программирование

Для увеличения объемов выпуска пользующейся повышенным спросом продукции, изготавливаемой тремя предприятиями, выделены капитальные вложения в объеме 700 млн.руб. Использование i-тым предприятием x_i млн. руб. из указанных средств обеспечивает прирост выпуска продукции, определяемый значением нелинейной функции f_i(x_i).

Найти распределение капитальных вложений между предприятиями, обеспечивающее максимальное увеличение выпус6ка продукции.

Исходные данные приведены в таблицах 5 и 6.

Таблица 5

Исходные данные

Объем кап.вложений x_i, млн.руб.	Прирост выпуска продукции f_i(x_i), млн.руб.
	Предприятие 1	Предприятие 2	Предприятие 3
0	0	0	0
100	а	50	40
200	50	80	d
300	b	90	110
400	110	150	120
500	170	с	180
600	180	210	220
700	210	220	240

Таблица 6

Варианты исходных данных

Вариант	a	b	c	d
1	30	90	190	50
2	20	80	160	70
3	35	100	190	60
4	40	110	180	90
5	30	100	190	60

Окончание табл. 6

Вариант	a	b	c	d
6	35	80	160	70
7	40	80	160	70
8	40	100	190	60
9	30	110	160	90
10	40	110	190	90
11	20	100	190	60
12	20	80	180	60
13	35	110	190	50
14	40	90	160	50
15	30	90	190	90
16	35	90	160	70
17	40	90	190	50
18	20	90	150	90
19	20	80	190	60
20	20	110	160	70
21	40	90	190	60
22	30	110	190	55
23	35	90	180	70
24	45	85	170	90
25	40	85	170	50

В задаче необходимо:

1. Составить рекуррентное соотношение Беллмана в виде функциональных уравнений.

2. Используя рекуррентные соотношения и исходные данные определить сначала условно оптимальные, а затем оптимальные распределения капиталовложений между предприятиями.

Дата: 2019-05-28, просмотров: 293.

⇐ Предыдущая 1 234 5 Следующая ⇒