Задача 1 составлена по теме «Однофакторная линейная регрессионная модель» и предполагает построение и анализ уравнения парной линейной регрессии.
Цель работы: проверка умения решать основные типы задач по парному регрессионному анализу.
Типы задач, включаемых в контрольную работу:
Для того чтобы приступить к выполнению задачи №1, определите причинную зависимость результативного признака (его вариации) от вариации факторного признак, т.е. определите, какой из данных показателей является фактором, а какой результатом.
Например. Расходы на питание — это переменная , а душевой доход — переменная . Здесь ясно, какой признак выступает как независимая переменная (фактор), а какой как зависимая переменная (результат).
Данные выборки. Табл. 1
№ группы | Расход на питание (руб.) ( ) | Душевой доход (руб.) ( ) |
1 | 43 | 62 |
2 | 61 | 157 |
3 | 90 | 265 |
4 | 111 | 370 |
5 | 130 | 479 |
6 | 148 | 592 |
7 | 1 64 | 728 |
8 | 191 | 935 |
9 | 241 | 980 |
Пункт 1 первой задачи связан с использованием графического метода. Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X. Совокупность точек результативного и факторного признаков называется полем корреляции (рис. 1).
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями доходов X и расходами Y на питание носит линейный характер и имеет вид . Здесь e.- случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
§ Невключение в регрессионную модель значимых объясняющих переменных;
§ Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
§ Неправильное описание структуры модели;
§ Неправильная функциональная спецификация;
§ Ошибки измерения.
Так как отклонения ei для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то
1) по наблюдениям xi и yi можно получить только оценки параметров a и b;
2) Оценками параметров a и b регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид yi =а + bxi+ ei, где ei – наблюдаемые значения (оценки) ошибок ei, , а и b соответственно оценки параметров a и b регрессионной модели, которые следует найти.
Рис. 1. Поле корреляции
Постройте поле корреляции и сделайте выводы о направлении и характере связи, выявите форму воздействия фактора X на результат Y.
В Пункте 2 необходимо найти оценки неизвестных параметров уравнения регрессии и дать им экономическую интерпретацию.
Для оценки параметров a и b - используют МНК (метод наименьших квадратов). Суть этого метода состоит в следующем.
Если имеется некоторая совокупность n точек наблюдений - выборочных данных, , то можно попытаться провести такую прямую линию, которая является наилучшей в определенном смысле среди всех прямых линий, то есть ближайшей к точкам наблюдений по их совокупности.
Обычно в качестве критерия близости используется минимум суммы квадратов разностей наблюдений зависимой переменной yi и рассчитанных по уравнению регрессии значений :
Здесь yi и xi – известные данные наблюдений, a и b неизвестные коэффициенты линии регрессии. Поскольку функция Q непрерывна, выпукла и ограничена снизу нулем, она имеет минимум.
Требуется найти неизвестные коэффициенты a, b, которые минимизируют отклонение расчетных значений от наблюдаемых.
Минимум этого выражения достигается, когда частные производные функции Q по коэффициентам a, b равны нулю. Коэффициенты a, b найдем, решая систему уравнений вида
Проведя ряд преобразований, построим итоговую систему, которая носит название системы нормальных уравнений:
Суммирование ведется по n наблюдениям. В примере n=9.
Дата: 2019-02-02, просмотров: 423.