Тема 7. Прогнозирование с помощью парной и множественной регрессии
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Линейная модель парной регрессии. Показатели качества модели

Изучите пример решения задачи при помощи инструментов MS Excel.

Пример. По территориям региона приводятся данные за 20ХX г.

 

 

Требуется:

1. Построить линейное уравнение парной регрессии У по Х .

2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации.

3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F - критерия Фишера и t -критерия Стьюдента.

4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня.

Решение типовой задачи в MS Excel C помощью инструмента анализа данных Регрессия можно получить результаты регрессионной статистики, дисперсионного анализа, доверительных интервалов, остатки и графики подбора линии регрессии. Если в меню сервис еще нет команды Анализ данных, то необходимо сделать следующее. В главном меню последовательно выбираем Данные → Контекстное меню на ленте → Настройка лент ы → Надстройки → Перейти и устанавливаем «флажок» в строке Пакет анализа (рис. 2.8):

 

Рис. 2.8

 

Далее следуем по следующему плану.

1.После ввода исходных данных выбираем Данные →Анализ данных→Регрессия.

2. Заполняем диалоговое окно ввода данных и параметров вывода (рис. 2.9):

Рис. 2.9

 

Здесь: Входной интервал Y – диапазон, содержащий данные объясняемой переменной;

Входной интервал X – диапазон, содержащий данные объясняющей переменной;

Метки – «флажок», который указывает, содержит ли первая строка названия столбцов;

Константа – ноль – «флажок», указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист – можно указать произвольное имя нового листа (или не указывать, тогда результаты выводятся на вновь созданный лист).

Получаем следующие результаты для рассмотренного выше примера:

Рис. 2.10

 

Описание первой таблицы:

Множественный R – коэффициент множественной корреляции.

R-квадрат – коэффициент детерминации.

Нормированный R-квадрат – скорректированный коэффициент детерминации.

Стандартная ошибка – среднее квадратическое отклонение.

 

Описание второй таблицы

 

Описание третьей таблицы

Данные первой строки относятся к свободному члену уравнения регрессии b0. Данные второй строки относятся к коэффициенту уравнения регрессии b1. Данные третьей строки относятся к коэффициенту уравнения регрессии b2 . И так далее в зависимости от количества объясняющихпременных.

Столбцы таблицы:

Первый столбец – названия коэффициентов.

Второй столбец значения коэффициентов уравнения регрессии.

Третий столбец – стандартная ошибка коэффициента уравнения регрессии (среднее квадратическое отклонение).

Четвертый столбец - t-статистика для соответствующего коэффициента уравнения регрессии.

 

Из таблиц выписываем, округляя до 4 знаков после запятой и переходя к нашим обозначениям:

Уравнение регрессии:

Коэффициент корреляции 0.7210

Коэффициент детерминации: 0.5199 .

Фактическое значение F -критерия Фишера: F =10,8280

Фактические значения t -критерия Стьюдента:

tb1=3,1793, tb2 =3,2906.

Решить задачи в Excel. Оформить лабораторную работу.

1. Имеются следующие данные об уровне механизации работ Х (%) и производительности труда У (т/ч) для четырнадцати однотипных предприятий:

 

хi 32 30 36 40 41 47 56 54 60 55 61 67 69 76
yi 20 24 28 30 31 33 34 37 38 40 41 43 45 48

 

а) Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции.

б) Найти уравнение регрессии У по Х.

2. По территориям Калининградской области за 2015 год известны значения двух признаков:

 

Район Расходы на покупку продовольственных товаров в общих расходах, % (у) Среднедневная заработная плата одного работающего, руб. (х)
Калининград 68,8 45,1
Гурьевский 61,2 59,0
Зеленоградский 59,9 57,2
Советский 56,7 61,8
Светлогорский 55,0 58,8
Нестеровский 54,3 47,2
Балтийский 49,3 55,2

 

Найдите уравнение регрессии У по Х и оцените тесноту и направление связи между переменными с помощью коэффициента корреляции.

3. Имеются данные за 10 лет по прибылям Х и У (в % к предыдущему году) двух компаний:

 

Х 19,2 15,8 12,5 10,3 5,7 -5,8 -3,5 5,2 7,3 6,7
У 20,1 18,0 10,3 12,5 6,0 -6,8 -2,8 3,0 8,5 8,0

 

Постройте регрессионную модель У по Х.

Оцените тесноту и направление связи.

4. Решить свой вариант индивидуального задания. Вариант выбирается по номеру в списке журнала.

 

 


Линейная модель множественной регрессии. Показатели качества регрессии

 

Пример. По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов 1 x (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих 2 x (%).

 

Номер предприятия y x1 x2 Номер предприятия y x1 x2
1 7,0 3,9 10,0 11 9,0 6,0 21,0
2 7,0 3,9 14,0 12 11,0 6,4 22,0
3 7,0 3,7 15,0 13 9,0 6,8 22,0
4 7,0 4,0 16,0 14 11,0 7,2 25,0
5 7,0 3,8 17,0 15 12,0 8,0 28,0
6 7,0 4,8 19,0 16 12,0 8,2 29,0
7 8,0 5,4 19,0 17 12,0 8,1 30,0
8 8,0 4,4 20,0 18 12,0 8,5 31,0
9 8,0 5,3 20,0 19 14,0 9,6 32,0
10 10, 6,8 20,0 20 14,0 9,0 36,0

 

Требуется:

1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4. С помощью F -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации. С помощью t -критерия оценить статистическую значимость коэффициентов уравнения регрессии.

Решение типовой задачи в MS Excel

Вносим исходные данные в таблицу MS Excel (рис. 2.11)

Рис.2.11

 

Найдем матрицу парных коэффициентов корреляции (Данные→Анализ данных→Корреляция) (рис. 2.12):

Рис. 2.12

 

Получаем следующий результат:

 

C помощью инструмента анализа данных Регрессия (Данные →Анализ данных → Регрессия) получаем следующие результаты (рис. 2.13).

Откуда выписываем, округляя до 4 знаков после запятой и переходя к нашим обозначениям:

Уравнение регрессии:

Множественные коэффициент корреляции 0.9731

Коэффициент детерминации: 0.9469.

Скорректированный коэффициент детерминации: 0,9407.

Фактическое значение F -критерия Фишера: F =151,653

Фактические значения t -критерия Стьюдента:

tb1=4,450, tb2 =1,416.

 

Рис. 2.13

 

Решить задачи в Excel. Оформить лабораторную работу.

Имеются данные зависимости объема прибыли промышленного предприятия от выработки работников Х1 и цены продукции Х2. Предполагая, что между переменными У, Х1, Х2 существует линейная корреляционная зависимость, найти ее аналитическое выражение.

i xi1 xi2 yi
  1800 25,5 3200
  2100 27,5 3450
  2050 26,9 3350
  1950 28 3100
  1870 28,15 3500
  2000 26 3440

 

2. По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов 1 x (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих 2 x (%) (p1 – число букв в полном имени, p2 – число букв в фамилии).

 

Номер предприятия y x1 x2 Номер предприятия y x1 x2
1 7,0 3,6+0,1р1 11,0 11 9,0 6,0+0,1р2 21,0
2 7,0 3,7 13,0 12 11,0 6,4 22,0
3 7,0 3,9 15,0 13 9,0 6,9 22,0
4 7,0 4,0 17,0 14 11,0 7,2 25,0
5 7,0 3,8+0,1р1 18,0 15 12,0 8,0-0,1р2 28,0
6 7,0 4,8 19,0 16 12,0 8,2 29,0
7 8,0 5,3 19,0 17 12,0 8,1 30,0
8 8,0 5,4 20,0 18 12,0 8,6 31,0
9 8,0 5,6–0,1р1 20,0 19 14,0 9,6 32,0
10 10, 6,8 21,0 20 14,0 9,0+0,1р2 36,0

 

Требуется:

1) Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2) Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3) Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4) С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5) С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.

3. Выполните задания по вариантам. Номер варианта определяется номером в списке.

В ходе эксперимента получены 25 наблюдений двух независимых переменных X1, X2 и переменной Y . Эти данные записаны в следующей таблице. Требуется:

найти коэффициенты попарной корреляции для наборов данных всех регрессоров и отклика;

построить регрессионные модели зависимости Y от факторов X и исследовать их на надежность по критерию Фишера при уровне значимости 0,05;

найти коэффициент эластичности Y по X при среднем значении X;

определить надежность коэффициентов регрессии по критерию Стьюдента:

используя полученное уравнение линейной регрессии, оце­нить ожидаемое среднее значение признака Y при X1 = 2,5, Х2 = 2,2.

 


Дата: 2019-05-28, просмотров: 445.