Линейная модель парной регрессии. Показатели качества модели
Изучите пример решения задачи при помощи инструментов MS Excel.
Пример. По территориям региона приводятся данные за 20ХX г.
Требуется:
1. Построить линейное уравнение парной регрессии У по Х .
2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации.
3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F - критерия Фишера и t -критерия Стьюдента.
4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня.
Решение типовой задачи в MS Excel C помощью инструмента анализа данных Регрессия можно получить результаты регрессионной статистики, дисперсионного анализа, доверительных интервалов, остатки и графики подбора линии регрессии. Если в меню сервис еще нет команды Анализ данных, то необходимо сделать следующее. В главном меню последовательно выбираем Данные → Контекстное меню на ленте → Настройка лент ы → Надстройки → Перейти и устанавливаем «флажок» в строке Пакет анализа (рис. 2.8):
Рис. 2.8
Далее следуем по следующему плану.
1.После ввода исходных данных выбираем Данные →Анализ данных→Регрессия.
2. Заполняем диалоговое окно ввода данных и параметров вывода (рис. 2.9):
Рис. 2.9
Здесь: Входной интервал Y – диапазон, содержащий данные объясняемой переменной;
Входной интервал X – диапазон, содержащий данные объясняющей переменной;
Метки – «флажок», который указывает, содержит ли первая строка названия столбцов;
Константа – ноль – «флажок», указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист – можно указать произвольное имя нового листа (или не указывать, тогда результаты выводятся на вновь созданный лист).
Получаем следующие результаты для рассмотренного выше примера:
Рис. 2.10
Описание первой таблицы:
Множественный R – коэффициент множественной корреляции.
R-квадрат – коэффициент детерминации.
Нормированный R-квадрат – скорректированный коэффициент детерминации.
Стандартная ошибка – среднее квадратическое отклонение.
Описание второй таблицы
Описание третьей таблицы
Данные первой строки относятся к свободному члену уравнения регрессии b0. Данные второй строки относятся к коэффициенту уравнения регрессии b1. Данные третьей строки относятся к коэффициенту уравнения регрессии b2 . И так далее в зависимости от количества объясняющихпременных.
Столбцы таблицы:
Первый столбец – названия коэффициентов.
Второй столбец значения коэффициентов уравнения регрессии.
Третий столбец – стандартная ошибка коэффициента уравнения регрессии (среднее квадратическое отклонение).
Четвертый столбец - t-статистика для соответствующего коэффициента уравнения регрессии.
Из таблиц выписываем, округляя до 4 знаков после запятой и переходя к нашим обозначениям:
Уравнение регрессии:
Коэффициент корреляции 0.7210
Коэффициент детерминации: 0.5199 .
Фактическое значение F -критерия Фишера: F =10,8280
Фактические значения t -критерия Стьюдента:
tb1=3,1793, tb2 =3,2906.
Решить задачи в Excel. Оформить лабораторную работу.
1. Имеются следующие данные об уровне механизации работ Х (%) и производительности труда У (т/ч) для четырнадцати однотипных предприятий:
хi | 32 | 30 | 36 | 40 | 41 | 47 | 56 | 54 | 60 | 55 | 61 | 67 | 69 | 76 |
yi | 20 | 24 | 28 | 30 | 31 | 33 | 34 | 37 | 38 | 40 | 41 | 43 | 45 | 48 |
а) Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции.
б) Найти уравнение регрессии У по Х.
2. По территориям Калининградской области за 2015 год известны значения двух признаков:
Район | Расходы на покупку продовольственных товаров в общих расходах, % (у) | Среднедневная заработная плата одного работающего, руб. (х) |
Калининград | 68,8 | 45,1 |
Гурьевский | 61,2 | 59,0 |
Зеленоградский | 59,9 | 57,2 |
Советский | 56,7 | 61,8 |
Светлогорский | 55,0 | 58,8 |
Нестеровский | 54,3 | 47,2 |
Балтийский | 49,3 | 55,2 |
Найдите уравнение регрессии У по Х и оцените тесноту и направление связи между переменными с помощью коэффициента корреляции.
3. Имеются данные за 10 лет по прибылям Х и У (в % к предыдущему году) двух компаний:
Х | 19,2 | 15,8 | 12,5 | 10,3 | 5,7 | -5,8 | -3,5 | 5,2 | 7,3 | 6,7 |
У | 20,1 | 18,0 | 10,3 | 12,5 | 6,0 | -6,8 | -2,8 | 3,0 | 8,5 | 8,0 |
Постройте регрессионную модель У по Х.
Оцените тесноту и направление связи.
4. Решить свой вариант индивидуального задания. Вариант выбирается по номеру в списке журнала.
Линейная модель множественной регрессии. Показатели качества регрессии
Пример. По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов 1 x (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих 2 x (%).
Номер предприятия | y | x1 | x2 | Номер предприятия | y | x1 | x2 |
1 | 7,0 | 3,9 | 10,0 | 11 | 9,0 | 6,0 | 21,0 |
2 | 7,0 | 3,9 | 14,0 | 12 | 11,0 | 6,4 | 22,0 |
3 | 7,0 | 3,7 | 15,0 | 13 | 9,0 | 6,8 | 22,0 |
4 | 7,0 | 4,0 | 16,0 | 14 | 11,0 | 7,2 | 25,0 |
5 | 7,0 | 3,8 | 17,0 | 15 | 12,0 | 8,0 | 28,0 |
6 | 7,0 | 4,8 | 19,0 | 16 | 12,0 | 8,2 | 29,0 |
7 | 8,0 | 5,4 | 19,0 | 17 | 12,0 | 8,1 | 30,0 |
8 | 8,0 | 4,4 | 20,0 | 18 | 12,0 | 8,5 | 31,0 |
9 | 8,0 | 5,3 | 20,0 | 19 | 14,0 | 9,6 | 32,0 |
10 | 10, | 6,8 | 20,0 | 20 | 14,0 | 9,0 | 36,0 |
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью F -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации. С помощью t -критерия оценить статистическую значимость коэффициентов уравнения регрессии.
Решение типовой задачи в MS Excel
Вносим исходные данные в таблицу MS Excel (рис. 2.11)
Рис.2.11
Найдем матрицу парных коэффициентов корреляции (Данные→Анализ данных→Корреляция) (рис. 2.12):
Рис. 2.12
Получаем следующий результат:
C помощью инструмента анализа данных Регрессия (Данные →Анализ данных → Регрессия) получаем следующие результаты (рис. 2.13).
Откуда выписываем, округляя до 4 знаков после запятой и переходя к нашим обозначениям:
Уравнение регрессии:
Множественные коэффициент корреляции 0.9731
Коэффициент детерминации: 0.9469.
Скорректированный коэффициент детерминации: 0,9407.
Фактическое значение F -критерия Фишера: F =151,653
Фактические значения t -критерия Стьюдента:
tb1=4,450, tb2 =1,416.
Рис. 2.13
Решить задачи в Excel. Оформить лабораторную работу.
Имеются данные зависимости объема прибыли промышленного предприятия от выработки работников Х1 и цены продукции Х2. Предполагая, что между переменными У, Х1, Х2 существует линейная корреляционная зависимость, найти ее аналитическое выражение.
i | xi1 | xi2 | yi |
1800 | 25,5 | 3200 | |
2100 | 27,5 | 3450 | |
2050 | 26,9 | 3350 | |
1950 | 28 | 3100 | |
1870 | 28,15 | 3500 | |
2000 | 26 | 3440 |
2. По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов 1 x (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих 2 x (%) (p1 – число букв в полном имени, p2 – число букв в фамилии).
Номер предприятия | y | x1 | x2 | Номер предприятия | y | x1 | x2 |
1 | 7,0 | 3,6+0,1р1 | 11,0 | 11 | 9,0 | 6,0+0,1р2 | 21,0 |
2 | 7,0 | 3,7 | 13,0 | 12 | 11,0 | 6,4 | 22,0 |
3 | 7,0 | 3,9 | 15,0 | 13 | 9,0 | 6,9 | 22,0 |
4 | 7,0 | 4,0 | 17,0 | 14 | 11,0 | 7,2 | 25,0 |
5 | 7,0 | 3,8+0,1р1 | 18,0 | 15 | 12,0 | 8,0-0,1р2 | 28,0 |
6 | 7,0 | 4,8 | 19,0 | 16 | 12,0 | 8,2 | 29,0 |
7 | 8,0 | 5,3 | 19,0 | 17 | 12,0 | 8,1 | 30,0 |
8 | 8,0 | 5,4 | 20,0 | 18 | 12,0 | 8,6 | 31,0 |
9 | 8,0 | 5,6–0,1р1 | 20,0 | 19 | 14,0 | 9,6 | 32,0 |
10 | 10, | 6,8 | 21,0 | 20 | 14,0 | 9,0+0,1р2 | 36,0 |
Требуется:
1) Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2) Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3) Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4) С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5) С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
3. Выполните задания по вариантам. Номер варианта определяется номером в списке.
В ходе эксперимента получены 25 наблюдений двух независимых переменных X1, X2 и переменной Y . Эти данные записаны в следующей таблице. Требуется:
найти коэффициенты попарной корреляции для наборов данных всех регрессоров и отклика;
построить регрессионные модели зависимости Y от факторов X и исследовать их на надежность по критерию Фишера при уровне значимости 0,05;
найти коэффициент эластичности Y по X при среднем значении X;
определить надежность коэффициентов регрессии по критерию Стьюдента:
используя полученное уравнение линейной регрессии, оценить ожидаемое среднее значение признака Y при X1 = 2,5, Х2 = 2,2.
Дата: 2019-05-28, просмотров: 507.