Лабораторная работа 1 Репрезентативность информации,

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

Васильев В.П.

ЭКОНОМЕТРИЯ и Статистический анализ с применением Excel

Для всех экономических специальностей.

Минск 2017

Лабораторная работа 1 Репрезентативность информации, 3

Лабораторная работа 2 Оценка степени соответствия эмпирического распределения нормальному с использованием значений асимметрии и эксцесса. 4

Лабораторная работа 3. Исследование распределений случайных величин методами описательной статистики. 8

Лабораторная работа 4. Корреляционный анализ двухфакторных выборок. 13

Лабораторная работа 5. Регрессионно-корреляционный анализ двухфакторных выборок. 20

Лабораторная работа 6. Корреляционный анализ многофакторных выборок. 25

Лабораторная работа 7. Регрессионно-корреляционный анализ многофакторных выборок. 29

Лабораторная работа 8.Нелинейная регрессия. 32

Лабораторная работа 9.Статистический анализ выборок с категорийными переменными. 37

Лабораторная работа 10. Построение модели регрессии при наличии гетероскедастичности и автокорреляции. 42

Лабораторная работа11. Системы эконометрических уравнений. 48

Лабораторная работа 12 Расчет и оценка параметров динамической эконометрической модели. 51

Приложение 1. 55

Приложение 2. 56

Задания

Задание 1. Какой должна быть численность выборки для нахождения средней себестоимости 1 т прироста крупного рогатого скота по 350 сельскохозяйственным организациям региона, ошибка которой не должна превышать 0,3 млн. рублей с вероятностью 75%. Стандартное отклонение признака – 2,1 млн. рублей.

Задание 2. Определите численность выборки для расчета удоя на среднегодовую корову в 200 сельскохозяйственных организациям региона, если необходимо, чтобы ошибка не превышала 100 кг с вероятностью 90%. Стандартное отклонение признака – 653 кг.

Задание 3. Сколько сельскохозяйственных организаций из 350 необходимо обследовать, чтобы определить среднюю себестоимость производства 1 т зерна, ошибка которой не будет превышать 15 тыс. рублей с вероятностью 75%. Стандартное отклонение признака – 76,5 тыс. рублей.

Задание 4. Определите численность выборки для нахождения среднего значения среднесуточного прироста свиней по 190 сельскохозяйственным организациям региона, ошибка которого не будет превышать 20 г с вероятностью 75%. Стандартное отклонение признака – 116 г.

Лабораторная работа 3. Исследование распределений случайных величин методами описательной статистики.

Цель работы: научиться обрабатывать выборки из генеральных совокупностей средствами компьютерной графики и с использованием инструментов MS EXCEL

Задачи:

-изучить средства для генерации наборов случайных чисел;

-уметь производить выборку из множества случайных чисел;

-проводить ранжирование выборок и генеральных совокупностей;

-вычислять моменты распределения случайных величин;

-строить диаграммы распределения выборок.

Инструментарий: приложение «Анализ данных».-вкладка Данные Если отсутствует приложение, то необходимо загрузить команду Настройки, установив опцию Пакет анализа .В случае если в настройках отсутствует данное приложение, то необходимо войти в библиотеку системы и инсталлировать приложение(делать это лучше под руководством системного программиста).

Теоретические сведения

1.Для выполнения этой работы необходимо знать элементы теории вероятности и математической статистики, в частности иметь понятия о моментах случайной величины, распределениях, способах представления распределений.

2.Сведения о возможностях приложения « Анализ данных»

2.1.Генерация случайных чисел используется для моделирования явлений, имеющих случайную природу, по известному закону распределения .В составе приложения Анализ данных имеются несколько популярных распределений:Нормальное,дискретное,модельное,Пуассона,биномиальное и др. Параметрами окна генерации случайных чисел являются:

-число переменных- целое;

-число случайных чисел- целое число, характеризует количество чисел по каждой переменной;

-тип распределения (равномерное, Бернулли, Пуассона, нормальное и т.д.);

-параметры распределения табл.1;

-выходной интервал (на том же листе, на новом листе, в новой книге) и место куда поместить сгенерированные последовательности.

2.2.Инструмент выборка, производит выборку подмножества мощности n<m из заданного множества, либо случайным ,либо периодическим образом.

2.3.Инструмент Гистограмма -позволяет построить интервальную гистограмму распределения случайной величины (С.В.). Входные данные –диапазон изменения СВ(блок данных на рабочем листе) и интервал карманов(блок данных сформированный заранее, верхних границ интервалов покрывающих область изменения СВ.

2.4.Инструмент «Описательная статистика» - позволяет вычислять все числовые моменты распределения случайной величины. Входные данные:

-диапазоны данных, как минимум два, задаются ссылками;

-группирование (строки, столбцы);

-выходной интервал (ссылка);

-статистики (флажки).

3.Уметь работать с объектами MS- Excel различными статистическими функциями(среднее, дисперсия, эксцесс, минимум, максимум и др.) и диаграммами (гистограммы, графики, точечные)

Табл.1.Некоторые законы распределения

Распределение	Параметры	Область применения
Биномиальное	0<R<1,n-целое(число испытаний)	Массовое производство
Пуассона	l>0	Массовое обслуживание, исследование надежности
Нормальное	a-мат. ожидание, s> 0-дисперсия	При большом количестве не сильно выделяющихся случайных факторов
Равномерное	А<В два числа	Массовое производство
Модельное	Множество Р_i≤1, SR_i=1	При известном законе распределения
Бернулли	Р =1 или Р =0	Для моделирования событий с двумя исходами

Ранжирование рядов данных.

1.Пусть задан набор данных.

2.Проведем сортировку по убыванию(или возрастанию).

3. Меньшему (большему) значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

4. Наибольшему (меньшему) значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2

В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составили бы, скажем, 10.2 сек; 10.5 сек; 10.7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:

Пример Задан ряд.

№	1	2	3	4	5	6	7	8	9
ряд	5	6	7	4	3	3	3	4	4

Выполним сортировку по возрастанию

5.Проведем ранжирование

Элементу 7 присвоим 1, элементам 6 и 5 ранги 2 и 3,элементу 4 присвоим ранги

(4+5+6)/3=5 , элементу 3 ранг (7+8+9)/3=8

Проверка сумма рангов должна равняться S=(n+1)*n/2

В данном случае 45.

Выполнение работ ы

Выполните генерацию случайных чисел по закону распределения ,используя приложение АНАЛИЗ ДАННЫХ, например сгенерировать последовательность из 20 чисел задав, например распределение Пуассона =10 или нормальное математическое ожидание равно 0,5 дисперсия 2 ,полученную последовательность считаем генеральной совокупностью.

2. Проведите ранжирование и рассчитайте Моду и Медиану ряда.

3. Определите и задайте интервал «Карманов», например интервал карманов

0 1 2 3 4

Постройте гистограмму распределения, команда ГИСТОГРАММА.

Для этого введите исходный диапазон ,интервал карманов и место расположения. Получите частотную таблицу и график.

Карман	Частота
0	2
1	3
2	9
3	10
4	5
Еще	0

Самостоятельно, увеличьте число карманов в два раза и повторите построение гистограммы.
Проведите выборку из генеральной совокупности, используя команду, ВЫБОРКА объем 10 элементов. Проведите ранжирование, используя команду РАНГ. Вычислите МОДУ И МЕДИАНУ выборки, сравните с модой и медианой генеральной совокупности. Сделайте выводы.
.Постройте гистограмму выборки.
Вычислите основные моменты случайной величины (среднее, дисперсию, асимметрию, эксцесс) выборке (используйте функции , категории статистические) и генеральной совокупности, сделайте вывод .
Проверьте свои расчеты, команда ОПИСАТЕЛЬНАЯ СТАТИСТИКА.

Столбец1

Среднее	2,46
Стандарт ошибка	0,143456
Медиана	3
Мода	3
Стандарт. Отклонен.	1,014386
Дисперсия	1,02898
Эксцесс	-0,09455
Асимметричность	-0,43679
Интервал	4
Минимум	0
Максимум	4
Сумма	123
Счет	50

Сгенерируйте другое распределение, например нормальное и повторите пп.5-8
Оформите отчет.

Самостоятельно.

Выполните расчет статистических показателей и сравните с результатами инструмента «Описательная статистика» , вычислите и оцените средние и дисперсии.

Таблица – Посещаемость занятий студентами и их оценки на экзамене см лаб.раб.2

Номер	Пропуски	Оценка	Номер	Пропуски	Оценка
1	1	8	14	1	5
2	4	5	15	4	3
3	3	4	16	3	7
4	0	7	17	2	5
5	2	7	18	0	7
6	6	2	19	1	9
7	5	1	20	5	6
8	1	10	21	3	5
9	0	9	22	2	7
10	7	3	23	3	3
11	4	5	24	2	8
12	3	4	25	0	10
13	2	6

Контрольные вопросы

1. Что такое случайная величина и ее закон распределения. Приведите примеры распределений.

2. Что такое моменты случайной величины. Какие моменты Вы знаете. Охарактеризуйте их.

3.Что такое генеральная совокупность и выборка.

4.Способы представления выборок.

5.Какие инструменты для выполнения статистических расчетов существуют в MS EXCEL

Выполнение работы.

1.Занесем данные в ячейки рабочего листа MS EXCEL

2. Заполним столбец Х*У, подсчитаем средние значения и стандартные отклонения используя функции среднее() , стандотглонГ()

Подсчитаем ковариацию признаков, используя формулу

и корреляцию

Результат

Коэффициент корреляции равен -0,945. Значение свидетельствует о сильной обратной связи переменных.

4.Проверим его значимость и вычислим доверительный интервал.

Самостоятельно рассчитайте силу связи между факторами таблицы.

фондоотдача в мил.руб	фондоворужонность. в мил руб
1,45	6,4
1,3	7,8
1,37	9,76
1,62	7,9
1,91	5,35
1,68	9,9
1,94	4,5
1,89	4,88
1,94	3,46
2,06	3,6
2	3,56
1,02	5,65
1,85	4,28
0,9	8,9
0,62	8,52
1,09	7,19
1,6	4,82
1,53	5,46
1,4	6,2

Сделайте вывод.

Самостоятельно выполните исследование.

На предприятии Х проводился социологический опрос удовлетворенности своей работой. Получены данные.

Рассчитать коэффициенты ассоциации и контингенции.

Примечание : при заполнении таблицы используйте функцию СчетЕсли()

Ранговые коэффициенты связи. В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.

Ранжирование — это процедура упорядочивания объектов изучения, которая выполняется на основе предпочтения.

Ранг — порядковый номер значений признака, расположенных в порядке возрастания или убывания величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех значений принимается равным средней арифметической из соответствующих номеров мест, которые они занимают. Данные ранги называются связными.

Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена и Кендэла. Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками. Коэффициент корреляции Спирмена

di квадраты разности рангов,n число наблюдений.

Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3,5. В таком случае коэффициент Спирмена вычисляется как:

где

j - номера связок по порядку для признака х;

А_j - число одинаковых рангов в j-й связке по х;

k - номера связок по порядку для признака у;

В_k - число одинаковых рангов в k-й связке по у.

Для проверки значимости коэффициента корреляции Спирмена используют те же методы, что и для коэффициента корреляции количественной шкалы.

Выполнение работы

Рассмотрим данные таблицы 1 Посещаемость занятий студентами и их оценки на экзамене (лабораторной работы 2), фрагмент исходной Excel таблицы.

Выполним ранжирование рядов данных.(фрагмент таблицы ранжирование рядов),используя функцию

Обратите внимание, что вторым аргументом функции является массив , имеющих абсолютные адреса ячеек

Вычислим разности рангов и квадраты разностей

Подсчитаем сумму квадратов рангов

S=4548

Так как среди данных встречаются повторения, то для расчета коэффициента корреляции Спирмена , используем формулу

, где ,

j - номера связок по порядку для признака х;

А_j - число одинаковых рангов в j-й связке по х;

k - номера связок по порядку для признака у;

В_k - число одинаковых рангов в k-й связке по у.

Для подсчета одинаковых рангов по связкам, целесообразно скопировать в отдельную часть листа столбцы рангов и выполнить сортировки.

Из отсортированных данных видно, что повторяются 6 наблюдений с рангами

3,5 ; 6; 10; 15; 19,; 23,5

аналогично по оценкам одинаковые ранги у 8 наблюдений-это ранги

1,5 ; 3,5 ; 5,5 ;9 ; 12,5 ;16 ,19,5 22

, таким образом

Число рангов по связке Пропуск равно 6 , число рангов по связке оценка 8

Тогда

=17,5

=42

Число наблюдений-25

Тогда коэффициент корреляции Спирмена равен -0,767

Подсчитаем значимость

Тнабл= =5,73

Ткр=1,73

Вывод коэффициент корреляции значим.

Самостоятельно рассчитать доверительный интервал.

Выполнение работы.

1.Занесем данные в ячейки рабочего листа MS EXCEL.

2. Построим график корреляционного поля, используя диаграмму Точечная , данные оси ОХ Объем производства.

Из графика можно предположить о наличии линейной связи данных.

3. Определим количественные характеристики связи, используя настройку

Анализ данных \корреляция.

Результат

	Объем производства	Себестоимость продукции (У)
Объем производства	1
Себестоимость продукции (У)	-0,871020552	1

Коэффициент корреляции равен -0,87. Значение свидетельствует о сильной связи данных.

4.Проверим его значимость и вычислим доверительный интервал.

4.1. Проверка значимости

Вычислим величину

Тнабл=

Т набл= -5,015033743

Для вычисления критического значения Используя функцию СТЬЮДРАСПОБР, категория статистические ,по заданному уровню значимости α=0,05 и числу степеней свободы (n-2)=10 определяют критическую точку t_{α/2 , n-2.}Если модуль Т меньше t_{α/2 , n-2}

С вероятностью 5% и степенями свободы 10 критическое значение распределения Стьюдента равно Ткр = 2,228139

|Т набл| > Ткр , что свидетельствует о его значимости коэффициента корреляции

4.2. .Рассчитаем д доверительные интервалы коэффициента корреляции

а)Выполним преобразование Фишера над коэффициентом корреляции, Фишер(ρ)

Ф(ρ)= - 1,337

б) вычислим отклонение ΔZ = , где t₁значение функции Лапласа, встроенная функция НОРМСТОБР.

Величина отклонения с вероятностью 95% ΔZ= 0,548

в) Предельные значения интервала в пространстве Фишера

А= -1,337-0,548=-1,885

В=-1,337+0,548=-0,789

г) Обратное преобразование Фишера даст значения границ доверительного интервала для ρ вероятностью 95% -0,958 и -0,658

.5. Построим уравнение регрессии используя Анализ данных \ Регрессия.

Протокол Регрессионного анализа.

Регрессионная статистика
Множественный R	0,871020552
R-квадрат	0,758676802
Нормированный R-квадрат	0,734544482
Стандартная ошибка	1,24847364

	Коэффициенты	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	10,82788711	10,3015	1,2099E-06	8,48589	13,16988
Объем производства	-0,900198446	-5,6069	0,000225	-1,25792	-0,54247

6.Оценки значимости.

6.1 Модель работает на 87%

Коэффициент детерминации Множественный R= 0.76

Уравнение регрессии У= 10,82- 0,9*Х

6.2. Оценки значимости коэффициентов

а) По критерию Стьюдента, необходимо сравнить данные Т статистики с критическим значением Стьюдента, найденным в пункте 4.1.

Для первого коэффициента 10,3015 >2,228139 для второго 5,6069>2,228139 , что свидетельствует о их значимости

б) оценка по Р значению.

Если величина в столбце Р значение меньше 0,05, то с вероятностью 0,95 соответствующий коэффициент значим.

в) доверительные интервалы для значимых коэффициентов регрессии

8.4886<10.827<13.17

-1.258<-0.9 <-0.542

7. График подбора регрессии

Изобразим на графике граничные линии регрессий доверительного интервала.

Для этого используем формулы

У=-0,542 х+13,69

У=-1,258Х+8,486

Подсчитаем среднюю себестоимость продукции, если объем производства составит 5т.у.е. У= -0,9*5+10,82=-4.5+10.82=6.32

Определим степень доверия

У=-0,542*5+13,69=10,98

У=-1,258*5+8,486=2,196

С вероятностью 95% Себестоимость будет в пределах(2,196;10,98) и в среднем 6,32

Какой будет объем производства, если себестоимость равна 2,5

Х=-(2,5-10,82) / 0,9=9,24

Самостоятельно провести анализ данных из таблиц и построить модель

Теоретические сведения

Большинство экономических объектов и явлений описываются не одним, а целой системой показателей. С этой целью необходимо провести выборку банков и провести их оценку по ряду признаков. В качестве примеров можно назвать уставной фонд, привлекаемые средства, оборотные средства, вклады населения ,невозвращенные кредиты и т.д. Обозначим символами Х, а соответствующие анализируемые признаки символами Х_jполучим таблицу

Данные представленные в таблице можно интерпретировать матрицей А размерности (10*4) и представляют собой многомерную случайную величину (МСВ),строки которой элементы выборки, а столбцы случайные значения признаков. Данная матрица представляет собой СМВ. Строки и столбцы которой представляют случайные величины. Каждая случайная величина характеризуется системой моментов средними, отклонениями и др. сами же величины могут быть независимыми или связаны друг с другом. Связи между ними характеризуются не одним, а целой системой величин, которые образуют матрицы парных ковариаций и корреляций. Задачи, решаемые в данной работе, связаны с вычислением и исследованием свойств этих матриц.

Выполнение работы

1.Центрирование МСВ

1.1.Вычислим средние и стандартные отклонения по значениям элементов каждого столбца Получим для средних и для стандартных отклонений строки

В свободном месте листа ,например в ячейки Н6:К6 Введем формулу вида

Не забудьте нажать Ctrl+Shift+Enter

Получим

и скопируем ее на остальные ячейки

Получим матрицу В Подсчитаем среднее для преобразованной матрицы В .

1.2.Нормирование матрицы.

В свободном месте листа ,например в ячейки М6:Р6

Введем формулу вида

и скопируем ее на остальные ячейки

Подсчитайте среднее и стандартное отклонение для столбцов матрицы.

Самостоятельно Постройте матрицу парных корреляций для выборки и вычислите частные и множественные коэффициенты корреляции

Рентабельность	фондоотдача	фондоворужонность.
13,25	1,45	6,4
10,16	1,3	7,8
13,72	1,37	9,76
12,85	1,62	7,9
10,63	1,91	5,35
9,13	1,68	9,9
25,83	1,94	4,5
23,39	1,89	4,88
14,68	1,94	3,46
10,05	32,4	2,06
14	11,52	2
9,66	17,28	1,02
10,03	16,2	1,85
9,13	13,32	0,9
5,17	17,28	0,62
9,9	9,72	1,09
12,62	16,2	1,6
5,02	24,84	1,53

Выполнение работы.

1.Занесем данные в ячейки рабочего листа MS EXCEL.

2. Определим количественные характеристики связи, используя настройку

Анализ данных \корреляция.

	Рентабельность	ненормир.Оборотные с-ва	фондоотдача	фондоворуж.	нормир.обор.с-ва
Рентабельность	1
Ненорм.Обор с-ва	-0,3735	1
фондоотдача	0,47878	0,192469	1
фондоворуж.	-0,29462	-0,241921	-0,66241838	1
Норм.обор.с-ва	-0,38508	0,021457	-0,07516782	0,019524	1

3.Проверим значимость коэффициентов парных корреляций и вычислим их доверительные интервалы.

3.1. Проверка значимости

Вычислим величину

Тнабл=

Таблица Т расч , для каждого коэффициента корреляции

0
-2,1308	0
2,8857	1,037856	0
-1,6313	-1,31932	-4,6789	0
-2,2079	0,113569	-0,3988	0,103333	0

Т кр=2,048

Отсюда можем сделать вывод о значимости только 4 коэффициентов

Для вычисления интервальных оценок воспользуемся методикой предыдущей работы, раздел 4.2

Данные удобно представить таблицей.

фишер	Zr	ΔZ	мин =Zr-Δ	мах=Zr+Δ
р,1	-0,3925	0,328970	-0,72149828	-0,06356
р,2	0,52140		0,1924356	0,85037
р,4	-0,4060		-0,7349811	-0,07704
r 3,2	-0,7971		-1,1260814	-0,46814

После выполнения обратных преобразований Фишера получим.

гран.корел	ρl=F(мин)	ρh=F(мах)
р,1	-0,617836	-0,0634
р,2	0,190094	0,69126
р,4	-0,626103	-0,0768
3,2	-0,809673	-0,4367

4.Расчет частных коэффициентов корреляции.

Частные коэффициенты корреляции характеризуют силу линейной связи двух факторов, без учета влияния остальных

Р= , Р _I_,_j алгебраическое дополнение соответствующего элемента матрицы парных корреляций.

Для вычисления их используем прием.

а) вычислим обратную матрицу матрицы парных корреляций

б) вычислим ее определитель

в) с помощью специальной вставки , выполним умножение элементов обратной матрицы на значение определителя.

а)Обратная матрица.

2,317	1,112	-1,148	0,176	0,779
1,112	1,599	-0,616	0,300	0,342
-1,148	-0,616	2,367	1,086	-0,272
0,176	0,300	1,086	1,842	0,107
0,779	0,342	-0,272	0,107	1,270

Определитель

0,2257

Матрица алгебраических дополнений

0,523	0,251	-0,259	0,040	0,176
0,251	0,361	-0,139	0,068	0,077
-0,259	-0,139	0,534	0,245	-0,061
0,040	0,068	0,245	0,416	0,024
0,176	0,077	-0,061	0,024	0,287

Теперь использованием формулы, для частных коэффициентов корреляции , вычислим их значение, но только для значимых коэффициентов.

0,5778	1,0000
-0,4904	-0,3166	1,0000
0,0851		0,5202	1,0000
0,4539

Оценим их значимость по тем же критериям

5. Построение модели регрессии

У-рентабельность

Протокол регрессии

Регрессионная статистика
Множественный R	0,753923
R-квадрат	0,568400

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение
Y-пересечение	17,1885	6,7479	2,5472	0,0174
ненормир.Оборотные с-ва	-0,5002	0,1413	-3,5401	0,0016
фондоотдача	6,2535	2,2228	2,8133	0,0094
фондоворуж.	-0,2059	0,4822	-0,4269	0,6731
нормир.обор.с-ва	-0,0513	0,0201	-2,5470	0,0174

Из протокола видно, что модель работает на 75%

Имеет вид

У=17,18- 0,5Х1+6,25Х2-0,206Х3-0,05Х4

Все коэффициенты кроме третьего значимы.

Имеет место мультиколлинеарность, второй и третьей переменной, одну из них надо исключить из анализа

Новая модель.

Множественный R	0,75183
R-квадрат	0,56525
Нормированный R-квадрат	0,51509
Стандартная ошибка	4,03248

Самостоятельно выполните анализ данных из приложения 1

Самостоятельно. Рассчитать потребление мяса в г.п. Пуховичи, зимой. если известны данные выборки

№ п/п	Душевое потребление мяса, кг (Y)	Душевой доход, тыс. дол. (Х₁)	Город/Поселок ГТ	Время года
1	35	1,2	Поселок	Осень
2	31	0,7	город	Осень
3	28	0,6	Поселок	Лето
4	40	0,8	город	Весна
5	45	0,4	Поселок	Весна
6	31	0,6	Поселок	Осень
7	30	0,8	город	Лето
8	28	0,3	Поселок	Лето
9	42	0,6	Поселок	Весна
10	50	0,9	город	Весна
11	53	0,8	город	Зима
12	42	0,7	город	Осень
13	60	1,5	Поселок	Весна
14	35	0,5	Поселок	Зима
15	28	0,4	Поселок	Лето
16	37	0,8	город	Осень
17	45	0,9	город	Весна
18	43	1,3	Поселок	Лето
19	40	0,9	город	Осень
20	51	1	Поселок	Весна

Проверьте.

На координатной плоскости изобразим корреляционное поле и график полученного уравнения регрессии.

Из рисунка видно, что фактические точки наблюдений в первые три месяца находятся ниже линии уравнения регрессии. В период с апреля по сентябрь наблюдается противоположная тенденция, а именно, точки корреляционного поля расположены выше прямой линии. Наконец, в последние 3 месяца года точки снова опускаются ниже линии уравнения регрессии.

Анализ показывает, что между отклонениями e_i существует определенная закономерность. Иными словами, в данном случае присутствует автокорреляция.

При изучении экономических процессов и явлений встречается положительная и отрицательная автокорреляция. Положительная автокорреляция означает, что за отрицательным отклонением следует положительное и наоборот.

К основным причинам, которые вызывают появление автокорреляции следует отнести ошибки спецификации, инертность экономических показателей, эффект паутины и сглаживание исходных данных.

Ошибки спецификации. Неправильный выбор формы связи между факторным и результативным показателями часто приводит к появлению автокорреляции. Если вернуться к рисунку то очевидно, что в этом случае параболическая зависимость более адекватно отражает изучаемый экономический процесс. Поэтому расчет параметров параболы и последующее использование этой линии для анализа экономических явлений позволит существенно снизить влияние автокорреляции и, соответственно, повысить качество эконометрической модели.

Инертность экономических показателей. Многие экономические показатели обладают определенной цикличностью. Известно, что экономический цикл – это динамическая характеристика экономики, включающая периодические взлеты и падения в развитии экономической системы.

Обычно выделяют 4 фазы экономического цикла: оживление, бум, спад, подъем. Понятно, что переход от одного цикла к последующему не может произойти мгновенно. Иными словами, динамика развития экономической системы обладает определенной инертностью.

Эффект паутины. Очень часто производственно-экономические показатели реагируют на изменение внешних условий с запаздыванием. Например, увеличение цены на зерно в начале года не приведет сразу же к улучшению финансового состояния сельскохозяйственного предприятия. Должно пройти определенное время, чтобы созрел урожай и продукция была реализована по новым ценам.

Сглаживание исходных данных. В некоторых случаях данные по некоторому достаточно продолжительному интервалу времени получают усреднением данных по отдельным подынтервалам. Это приводит к определенному уменьшению колебаний внутри изучаемого периода и может вызвать автокорреляцию.

Автокорреляция имеет несколько негативных моментов. Данное явление, прежде всего, снижает качество эконометрической модели. В некоторых случаях характеристики полученного уравнения регрессии будут завышенными и, следовательно, использование таких эконометрических моделей для анализа и прогнозирования экономики даст нам искаженные результаты.

Методы определения автокорреляции могут быть использованы только после расчета параметров эконометрической модели и отклонений e_i.

Графический метод.

При использовании графического метода по оси абсцисс откладываются либо время получения данных, либо порядковый номер наблюдения. Ось ординат, в свою очередь, служит для указания отклонений e_i. Анализ отклонений показывает отсутствие или наличие связи между отклонениями и, следовательно, в этом случае вероятность наличия или отсутствия автокорреляции. Графический метод не всегда может дать однозначный ответ на вопрос о наличии автокорреляции и её направлении.

Критерий Дарбина-Уотсона (DW).

Общая схема критерия Дарбина-Уотсона состоит в следующем.

1. Строится уравнение регрессии и определяются отклонения для каждого наблюдения, общее количество которых составляет T.

2. Рассчитывается критерий DW по формуле:

На примере информации из таблицы 1 покажем методику расчета рассматриваемого критерия.

Таблица 3 – Схема расчета критерия Дарбина-Уотсона

t	y_t		e_t	e_t²	(e_t – e_t-1)²
1	25	38,115	-13,115	171,9	44,36
2	32	38,458	-6,458	41,6	21,72
3	37	38,801	-1,801	3,2	7,08
4	40	39,143	0,857	0,8	75,00
5	49	39,486	9,514	90,8	32,04
6	55	39,829	15,171	230,7	11,16
7	52	40,171	11,829	140,4	69,56
8	44	40,514	3,486	12,3	11,16
9	41	40,857	0,143	0,0	11,16
10	38	41,199	-3,199	10,0	11,16
11	35	41,542	-6,542	42,4	11,16
12	32	41,885	-9,885	97,0
			Итого:	841,1	305,51

Расчетные значения были определены на основании уравнения регрессии =37,77 + 0,34t.

Значения столбца e_t_-1 получаются путем перемещения значений колонки e_t на один уровень вниз. Из этого следует, что при заполнении столбца e_t_-1 первое значение теряется.

После заполнения таблицы и нахождения соответствующих сумм легко рассчитать критерий Дарбина-Уотсона:

3. На заключительном этапе анализа необходимо сравнить фактическое значение критерия Дарбина-Уотсона с табличными данными. Существуют специальные таблицы определения критических точек для распределения Дарбина-Уотсона. С помощью этих таблиц можно определить критические точки d₁ и d₂при требуемом уровне значимости (например, 0,05). Конкретные значения d₁ и d_u зависят от количества наблюдений (опытов) n, а также от числа факторных переменных эконометрической модели m. В нашем примере значения d₁ и d_u₂составляют 0,971 и 1,331, соответственно (n=12; m=1; уровень значимости принят равным 0,05).

При сравнении фактических и расчетных значений критерия Дарбина-Уотсона можно сделать вывод о наличии автокорреляции и её направленности. Для этого следует руководствоваться следующими правилами:

0 ≤ DW < d₁ – существует положительная автокорреляция;

d₁ ≤ DW < d₂ – невозможно сделать вывод о наличии автокорреляции;

d₂ ≤ DW < 4 – d₂ – автокорреляция отсутствует;

4 – d₂ ≤ DW < 4 – d₁ - невозможно сделать вывод о наличии автокорреляции;

4 – d₁ ≤ DW < 4 – существует отрицательная автокорреляция.

d₁ d₂значение статистики Дарбина-Уотсона. Приложение 3

Таким образом, выполняется первое неравенство: 0 ≤ DW=0,364 < d₁=0,971 и это подтверждает факт наличия положительной автокорреляции в нашем примере.

Можно воспользоваться более грубым способом

DW близко к нулю существует положительная автокорреляция;

DW близко к двум автокорреляция отсутствует;

DW близко к 4 – существует отрицательная автокорреляция

Автокорреляция, как указывалось ранее, представляет собой негативное явление, которое ухудшает качество эконометрических моделей. Поэтому, необходимо знать и уметь применять на практике различные способы смягчения автокорреляции. Чаще всего автокорреляция вызывается неправильной спецификацией модели. Следовательно, для уменьшения автокорреляции необходимо попытаться изменить форму эконометрической модели.

Иногда автокорреляция связана с отсутствием в модели какого-нибудь важного фактора. Поэтому, необходимо данный фактор (или несколько факторных переменных) включить в уравнение регрессии. Однако, если уменьшить автокорреляцию наиболее очевидными методами не получается, то данное явление обусловлено какими-то внутренними особенностями исходных данных.

Задание. По заданным исходным данным для заданной модели

1. Выделить эндогенные и экзогенные переменные.

Самостоятельно решить задачу

Задача Рассматривается модель функционирования торгового предприятия:

Y=b₁₂C+a₁₁S +έ₁

C=b₂₁Y+a₂₂T+έ₂

где Y - среднемесячные расходы предприятия (млн. руб.);

C среднемесячные доходы предприятия (млн. руб.);

S – торговые площади (кв. м);

T - торговое оборудование предприятия (млн. руб.).

Требуется

Выделить эндогенные и экзогенные переменные.
Записать приведенную форму модели.
Определить коэффициенты приведенной формы модели.
Вычислить значения инструментальных переменных.
Определить коэффициенты структурной формы модели двух шаговым методом наименьших квадратов.
Проверить значимость полученных уравнений и их коэффициентов

Y	C	S	N
5	2.1	10	1.5
5.9	3.2	15	2.0
6.4	3.8	30	2.8
7.7	5.24	36.0	2.8
9.3	6.4	52.7	6
9.8	6.4	52.7	6.0
11.2	8.1	64.0	7.37
12.0	9.3	83.4	9.38
13.7	10.0	94.3	10.31
14.0	11.3	100.0	11.05
14.6	12.0	104.7	11.28
15.85	13.32	120.7	13.28

Методы выделения тренда.

1. Скользящее среднее

2. Экспотенциальное сгдаживание.

3. Метод Фурье

Метод скользящих средних базируется на предположении, считающимся тривиальным: при определении средних значений случайные отклонения погашаются. При сглаживании этим методом фактические значения ряда динамики заменяются средними значениями, которые характеризуют срединную точку периода скольжения
Х _к=1/5 (х_к-2+х _к-1+х_к+х_к+1+х_к+2).

Самостоятельно выполните анализ временных рядов из файла Самост. Временные ряды

Самостоятельно Обработать временной ряд Приложения 2.

Приложение 1

Урожайность с ц/га

Орг..удобрения

Минер.удобрения

Фондоворужонность.

Качество пашни

25,2

0,9

229

27,7

29,6

2,6

241

45,4

3,2

262

53,9

30,3

30,5

2,7

297

58,5

31,2

37,9

2,1

358

49,2

34,7

43,6

5,9

417

54,3

40,4

37,9

4,3

278

57,4

37,5

21,1

1,2

214

50,2

26,8

24,7

253

46,2

27,4

5,6

268

42,1

31,6

39,5

6,6

370

52,7

35,5

34,6

2,2

301

47,3

34,2

29,1

1,4

267

69,4

26,1

49,3

8,8

357

49,9

42,6

27,7

246

30,6

4,1

306

52,3

38,2

32,8

6,6

297

44,1

32,4

35,8

1,2

370

33,7

25,9

2,5

217

43,6

28,1

31,3

1,6

274

55,8

31,9

25,7

2,7

292

57,7

29,9

1,7

277

57,9

31,8

Приложение 2

	i					Ряд
	1					34,18981
	2					75,12776
	3					58,81507
	4					38,29251
	5					28,57673
	6					17,20807
	7					5,94361
	8					-19,9495
	9					-13,5539
	10					7,766463
	11					1,946117
	12					-10,8058
	13					10,99628
	14					37,11521
	15					22,15092
	16					56,19745
	17					45,13513
	18					43,23677
	19					19,65716
	20					-15,8856
	21					-33,7403
	22					-4,02929
	23					-6,28788
	24					-5,69742
	25					24,56248
	26					23,52716
	27					28,85584
	28					27,89142
	29					27,1705
	30					28,17369
	31					35,35716
	32					-11,8794
	33					-28,0553
	34					-6,42963
	35					-23,5943
	36					-1,55448
	37					16,51492
	38					15,74033
	39					37,45865
	40					35,45363
	41					20,09745
	42					20,8121
	43					24,86951
	44					8,030622
	45					-19,5174
		m=1		m=2			m=3		m=4		m=5
n		d_L	d_U	d_L	d_U		d_L	d_U	d_L	d_U	d_L	d_U
6		0,610	1,400	-	-		-	-	-	-	-	-
7		0,700	1,356	0,467	1,896		-	-	-	-	-	-
8		0,763	1,332	0,559	1,777		0,368	2,287	-	-	-	-
9		0,824	1,320	0,629	1,699		0,455	2,128	0,296	2,588	-	-
10		0,879	1,320	0,697	1,641		0,525	2,016	0,376	2,414	0,243	2,822
11		0,927	1,324	0,658	1,604		0,595	1,928	0,444	2,283	0,32	2,645
12		0,971	1,331	0,812	1,579		0,658	1,864	0,512	2,177	0,379	2,506
13		1,010	1,340	0,861	1,562		0,715	1,816	0,574	2,094	0,445	2,390
14		1,045	1,350	0,905	1,551		0,767	1,779	0,632	2,030	0,505	2,296
15		1,077	1,361	0,946	1,543		0,814	1,750	0,685	1,977	0,562	2,220
16		1,106	1,371	0,982	1,539		0,857	1,728	0,734	1,935	0,615	2,157
17		1,133	1,381	1,015	1,536		0,897	1,710	0,779	1,900	0,664	2,104
18		1,158	1,391	1,046	1,535		0,933	1,696	0,820	1,872	0,710	2,060
19		1,180	1,401	1,074	1,536		0,967	1,685	0,859	1,849	0,752	2,023
20		1,201	1,411	1,100	1,537		0,998	1,676	0,984	1,828	0,792	1,991
21		1,222	1,420	1,125	1,538		1,026	1,669	0,927	1,812	0,829	1,964
22		1,239	1,429	1,147	1,541		1,053	1,664	0,958	1,797	0,863	1,940
23		1,257	1,437	1,168	1,543		1,078	1,660	0,986	1,785	0,895	1,920
24		1,273	1,446	1,188	1,546		1,101	1,656	1,013	1,775	0,925	1,902
25		1,288	1,454	1,206	1,550		1,123	1,654	1,038	1,767	0,953	1,886
26		1,302	1,461	1,224	1,553		1,143	1,652	1,062	1,759	0,979	1,873
27		1,316	1,469	1,240	1,556		1,162	1,651	1,084	1,753	1,004	1,861
28		1,328	1,476	1,255	1,560		1,181	1,650	1,104	1,747	1,028	1,850
29		1,341	1,483	1,270	1,563		1,198	1,650	1,124	1,743	1,050	1,841
30		1,352	1,489	1,284	1,567		1,214	1,650	1,143	1,739	1,071	1,833

Васильев В.П.

ЭКОНОМЕТРИЯ и Статистический анализ с применением Excel

Для всех экономических специальностей.

Минск 2017

Лабораторная работа 1 Репрезентативность информации, 3

Лабораторная работа 3. Исследование распределений случайных величин методами описательной статистики. 8

Лабораторная работа 4. Корреляционный анализ двухфакторных выборок. 13

Лабораторная работа 5. Регрессионно-корреляционный анализ двухфакторных выборок. 20

Лабораторная работа 6. Корреляционный анализ многофакторных выборок. 25

Лабораторная работа 7. Регрессионно-корреляционный анализ многофакторных выборок. 29

Лабораторная работа 8.Нелинейная регрессия. 32

Лабораторная работа 9.Статистический анализ выборок с категорийными переменными. 37

Лабораторная работа 10. Построение модели регрессии при наличии гетероскедастичности и автокорреляции. 42

Лабораторная работа11. Системы эконометрических уравнений. 48

Лабораторная работа 12 Расчет и оценка параметров динамической эконометрической модели. 51

Приложение 1. 55

Приложение 2. 56

Лабораторная работа 1 Репрезентативность информации,

Назначение. Для упрощения сбора информации и проведения расчетов экономическое исследование может проводиться не по всей совокупности единиц, подлежащих обследованию, а по её части, которая репрезентирует (представляет) данную совокупность. Подлежащая изучению совокупность, из которой производят отбор, называется генеральной совокупностью, а часть её, подлежащая обследованию, — выборочной совокупностью или выборкой. Результаты изучения выборки дают возможность судить о всей совокупности.

Пример. Рассчитайте численность выборки, характеризующей цену реализации некоторого товара, если известно, что на рынке присутствует 200 фирм, занимающихся его реализацией, а ошибка полученных результатов не должна превышать 1 ден. ед. с вероятностью 90%. Дисперсия цены реализации равна 15,7.

Методика выполнения. Поскольку обследованию подвергаются не все объекты, а только часть из них, невозможно избежать ошибок в полученных результатах. Поэтому численность выборки должна быть достаточной для обеспечения заданной точности, которая характеризуется предельной ошибкой (e) и вероятностью (р) того, что полученное значение не выйдет за границы предельной ошибки. Для расчета численности выборки используется не само значение вероятности, а коэффициент t, непосредственно от неё зависящий. Некоторые значения t для часто встречающихся в расчетах вероятностей следующие:

p	0,5000	0,7500	0,9000	0,9500	0,9900	0,9950	0,9990
t	0,6745	1,1504	1,6449	1,9600	2,5759	2,8771	3,2901

Численность выборки для бесповторного отбора определяется по формуле

где N – численность генеральной совокупности;

s – стандартное (среднее квадратическое) отклонение признака в генеральной совокупности.

Значение дисперсии может быть заимствовано из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, проводится специальное выборочное обследование небольшого объема.

В рассматриваемом случае численность выборки должна быть равна

т. е. для обеспечения заданной точности необходимо иметь 35 наблюдений.

Задания

Дата: 2018-12-21, просмотров: 456.

12 3 4 5 6 7 8 9 10 Следующая ⇒