Моделирование динамики социально-экономических показателей в системе SPSS Base
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Методику моделирования динамики социально-экономических показателей в системе SPSS Base рассмотрим на примере анализа статистических данных по демографической нагрузке в РФ в период 2005-2013 гг. Эмпирической базой анализа служили статистические данные, приведенные в ежегодниках Росстата «Регионы России. Социально-экономические показатели» за 2014, 2010 и 2008 годы (приведены в приложении). Анализу подлежали следующие показатели демографической нагрузки:

- общий коэффициент демографической нагрузки, определяемый как численность лиц нетрудоспособных возрастов в расчете на 1000 человек трудоспособного населения;

- коэффициент демографической нагрузки, определяемый как численность лиц моложе трудоспособного возраста в расчете на 1000 человек трудоспособного населения[1];

- коэффициент демографической нагрузки, определяемый как численность лиц старше трудоспособных возраста в расчете на 1000 человек трудоспособного населения.

Конечной целью анализа является сравнение динамики показателей демографической нагрузки в регионах Центрального федерального округа.

Исходные данные, использованные в примере, приведены в табл. 2)

              Таблица 2

Динамика коэффициентов демографической нагрузки в РФ в период 2005-2013 гг. (на 1000 человек трудоспособного возраста)

 

Год 2005 2005 2007 2008 2009 2010 2011 2012 2013
Всего населения нетрудоспособного возраста 580 578   582 590 606 626 643 664 687
Моложе трудоспособного возраста 258 252 251 253 259 264 271 280 290
Старше трудоспособного возраста 322 326 331 337 347 362 372 384 397

 

В редактор данных системы SPSS Base вводим:

- переменную «год»;

- уровни временных рядов коэффициента демографической нагрузки в РФ – переменные «Всего», «Моложе», «Старше».

Результаты ввода данных приведены на рис. 1 (получен с помощью процедуры «Отчеты итогов в колонках» системы SPSS Base).

 

  Год     Всего Моложе Старше ________ ________ ________ ________   2005      580  258  322 2006      578  252  326 2007      582  251  331 2008      590  253  337 2009      606  259  347 2010      626  264  362 2011      643  271  372 2012      664  280  384 2013      687  290  397  
  Рис. 1. Временные ряды коэффициентов демографической нагрузки в РФ в редакторе данных системы SPSS Base

 

Как видно из рис. 1, уровни временного ряда общего коэффициента демографической нагрузки равны суммам уровней временных рядов коэффициентов демографической нагрузки, определяемых для лиц моложе и старше трудоспособного возраста.

Графики временных рядов коэффициентов демографической нагрузки в РФ, построенные с помощью процедуры «Sequence» (последовательность) системы SPSS Base, представлены на рис. 2.

 

 

а б

Рис. 2. Графики временных рядов коэффициента демографической нагрузки в РФ: а – все население нетрудоспособного возраста; б – население моложе и старше трудоспособного возраста. Вертикальной пунктирной линией отмечен 2008 г., отвечающий изменению характера динамики показателей

 

Судя по характеру временных рядов – медленный рост показателей в начале периода наблюдений и ускорение роста после 2008 г. (отмечено вертикальной пунктирной линией), устанавливаем временной диапазон анализа – 2008-2013 гг. и горизонт прогнозирования – 2014-2015 гг.

Поскольку график временного ряда, представленный на рис. 2 а, является суммой временных рядов графиков рис. 2 б, анализ достаточно, в принципе, выполнить только для двух последних показателей – коэффициентов демографической нагрузки населением моложе и старше трудоспособного возраста.

Судя по рис. 2, конкурирующими моделями тренда временных рядов этих показателей могут быть:

1) двухпараметрическая экспоненциальная модель роста вида

х = b0 exp(b1t);                                                          (5)

2) трехпараметрическая параболическая модель вида

х = b0 + b1t + b2t2.                                                       (6)

Обе модели допускают значение временной переменной t=0, и вместо переменной «год» используем переменную

t=год-2008.                                                            (7)

Согласно соотношению (7), начальному году анализируемого периода (2008-му) отвечает значение временной переменной t=0, конечному – 2013-му году – t=5, прогнозным 2014 и 2015 годам – значения временной переменной t=6 и 7 соответственно.

Исходные данные по временным рядам коэффициентов демографической нагрузки в РФ в период 2008-2015 гг., подготовленные к моделированию и прогнозированию, представлены на рис. 3. Расчетные значения уровней временных переменных «Всего», «Моложе», «Старше» пока не определены, а фактические их значения для 2014-2015 гг. на рис. 3 отмечены точками, обозначающими пропуски.

 

 

  Год  Время   Всего Моложе Старше ________ ________ ________ ________ ________   2008 0         590  253  337 2009 1         606  259  347 2010 2         626  264  362 2011 3         643  271  372 2012 4         664  280  384 2013 5         687  290  397 2014 6           .    .    . 2015 7                .    .    .  
  Рис. 3. Исходные данные по временным рядам коэффициентов демографической нагрузки в РФ в период 2008-2015 гг., подготовленные к моделированию и прогнозированию

 

Расчет параметров конкурирующих моделей тренда временного ряда проводим в программной среде модуля Curve Estimation пакета SPSS Base.

Результатом моделирования являются:

1) текстовая таблица «ANOVA table», содержащая следующие результаты моделирования:

- статистические характеристики качества модели;

- собственно таблица дисперсионного анализа;

- МНК-оценки параметров модели и их статистические характеристики;

2) графики, отражающие результаты моделирования.

На рис. 4 приведена таблица «ANOVA table» для экспоненциальной модели роста общего коэффициента демографической нагрузки в РФ в период 2008-2013 гг.

Поясним эту таблицу. В ее верхней части приведены статистические характеристики качества модели:

- «Multiple R» – множественный коэффициент корреляции;

- «R Square» – коэффициент детерминации R2;

- «Adjusted R Square» – коэффициент детерминации, скорректированный на число параметров модели;

- «Standard Error» – стандартная ошибка аппроксимации.

В центре таблицы «ANOVA table» – собственно таблица дисперсионного анализа. Приведены для регрессии (Regression) и остатков (Residuals):

- «DF» – число степеней свободы;

- «Sum of Squares» – сумма квадратов;

- «Mean Square» – средний квадрат,

а также критерий Фишера (F) и уровень его статистической значимости (Signif F).

Заключают таблицу «ANOVA table» данные по оценке коэффициентов регрессии (B):

- «ВРЕМЯ» – коэффициент регрессии при временной переменной;

- «(Constant)» – свободный коэффициент модели.

Здесь же приведены:

- ошибки коэффициентов регрессии (SE B);

- величина бета-коэффициента (Beta);

- значения критерия Стьюдента (T);

- уровни их статистической значимости (Sig T).

 

 

  MODEL: MOD_4.   Dependent variable.. РФ           Method.. EXPONENT   Listwise Deletion of Missing Data   Multiple R      ,99927 R Square        ,99855 Adjusted R Square ,99818 Standard Error  ,00242          Analysis of Variance:            DF Sum of Squares Mean Square   Regression 1   ,01611387   ,01611387 Residuals 4   ,00002345   ,00000586   F = 2748,13326  Signif F = ,0000   -------------------- Variables in the Equation --------------------   Variable             B   SE B  Beta    T Sig T   ВРЕ_2008       ,030345 ,000579 ,999273 52,423 ,0000 (Constant)  588,743698 1,031796         570,601 ,0000  
  Рис. 4. Пример таблицы «ANOVA table» (аппроксимация динамики общего коэффициента демографической нагрузки в РФ в период 2008-2013 гг. экспоненциальной моделью)

 

Прокомментируем данные таблицы «ANOVA table». Согласно этим данным, экспоненциальная модель тренда динамики общего коэффициента демографической нагрузки в РФ в период 2008-2013 гг. объясняет 99,9% общей дисперсии при стандартной ошибке аппроксимации логарифма показателя StErr – 0,0024, чему соответствует относительная ошибка аппроксимации показателя 0,24%.

Модель статистически значима на высоком уровне – критерий Фишера F=2748,1, а р-уровень не хуже 0,00005. Это означает, что ошибка признать модель незначимой очень мала – не более 0,005%.

В математической форме модель записывается так:

х = 588,7 exp(0,0303t),                                                (8)

где t – временная переменная, определяемая соотношением

t = год – 2008.

Коэффициент регрессии b1 при временной переменной t (b1=0,0303) статистически значим на высоком уровне – критерий Стьюдента t=52,4 значительно больше критического значения (tкрит@2), и его р-уровень не хуже 0,00005.

Экспоненциальная модель обладает тем положительным свойством, что оба ее параметра имеют четкий смысл:

- коэффициент регрессии при временной переменной t (0,0303) – это МНК-оценка темпа прироста общего коэффициента демографической нагрузки в РФ, которая составляет в среднем 3,03% в год;

- свободный коэффициент b0=588,7 – это расчетная величина общего коэффициента демографической нагрузки в РФ храсч при t=0, т.е. в начальный год временного интервала анализа – 2008 год. Это расчетное значение показателя в 2008 г. достаточно близко к фактическому значению 590.

Результаты моделирования в графическом виде для обеих конкурирующих моделей – экспоненциальной и параболической – представлены на рис. 5.

 

а б

Рис. 5. Моделирование динамики общего коэффициента демографической нагрузки в РФ в 2008-2013 г.: а – экспонентой; б – квадратичным полиномом (параболой). Полужирные линии – фактические временные ряды; пунктирные линии – расчет

 

Параметры и характеристики качества обеих моделей динамики общего коэффициента демографической нагрузки в РФ в 2008-2013 г. приведены в табл. 3

              Таблица 3

Параметры и характеристики качества конкурирующих моделей динамики общего коэффициента демографической нагрузки в РФ в 2008-2013 г.

 

Модель

Параметр модели

Характеристика качества модели

b0 b1 b2 R2 F p StErr
1 Экспоненциальная 588,7437 0,0303 - 0,9986 2748,1 <0,00005 0,0024
2 Квадратичный полином (парабола) 590,0357 15,8321 0,6964 0,9994 2679,8 <0,00005 1,1052

 

Из табл. 3 следует, что высокими характеристиками качества обладают обе конкурирующие модели динамики общего коэффициента демографической нагрузки в РФ в 2008-2013 г. – каждая из них объясняет более 99% общей дисперсии, обе статистически значимы на высоком уровне (р-уровень не хуже 0,005%).

По коэффициенту детерминации R2 предпочтительнее модель (2) – квадратичная парабола, а по критерию Фишера более предпочтительной является модель (1) – экспонента. Экспоненциальная модель (1) более простая – имеет два параметра, тогда как модель (2) – три. Кроме того, следует учитывать, что полиномы могут быть использованы для интерполяции, но не рекомендуются для использования в прогнозных целях – при экстраполяции за пределы временного диапазона анализа они часто искажают характер тренда, хотя в данном конкретном случае искажения не наблюдается. 

Исходя из сравнительного анализа, в качестве модели динамики общего коэффициента демографической нагрузки в РФ в 2008-2013 г. принимаем экспоненциальную модель (1). Дополнительным доводом в ее пользу является четкая интерпретируемость параметров экспоненциальной модели – параметр b0 (свободный коэффициент) равен расчетному значению показателя в начальный год временного диапазона анализа (2008 г.), параметр b1 (коэффициент регрессии при временной переменной) – это среднее значение коэффициента прироста. Коэффициент прироста b1=0,0303, т.е. темп прироста общего коэффициента демографической нагрузки в РФ в 2008-2013 г. в среднем составляет 3,03% в год. Заметим также, что расчетное значение общего коэффициента демографической нагрузки в РФ в 2008 г. храсч(2008)=b0=588,7 достаточно близко к фактическому значению 590.

Ниже в табл. 4 и 5 представлены параметры и характеристики качества экспоненциальных и параболических моделей динамики двух частных коэффициентов демографической нагрузки в РФ в 2008-2013 г. – для лиц моложе и старше трудоспособного возраста.

              Таблица 4

Параметры и характеристики качества конкурирующих моделей динамики частного коэффициента демографической нагрузки в РФ в 2008-2013 г. (лица моложе трудоспособного возраста)

 

Модель

Параметр модели

Характеристика качества модели

b0 b1 b2 R2 F p StErr
1 Экспоненциальная 251,6830 0,0269 - 0,9872 307,5 0,0001 0,0064
2 Квадратичный полином (парабола) 253,4286 4,0714 0,6429 0,9988 1239,5 <0,00005 0,6172

 

              Таблица 5

Параметры и характеристики качества конкурирующих моделей динамики частного коэффициента демографической нагрузки в РФ в 2008-2013 г. (лица старше трудоспособного возраста)

 

Модель

Параметр модели

Характеристика качества модели

b0 b1 b2 R2 F p StErr
1 Экспоненциальная 337,0544 0,0329 - 0,9975 1574,8 <0,00005 0,0035
2 Квадратичный полином (парабола) 336,6071 11,7607 0,0536 0,9979 706,2 0,0001 1,3390

 

Из табл. 4 и 5 следует, что и экспоненциальные, и параболические модели динамики обеих частных коэффициентов демографической нагрузки в РФ в 2008-2013 г. (для населения моложе и старше трудоспособного возраста) обладают достаточно высокими характеристиками качества и удовлетворяют предъявляемым к аппроксимирующим моделям требованиям. Можно также отметить и близость расчетных значений частных коэффициентов демографической нагрузки в РФ по обеим моделям: для лиц моложе трудоспособного возраста это 251,7 и 253,4 соответственно при фактическом уровне показателя 253 человека на 1000 человек трудоспособного населения в 2008 году, для лиц старше трудоспособного возраста – 337,1 и 336,6 соответственно при фактическом уровне показателя 337 человека на 1000 человек трудоспособного населения.

В то же время, экспоненциальные модели предоставляют аналитику более полную информацию – по величине коэффициента регрессии при временной переменной можно судить о темпах роста демографической нагрузки на трудоспособное население: для лиц моложе трудоспособного возраста средний темп прироста показателя составляет 2,69% в год, для лиц, старше трудоспособного возраста – 3,29% в год. Напомним, что темп прироста общего коэффициента демографической нагрузки в РФ в 2008-2013 г. в среднем составляет 3,03% в год, т.е. демографическую нагрузку на трудоспособное население в большей мере определяется старшим поколением, и это тенденция сохраняется.   

 

Дата: 2018-11-18, просмотров: 477.