Изучение зависимости численности населения, количества предприятий, численности пенсионеров и средней заработной платы от численности работников по Республике Саха (Якутия) методом множественной регрессии и корреляции

В данной расчетной работе исследована зависимость таких факторов как численность населения, количество предприятий, численность пенсионеров, средняя заработная плата от численности работников муниципальных районов РС(Я), в том числе ГО Якутск.

Целью анализа является в построении модели с большим числом факторов, в определении при этом влияние каждой из них в отдельности, а также в определении совокупной воздействии их на моделируемый показатель.

Цель работы определяет следующие задачи:

  1. Построить поле регрессии, корреляции
  2. Определить мультиколленеарность факторов
  3. Сделать оценку мультиколленеарности путем построения матрицы, а также найти определитель матрицы
  4. Выдвигать гипотезу Н0 путем сравнения х2 с хтабл (Критерий Пирсона) и доказать мультиколлениарность факторов
  5. Построить уравнение множественной регрессии и объяснить экономический смысл коэффициента регрессий
  6. Рассчитать частные коэффициенты корреляции, , эластичности, индекс множественной корреляции и регрессии.
  7. Оценить стаитистическую надежность построенной модели
Множественная регрессия и корреляция на примере влияния таких факторов как численность населения, количество предприятий, численность пенсионеров, средняя заработная плата на численность работников муниципальных районов РС(Я), в том числе ГО Якутск.

В данной расчетной работе были использованы следующие показатели:

  1. численность населения –х1
  2. количество предприятий – х2
  3. численность пенсионеров – х3
  4. средняя заработная плата – х4
  5. численность работников -у
Построим поле регрессии и корреляции.
  1. Постановочный.
Построить модель взаимосвязи таких факторов как численность населения, количество предприятий, численность пенсионеров, средняя заработная плата с численностью работников муниципальных районов РС(Я), в том числе ГО Якутск.
  1. Априорный.
Между факторами X1 (численность населения), Х2 (количество предприятий), Х3 (численность пенсионеров), Х4 (средняя заработная плата)  и результативным признаком Y (численность работников) существует взаимосвязь, поскольку существуют сведения, что на изменение численности работников влияют такие факторы как: численность населения, общее количество предприятий, средняя заработная плата работников, численность пенсионеров, уровень безработицы, инфляция. Предполагается, что связь между Xами  и Y:

- по направлению в основном прямые

- по тесноте сильная

  1. Параметризация
  2. численность населения –х1
  3. количество предприятий – х2
  4. численность пенсионеров – х3
  5. средняя заработная плата – х4
Y –  Количество работников
  1. Информационный
При  составлении эмпирической базы Y –  количество работников, численность населения –х1, количество предприятий – х2, численность пенсионеров – х3, средняя заработная плата – х4, использовался сайт  Государственной собрании (ИЛ ТУМЭН) РС(Я), точка доступа: http://iltumen.ru/content/sotsialno-ekonomicheskogo-razvitie-raionov-i-gorodov-respubliki-sakha-yakutiya

Данные эмпирической базы представлены в таблице 1.

Таблица 1.

МР y x1 x2 x3 x4
Числ.

работников

числ.нас. количество предприятий числ.пенсионеров ср.зар.плата
Абыйский 1378 4,1 110 1459 54477
Алданский 15913 39,6 800 14122 61919
Аллаиховский 778 2,7 107 984 58836
Амгинский 3575 16,8 259 5118 39539
Анабарский 1471 3,6 98 896 100148
Булунский 2714 8,4 175 2062 64597
Верхневилюйский 3990 21,1 306 6152 39111
Верхнеколымский 1503 4,2 140 1497 58411,4
Верхоянский 3157 11,4 243 3968 46113
Вилюйский 5753 25,1 405 8307 42581
Горный 2233 12 231 3342 39953
Жиганский 1212 4,3 151 1377 47281
Кобяйский 2965 12,5 234 4046 41631
Ленский 25273 37,2 587 11319 79528
Мегино-Кангаласский 5855 31,1 451 10055 40465
Мирнинский 36793 72,6 1084 21694 97347
Момский 1211 4,1 121 1304 44324
Намский 3903 24,6 495 6393 40734
Нерюнгринский 23088 74,4 1832 24335 64530
Нижнеколымский 1386 4,3 124 1548 50434
Нюрбинский 7397 24,1 387 8460 58826
Оймяконский 4350 8,6 326 3230 81040
Олекминский 8199 25 348 8195 62832
Оленекский 1244 4,1 141 1214 76847
Среднеколымский 1803 7,5 172 2608 44847
Сунтарский 4966 23,8 384 7742 38917
Таттинский 3390 16,4 230 5241 40674
Томпонский 3411 12,8 252 4244 49728
Усть-Алданский 4066 20,9 370 6628 39445
Усть-Майский 2719 7,5 187 2700 48451
Усть-Янский 1845 7,2 234 2739 57049
Хангаласский 7710 32,8 550 9990 42831
Чурапчинский 4499 21,2 350 6367 38816
Эвено-Бытантайский 797 2,8 88 851 37454
ГО "Город Якутск" 82167 326,9 13455 72362 60841
Идентификация модели

Поле корреляции показывает наличие связи между факторами x1 x3, x2 x4 и возможно существует мультиколленеарность, так как их значения больше или равны 0,7

Значения количества предприятий равно 0,982788, число пенсионеров равно 0,951385944

Далее проверяем наличие мультиколленеарности между факторами, и получили, что определитель матрицы det( R )= 0,000138. Так как определитель ближе  к 0, то предполагаем наличие МК между факторами

Далее выдвигаем гипотезу Н0 путем сравнения х2 с хтабл (Критерий Пирсона) и доказываем мультиколлениарность факторов:

ХИ^2 равен 42,36024, а ХИ^2 табличное равно 43,77297, отсюда следует, что так как ХИ2 меньше табличного, гипотеза принимается, все факторы оставляем в модели.

Далее составляем поле регрессии, множественный R равен 0,987987, это говорит о том, что связь сильная и прямая между факторами.

F= 306,5391>Fтабл, гипотеза отклоняется признается статистически значимой и надежность уравнения.

Из таблицы видно, проведя оценку статистической значимости коэффициентов уравнения регрессии принимаем решение убрать из модели фактор x3(численность пенсионеров) так как ее t статистика меньше табличного значения, t статистика (численность пенсионеров) -0,734898310872005 < 2,042272456 t табличной.

Далее строим поле регрессии трехфакторной модели, убрав фактор (численность пенсионеров). Из таблицы следует, что множественный R равен 0,987769. Это говорит о том, что связь сильная и прямая между факторами.

F= 414,691266042122>Fтабл, гипотеза отклоняется признается статистически значимой и надежность уравнения.

Вывод

Проведя оценку статистической значимости коэффициентов уравнения регрессии принимаем решение оставить все факторы в модели так как их значения t статистики больше чем t табличной. (t статистики факторов: численность населения: 11,232303167137, количество предприятий -5,31481183808506, средняя заработная плата 5,394022, а t табличная: 2,039513)

Уравнение регрессии показывает, что при снижении количества работников на 1 человека, численность населения увеличится на 477,81, количество предприятий уменьшится на 5,52, а средняя заработная плата увеличится на 0,14.

Список использованной литературы: