Линейное уравнение регрессии
Линейное уравнение регрессии
Всероссийский заочный финансово-экономический институт Лабораторная работа по дисциплине "Эконометрика" Брянск 2010 Задание В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996г.). Таблица 1 - Исходные данные |
№ п/п | Х1 | Х2 | Х3 | Х4 | Х5 | Х6 | Х7 | Х8 | У | | 1 | 1 | 1 | 39 | 20 | 8,2 | 0 | 1 | 0 | 15,9 | | 2 | 3 | 1 | 68,4 | 40,5 | 10,7 | 0 | 1 | 0 | 27 | | 3 | 1 | 1 | 34,8 | 16 | 10,7 | 0 | 1 | 12 | 13,5 | | 4 | 1 | 1 | 39 | 20 | 8,5 | 0 | 1 | 12 | 15,1 | | 5 | 2 | 1 | 54,7 | 28 | 10,7 | 0 | 1 | 12 | 21,1 | | 6 | 3 | 1 | 74,7 | 46,3 | 10,7 | 0 | 1 | 12 | 28,7 | | 7 | 3 | 1 | 71,7 | 45,9 | 10,7 | 0 | 0 | 0 | 27,2 | | 8 | 3 | 1 | 74,5 | 47,5 | 10,4 | 0 | 0 | 0 | 28,3 | | 9 | 4 | 1 | 137,7 | 87,2 | 14,6 | 0 | 1 | 0 | 52,3 | | 10 | 1 | 1 | 40 | 17,7 | 11 | 1 | 1 | 8 | 22 | | 11 | 2 | 1 | 53 | 31,1 | 10 | 1 | 1 | 8 | 28 | | 12 | 3 | 1 | 86 | 48,7 | 14 | 1 | 1 | 8 | 45 | | 13 | 4 | 1 | 98 | 65,8 | 13 | 1 | 1 | 8 | 51 | | 14 | 2 | 1 | 62,6 | 21,4 | 11 | 1 | 1 | 0 | 34,4 | | 15 | 1 | 1 | 45,3 | 20,6 | 10,4 | 1 | 1 | 8 | 24,7 | | 16 | 2 | 1 | 56,4 | 29,7 | 9,4 | 1 | 1 | 8 | 30,8 | | 17 | 1 | 1 | 37 | 17,8 | 8,3 | 0 | 1 | 0 | 15,9 | | 18 | 3 | 1 | 67,5 | 43,5 | 8,3 | 0 | 1 | 0 | 29 | | 19 | 1 | 1 | 37 | 17,8 | 8,3 | 0 | 1 | 3 | 15,4 | | 20 | 3 | 1 | 69 | 42,4 | 8,3 | 0 | 1 | 3 | 28,6 | | 21 | 1 | 1 | 40 | 20 | 8,3 | 0 | 0 | 0 | 15,6 | | 22 | 3 | 1 | 69,1 | 41,3 | 8,3 | 0 | 1 | 0 | 27,7 | | 23 | 2 | 1 | 38,1 | 35,4 | 13 | 1 | 1 | 20 | 34,1 | | 24 | 2 | 1 | 75,3 | 41,4 | 12,1 | 1 | 1 | 20 | 37,7 | | 25 | 3 | 1 | 83,7 | 48,5 | 12,1 | 1 | 1 | 20 | 41,9 | | 26 | 1 | 1 | 48,7 | 22,3 | 12,4 | 1 | 1 | 20 | 24,4 | | 27 | 1 | 1 | 39,9 | 18 | 8,1 | 1 | 0 | 0 | 21,3 | | 28 | 2 | 1 | 68,6 | 35,5 | 17 | 1 | 1 | 12 | 36,7 | | 29 | 1 | 1 | 39 | 20 | 9,2 | 1 | 0 | 0 | 21,5 | | 30 | 2 | 1 | 48,6 | 31 | 8 | 1 | 0 | 0 | 26,4 | | 31 | 3 | 1 | 98 | 56 | 22 | 1 | 0 | 0 | 53,9 | | 32 | 2 | 1 | 68,5 | 30,7 | 8,3 | 1 | 1 | 6 | 34,2 | | 33 | 2 | 1 | 71,1 | 36,2 | 13,3 | 1 | 1 | 6 | 35,6 | | 34 | 3 | 1 | 68 | 41 | 8 | 1 | 1 | 12 | 34 | | 35 | 1 | 1 | 38 | 19 | 7,4 | 1 | 1 | 12 | 19 | | 36 | 2 | 1 | 93,2 | 49,5 | 14 | 1 | 1 | 12 | 46,6 | | 37 | 3 | 1 | 117 | 55,2 | 25 | 1 | 1 | 12 | 58,5 | | 38 | 1 | 2 | 42 | 21 | 10,2 | 1 | 0 | 12 | 24,2 | | 39 | 2 | 2 | 62 | 35 | 11 | 1 | 0 | 12 | 35,7 | | 40 | 3 | 2 | 89 | 52,3 | 11,5 | 1 | 1 | 12 | 51,2 | | 41 | 4 | 2 | 132 | 89,6 | 11 | 1 | 1 | 12 | 75,9 | | 42 | 1 | 2 | 40,8 | 19,2 | 10,1 | 1 | 1 | 6 | 21,2 | | 43 | 2 | 2 | 59,2 | 31,9 | 11,2 | 1 | 1 | 6 | 30,8 | | 44 | 3 | 2 | 65,4 | 38,9 | 9,3 | 1 | 1 | 6 | 34 | | 45 | 2 | 2 | 60,2 | 36,3 | 10,9 | 1 | 1 | 12 | 31,9 | | 46 | 3 | 2 | 82,2 | 49,7 | 13,8 | 1 | 1 | 12 | 43,6 | | 47 | 3 | 2 | 98,4 | 52,3 | 15,3 | 1 | 1 | 12 | 52,2 | | 48 | 3 | 3 | 76,7 | 44,7 | 8 | 1 | 1 | 0 | 43,1 | | 49 | 1 | 3 | 38,7 | 20 | 10,2 | 1 | 1 | 6 | 25 | | 50 | 2 | 3 | 56,4 | 32,7 | 10,1 | 1 | 1 | 6 | 35,2 | | 51 | 3 | 3 | 76,7 | 44,7 | 8 | 1 | 1 | 6 | 40,8 | | 52 | 1 | 3 | 38,7 | 20 | 10,2 | 1 | 0 | 0 | 18,2 | | 53 | 1 | 3 | 41,5 | 20 | 10,2 | 1 | 1 | 0 | 20,1 | | 54 | 2 | 3 | 48,8 | 28,5 | 8 | 1 | 0 | 0 | 22,7 | | 55 | 2 | 3 | 57,4 | 33,5 | 10,1 | 1 | 1 | 0 | 27,6 | | 56 | 3 | 3 | 76,7 | 44,7 | 8 | 1 | 1 | 0 | 36 | | 57 | 1 | 4 | 37 | 17,5 | 8,3 | 0 | 1 | 7 | 17,8 | | 58 | 2 | 4 | 54 | 30,5 | 8,3 | 0 | 1 | 7 | 25,9 | | 59 | 3 | 4 | 68 | 42,5 | 8,3 | 0 | 1 | 7 | 32,6 | | 60 | 1 | 4 | 40,5 | 16 | 11 | 0 | 1 | 3 | 19,8 | | 61 | 2 | 4 | 61 | 31 | 11 | 0 | 1 | 3 | 29,9 | | 62 | 3 | 4 | 80 | 45,6 | 11 | 0 | 1 | 3 | 39,2 | | 63 | 1 | 3 | 52 | 21,2 | 11,2 | 1 | 1 | 18 | 22,4 | | 64 | 2 | 3 | 78,1 | 40 | 11,6 | 1 | 1 | 18 | 35,2 | | 65 | 3 | 3 | 91,6 | 53,8 | 16 | 1 | 0 | 18 | 41,2 | | 66 | 1 | 4 | 39,9 | 19,3 | 8,4 | 0 | 1 | 6 | 17,8 | | 67 | 2 | 4 | 56,2 | 31,4 | 11,1 | 0 | 1 | 6 | 25 | | 68 | 3 | 4 | 79,1 | 42,4 | 15,5 | 0 | 1 | 6 | 35,2 | | 69 | 4 | 4 | 91,6 | 55,2 | 9,4 | 0 | 1 | 6 | 40,8 | | |
Принятые в таблице обозначения: Y - цена квартиры, тыс.долл.; Х1 - число комнат в квартире; Х2 - район города (1 - Приморский, Шувалово-Озерки, 2 - Гражданка, 3 - Юго-запад, 4 - Красносельский); Х3 - общая площадь квартиры (м2); Х4 - жилая площадь квартиры (м2); Х5 - площадь кухни (м2); Х6 - тип дома (1 - кирпичный, 0 - другой); Х7 - наличие балкона (1 - есть, 0 - нет); Х8 - число месяцев до окончания срока строительства. 1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район). 2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z. 3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны. 4) Постройте модель у = f(х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели? 5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга? 6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2. Решение 1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных. |
Х1 | Z | Х3 | Х4 | Х5 | Х6 | Х7 | Х8 | У | | 1 | 1 | 39 | 20 | 8,2 | 0 | 1 | 0 | 15,9 | | 3 | 1 | 68,4 | 40,5 | 10,7 | 0 | 1 | 0 | 27 | | 1 | 1 | 34,8 | 16 | 10,7 | 0 | 1 | 12 | 13,5 | | 1 | 1 | 39 | 20 | 8,5 | 0 | 1 | 12 | 15,1 | | 2 | 1 | 54,7 | 28 | 10,7 | 0 | 1 | 12 | 21,1 | | 3 | 1 | 74,7 | 46,3 | 10,7 | 0 | 1 | 12 | 28,7 | | 3 | 1 | 71,7 | 45,9 | 10,7 | 0 | 0 | 0 | 27,2 | | 3 | 1 | 74,5 | 47,5 | 10,4 | 0 | 0 | 0 | 28,3 | | 4 | 1 | 137,7 | 87,2 | 14,6 | 0 | 1 | 0 | 52,3 | | 1 | 1 | 40 | 17,7 | 11 | 1 | 1 | 8 | 22 | | 2 | 1 | 53 | 31,1 | 10 | 1 | 1 | 8 | 28 | | 3 | 1 | 86 | 48,7 | 14 | 1 | 1 | 8 | 45 | | 4 | 1 | 98 | 65,8 | 13 | 1 | 1 | 8 | 51 | | 2 | 1 | 62,6 | 21,4 | 11 | 1 | 1 | 0 | 34,4 | | 1 | 1 | 45,3 | 20,6 | 10,4 | 1 | 1 | 8 | 24,7 | | 2 | 1 | 56,4 | 29,7 | 9,4 | 1 | 1 | 8 | 30,8 | | 1 | 1 | 37 | 17,8 | 8,3 | 0 | 1 | 0 | 15,9 | | 3 | 1 | 67,5 | 43,5 | 8,3 | 0 | 1 | 0 | 29 | | 1 | 1 | 37 | 17,8 | 8,3 | 0 | 1 | 3 | 15,4 | | 3 | 1 | 69 | 42,4 | 8,3 | 0 | 1 | 3 | 28,6 | | 1 | 1 | 40 | 20 | 8,3 | 0 | 0 | 0 | 15,6 | | 3 | 1 | 69,1 | 41,3 | 8,3 | 0 | 1 | 0 | 27,7 | | 2 | 1 | 38,1 | 35,4 | 13 | 1 | 1 | 20 | 34,1 | | 2 | 1 | 75,3 | 41,4 | 12,1 | 1 | 1 | 20 | 37,7 | | 3 | 1 | 83,7 | 48,5 | 12,1 | 1 | 1 | 20 | 41,9 | | 1 | 1 | 48,7 | 22,3 | 12,4 | 1 | 1 | 20 | 24,4 | | 1 | 1 | 39,9 | 18 | 8,1 | 1 | 0 | 0 | 21,3 | | 2 | 1 | 68,6 | 35,5 | 17 | 1 | 1 | 12 | 36,7 | | 1 | 1 | 39 | 20 | 9,2 | 1 | 0 | 0 | 21,5 | | 2 | 1 | 48,6 | 31 | 8 | 1 | 0 | 0 | 26,4 | | 3 | 1 | 98 | 56 | 22 | 1 | 0 | 0 | 53,9 | | 2 | 1 | 68,5 | 30,7 | 8,3 | 1 | 1 | 6 | 34,2 | | 2 | 1 | 71,1 | 36,2 | 13,3 | 1 | 1 | 6 | 35,6 | | 3 | 1 | 68 | 41 | 8 | 1 | 1 | 12 | 34 | | 1 | 1 | 38 | 19 | 7,4 | 1 | 1 | 12 | 19 | | 2 | 1 | 93,2 | 49,5 | 14 | 1 | 1 | 12 | 46,6 | | 3 | 1 | 117 | 55,2 | 25 | 1 | 1 | 12 | 58,5 | | 1 | 1 | 42 | 21 | 10,2 | 1 | 0 | 12 | 24,2 | | 2 | 1 | 62 | 35 | 11 | 1 | 0 | 12 | 35,7 | | 3 | 1 | 89 | 52,3 | 11,5 | 1 | 1 | 12 | 51,2 | | 4 | 1 | 132 | 89,6 | 11 | 1 | 1 | 12 | 75,9 | | 1 | 1 | 40,8 | 19,2 | 10,1 | 1 | 1 | 6 | 21,2 | | 2 | 1 | 59,2 | 31,9 | 11,2 | 1 | 1 | 6 | 30,8 | | 3 | 1 | 65,4 | 38,9 | 9,3 | 1 | 1 | 6 | 34 | | 2 | 1 | 60,2 | 36,3 | 10,9 | 1 | 1 | 12 | 31,9 | | 3 | 1 | 82,2 | 49,7 | 13,8 | 1 | 1 | 12 | 43,6 | | 3 | 1 | 98,4 | 52,3 | 15,3 | 1 | 1 | 12 | 52,2 | | 3 | 0 | 76,7 | 44,7 | 8 | 1 | 1 | 0 | 43,1 | | 1 | 0 | 38,7 | 20 | 10,2 | 1 | 1 | 6 | 25 | | 2 | 0 | 56,4 | 32,7 | 10,1 | 1 | 1 | 6 | 35,2 | | 3 | 0 | 76,7 | 44,7 | 8 | 1 | 1 | 6 | 40,8 | | 1 | 0 | 38,7 | 20 | 10,2 | 1 | 0 | 0 | 18,2 | | 1 | 0 | 41,5 | 20 | 10,2 | 1 | 1 | 0 | 20,1 | | 2 | 0 | 48,8 | 28,5 | 8 | 1 | 0 | 0 | 22,7 | | 2 | 0 | 57,4 | 33,5 | 10,1 | 1 | 1 | 0 | 27,6 | | 3 | 0 | 76,7 | 44,7 | 8 | 1 | 1 | 0 | 36 | | 1 | 0 | 37 | 17,5 | 8,3 | 0 | 1 | 7 | 17,8 | | 2 | 0 | 54 | 30,5 | 8,3 | 0 | 1 | 7 | 25,9 | | 3 | 0 | 68 | 42,5 | 8,3 | 0 | 1 | 7 | 32,6 | | 1 | 0 | 40,5 | 16 | 11 | 0 | 1 | 3 | 19,8 | | 2 | 0 | 61 | 31 | 11 | 0 | 1 | 3 | 29,9 | | 3 | 0 | 80 | 45,6 | 11 | 0 | 1 | 3 | 39,2 | | 1 | 0 | 52 | 21,2 | 11,2 | 1 | 1 | 18 | 22,4 | | 2 | 0 | 78,1 | 40 | 11,6 | 1 | 1 | 18 | 35,2 | | 3 | 0 | 91,6 | 53,8 | 16 | 1 | 0 | 18 | 41,2 | | 1 | 0 | 39,9 | 19,3 | 8,4 | 0 | 1 | 6 | 17,8 | | 2 | 0 | 56,2 | 31,4 | 11,1 | 0 | 1 | 6 | 25 | | 3 | 0 | 79,1 | 42,4 | 15,5 | 0 | 1 | 6 | 35,2 | | 4 | 0 | 91,6 | 55,2 | 9,4 | 0 | 1 | 6 | 40,8 | | |
2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде "СтатЭксперт". Протокол корреляционного анализа Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых переменных, имеющих высокий уровень корреляции между собой. Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой. Влияние независимой переменной Х3, Х4, включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917). Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303). Х1, Х2, Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005). 3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме. Линейная регрессия Уравнение будет иметь вид: у(х) = -0,505 - 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 - 0,011х8 Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7. Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ. Матрица парных корреляций Явление сильной коллинеарности наблюдается между факторами: Х1 и Х3, т.к. rх1х3 = 0,872 > 0,7 Х1 и Х4, т.к. rх1х4 = 0,917 > 0,7 Х3 и Х4, т.к. rх3х4 = 0,966 > 0,7 4) Построим модель у = f (х3, х6, х7, х8, z) в линейной форме. Результаты регрессионного анализа Модель в линейной форме будет иметь вид: у(х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 - 0,037х8 Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели. 5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2. Характеристика остатков линейной регрессии |
Характеристика | Значение | | Среднее значение | 0,000 | | Дисперсия | 10,579 | | Приведенная дисперсия | 12,220 | | Средний модуль остатков | 2,237 | | Относительная ошибка | 7,144 | | Критерий Дарбина-Уотсона | 1,154 | | Коэффициент детерминации | 0,991 | | F - значение ( n1 = 8, n2 = 58) | 764,697 | | Критерий адекватности | 36,993 | | Критерий точности | 47,492 | | Критерий качества | 44,867 | | Уравнение значимо с вероятностью 0.95 | | |
Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании: если Fфакт > Fкрит, то модель статистически значима; если Fфакт < Fкрит, то модель статистически незначима. Fфакт > Fкрит, значит модель статистически значима, т.е. пригодна к использованию. Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии. Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69-8-1 = 60 составляет 2,0003. Если tрасч > tтабл, то коэффициент статистически значим. Характеристика модели |
| Коэффициенты | Стандартная ошибка | t-статистика | | Y-пересечение | -6,10491 | 1,867676003 | -3,268720937 | | Переменная Х 1 | -0,16426 | 1,096321271 | -0,149825399 | | Переменная Х 2 | 0,744173 | 0,335026167 | 2,221237839 | | Переменная Х 3 | 0,36827 | 0,092869614 | 3,965447278 | | Переменная Х 4 | 0,147869 | 0,132602783 | 1,115126788 | | Переменная Х 5 | 0,177213 | 0,195399452 | 0,906925347 | | Переменная Х 6 | 6,93635 | 0,869661345 | 7,975921084 | | Переменная Х 7 | 1,777648 | 1,124095736 | 1,581402513 | | Переменная Х 8 | -0,04802 | 0,072432334 | -0,662966567 | | |
tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим; tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим; tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим; tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим; tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим; 6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга? tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003, значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры. Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb2 = 2,2212 > 2,0003.
| |