Статистический анализ
Статистический анализ
1. Анализ распределения элементов статистического рядаИсходная таблица содержит данные по количеству выявленных лиц, совершивших кражи чужого имущества в населенных пунктах А и Б с 1961 по 2000 гг. В то время было принято измерять временные интервалы пятилетиями. В интервале с 1961 г. по 2000 г. укладывается ровно 8 пятилеток.Таблица 1. Группировочная таблица по числу выявленных лиц в населенных пунктах А и Б с 1 по 8 пятилетку|
Пятилетка | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | | Населенный пункт А | 173 | 109 | 236 | 137 | 159 | 235 | 79 | 116 | | Населенный пункт Б | 360 | 380 | 339 | 387 | 454 | 286 | 181 | 256 | | | С точки зрения статистики у нас появились два вариационных ряда для признаков Х (населенный пункт А) и У (населенный пункт Б) с одинаковым числом вариантов n = 8 без выделения частот и относительных частот. Одновременно эти ряды являются рядами динамики для одного и того же временного интервала с 1 по 8 пятилетку. Графически они могут быть представлены в виде полигонов как ряды динамики.В рамках данной темы целесообразнее рассматривать интервальные ряды для распределения числа выявленных лиц по населенным пунктам А и Б.Таблица 2. Интервальные ряды для числа выявленных лиц по населенным пунктам А и Б|
№ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | | А | 173 | 109 | 236 | 137 | 159 | 235 | 79 | 116 | | Б | 360 | 380 | 339 | 387 | 454 | 286 | 181 | 256 | | | Таблица 2 служит таблицей частот. Для построения гистограмм лучше рассмотреть относительные частоты.Таблица 3. Статистическое распределение интервальных рядов|
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | | (Wi) А | 0,14 | 0,09 | 0,19 | 0,11 | 0,13 | 0,19 | 0,06 | 0,09 | | (Wi) Б | 0,14 | 0,14 | 0,13 | 0,15 | 0,17 | 0,11 | 0,07 | 0,10 | | | Относительные частоты вычисляются по формуле:Wi = ni/n, (n = 1, 2, 3, …, 8),где nа = 1244, nб = 2643Диаграмма 1. Гистограмма относительных частот числа выявленных лиц по населенному пункту АДиаграмма 2. Гистограмма относительных частот числа выявленных лиц по населенному пункту БНаселенный пункт А характеризуется неравномерностью распределения числа выявленных лиц, совершивших кражи. Пики преступности данного вида приходятся на 3 и 6 пятилетки. Относительное снижение преступности отмечается в 7 пятилетке (выявлено всего 79 лиц, относительная частота на гистограмме составил W7 = 0,06). В целом усматривается незначительное снижение уровня преступности.В населенном пункте Б уровень рассматриваемой преступности выше, чем в населенном пункте А. Обострение преступности произошло в 5 пятилетки. 7-ая пятилетка была спокойнее остальных.2. Вычисление основных статистических параметровТаблица 4. Основные статистические параметры рядов распределения|
| Среднее значение | Среднее квадратичное отклонение | Асимметрия | Эксцесс | | А | 155,5 | 53,661 | 0,33 | 46,135 | | Б | 330,375 | 80,404 | -0,39 | -0,66 | | | Среднее значение вычисляется по формуле:Х = 1/8 ?хСреднее квадратичное отклонениеб = vх2 - (х)2АсимметрияAs = М3/ б3ЭксцессЕх = М4/ б4где М3 = 1/8 ?(хi - х)3,М4 = 1/8 ?(хi - х)4.Отметим промежуточные результаты:М3(А) = 51664,875;М4(А) = 407404409,3;М3(Б) = -201499,2539;М4(Б) = 97879670,62.Видно, что в населенном пункте Б средний уровень преступности почти в 2 раза больше, чем в населенном пункте А.У соответствующих двух рядов распределения разный характер асимметрии. Довольно большой эксцесс у первого признака, у второго - незначительный.Заметим, что нулевое значение эксцесса характерно для нормального закона распределения (распределения Гаусса).3. Анализ динамических рядовТаблица 5. Ряды динамики числа выявленных лиц по населенным пунктам А и Б|
Номер пятилетки | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | | Х | 173 | 109 | 236 | 137 | 159 | 235 | 79 | 116 | | У | 360 | 380 | 339 | 387 | 454 | 286 | 181 | 256 | | | Таблица 6. Основные показатели динамики по населенному пункту А|
Пятилетка | Число лиц | Абсолютный прирост (?) | Темп роста Тр, % | Темп прироста Тпр, % | Абсолютное значение 1% прироста | | | | цеп ной | базис ный | цеп ной | базисный | цепной | базисный | | | 1 | 173 | - | - | 100,0 | 100,0 | 0,0 | 0,0 | - | | 2 | 109 | -64 | -64 | 63,0 | -37,0 | -37,0 | -37,0 | 1,73 | | 3 | 236 | 127 | 63 | 216,5 | 136,4 | 116,5 | 36,4 | 1,09 | | 4 | 137 | -99 | -36 | 58,1 | 79,2 | -41,9 | -20,8 | 2,36 | | 5 | 159 | 22 | -14 | 116,1 | 91,9 | 16,1 | -8,1 | 1,37 | | 6 | 235 | 76 | 63 | 147,8 | 135,8 | 47,8 | 35,8 | 1,59 | | 7 | 79 | -166 | -94 | 33,6 | 45,7 | -66,4 | -54,3 | 2,35 | | 8 | 116 | 37 | -57 | 146,8 | 67,1 | 46,8 | -32,9 | 0,79 | | В среднем | 155,5 | | -8 | | 82,5 | | -17,5 | | | | Таблица 7. Основные показатели динамики по населенному пункту Б|
Пятилетка | Число лиц | Абсолютный прирост (?) | Темп роста Тр, % | Темп прироста Тпр, % | Абсолютное значение 1% прироста | | | | цеп ной | базис ный | цеп ной | базисный | цепной | базисный | | | 1 | 360 | - | - | 100,0 | 100,0 | 0,0 | 0,0 | - | | 2 | 380 | 20 | 20 | 105,6 | 105,6 | 5,6 | 5,6 | 3,6 | | 3 | 339 | -41 | -21 | 89,2 | 94,2 | -10,8 | -5,8 | 3,8 | | 4 | 387 | 48 | 27 | 114,2 | 107,5 | 14,2 | 7,5 | 3,39 | | 5 | 454 | 67 | 94 | 117,3 | 126,1 | 17,3 | 26,1 | 3,87 | | 6 | 286 | -132 | -74 | 63,0 | 79,4 | -37,0 | -20,6 | 4,54 | | 7 | 181 | -105 | -179 | 63,3 | 50,3 | -36,7 | -49,7 | 2,86 | | 8 | 256 | 75 | -104 | 141,1 | 71,1 | 41,4 | -28,9 | 1,81 | | В среднем | 330,4 | | -15 | | 87,2 | | -12,8 | | | | Диаграмма 3. Графическое изображение рядов динамики по населенным пунктам А (сплошная линия) и Б (пунктирная линия)При заполнении таблиц 6 и 7 использованы формулы для цепной формы расчета:? = у - уi,Тр = уi/уi - 1,Тпр = Тр - 1,А = уi - 1/100и для базисной формы:? = уi - у0,Тр = уi/у0,Тпр = Тр - 1,?- = ?/7,Тр- = 7v(Тр)1 (Тр)2 … (Тр)7.Графики и расчетные таблицы говорят о небольшом снижении уровня краж по населенным пунктам А и Б. В среднем абсолютное снижение больше у населенного пункта Б, а темп снижения больше у пункта А. Но сам уровень преступности все время остается выше в населенном пункте Б.4. Корреляционная зависимостьПарный коэффициент корреляцииЧху = ху- - х-*у-/бхбу.После вычисления среднего значенияху- = 1/8?хiyi = 52514,25получаем Чху = 0,26Корреляционная зависимость слабая.У величины Чху как у случайной величины есть среднее квадратичное отклонениеmч = v1-ч2/n-2 = 0,4Величина tч = ч/ mч распределена по закону Стьюдента со степенью свободы к = n - 2 = 6.При уровне значимости а = 0,05Табличное значениеtтабл = 2,4469Предельная ошибка?ч = tтабл * mч = 0,98.Поскольку вообще -1?чху?1, то вычисленная ошибка ?ч = 0,98 смысла не имеет. Причина кроется в слабой тесной связи признаков х и у.5. Уравнение регрессииЛинейная регрессия у = а + вх рассчитывается по формуле:? - у- = ч бу/бх (х-х-),? - 330,4 = 0,26 * 80,404/53,661 (х - 155,5),? = 0,39х + 269,8Критерий Фишера имеет расчетное значениеF = (tч)4 = (ч/ mч)4 = 0.18При надежности 95% табличное значение F табл = 5,99. со степенями свободы к1 = 1, к2 = 6.Так как F = 0,18 ‹ 1, следует перейти к обратной величине Fфакт = 5,55. Но тогда и F табл = 233,97 для степеней свободы к1 = 6, к2 = 1.Мы видим, что все уравнение регрессии не значимо.Абсолютная ошибка ?у зависит от конкретного значения х и рассчитывается по формуле:?у = бост v1+1/8 + ?(х - х-)2/8бх2,Где в свою очередь,бост = v?(уi -?i)2/6.По формуле ? = 269,8 + 0,39х найдем восемь значений ?(х):337 312 362 323 332 361 301 315Значит, бост = 89,373.Самая малая ошибка ?у будет при х = х-:(?у)min = 34,8 * 2,4469 = 232.Для ошибки это слишком много. Это объясняется слабой теснотой корреляционной зависимости.6. Обобщение статистических данных и статистический анализПосле группировки исходных данных по пятилетним периодам получились вариационные интервальные ряды.Поэтому в их ранжировке нет необходимости.После построения гистограмм выяснилось, что распределения сильно отличаются от распределения Гаусса. Поэтому их исследование с помощью понятий асимметрии и эксцесса становится формальным.Вычисление средних значений позволило сделать вывод о почти двукратном превышении показателя преступности в населенном пункте Б. Это подтверждает и сравнительная диаграмма 3.В течение первых шести пятилеток в населенных пунктах А и Б отмечались противоположные тенденции по динамике уровня выявленных лиц, а в последние две пятилетки эти тенденции совпадали. В целом заметно небольшое снижение уровня преступности данного вида. На это указали и расчеты при заполнении таблиц 6 и 7.Как и ожидалось, корреляционная зависимость показателей по двум населенным пунктам оказалась слабой. Оказалось незначимой и сама регрессионная линейная модель.По этой причине потеряли практический смысл оценки ошибок для линейного коэффициента корреляции и для прогнозных значений регрессии.Список использованной литературы1. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для ВУЗов. М.: ЮНИТИ-ДАНА, 2005.2. Практикум по эконометрике: Учебное пособие. Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2003.3. Эконометрика: Учебник. Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2004.4. Шимко П.Д., Власов М.П. Статистика/ Серия «Учебники, учебные пособия». - Ростов на Дону: Феникс, 2003.5. Глинский В.В., Ионин В.Г. Статистический анализ: Учебное пособие. М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002.6. Сборник задач по теории статистики: Учебное пособие / Под ред. В.В. Глинского и Л.К. Серга. - М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002
| |