Дисперсионный анализ
МИНИСТЕРСТВО ОБРАЗОВАНИЯ УКРАИНЫ
ДОНЕЦКАЯ ГОСУДАРСТВЕННАЯ МАШИНОСТРОИТЕЛЬНАЯ АКАДЕМИЯ
КАФЕДРА: ЭКОНОМИКА И ФИНАНСЫ
ЛАБОРАТОРНАЯ РАБОТА
ПО КУРСУ «СТАТИСТИКА»
2008 г.
Выполнение задания начинают с группирования совокупности данных для этого определяют количество групп с равными интервалами и рассчитывают величины интервала.
Величина интервала:
d = (xmax - xmin) / n,
ГдеХmax, Xmin - соответственно максимум и минимум значения сгруппированного признака;n - число групп.Границы вариант (групп) определяются путем прибавления минимального значения и величин интервала к минимальному признаку, т.е.[xmin + (xmin + d)],ГдеXmin - нижняя граница инт6ервала (Xmin+d) - верхняя граница интервала.Для следующей варианты (Xmin+d) становятся нижней границей интервала, а верхняя граница на d - больше нижней и т.д. Образовав группы с равными интервалами находят частоту (вес) каждой группы (вариант) т.е. подсчитывают число единиц совокупности входящих в каждую группу при этом необходимо задаться условием: если знание признака у единицы больше совокупности верхней границе интервала то это единица войдет в следующий интервал, т.е. чтобы Xi вошло в соответствующую группу ее значение должно быть в пределахxmin < xi < (xmin + d)Для расчета средней и показателей вариации определяют середину интервала (Xi), которая равна полу сумме его нижней и верхней границ.Xi =[Xmin + (Xmin + d)]/2Расчет средней и показателей вариации по данным задачи требует применения арифметической средней, так как данные представлены в виде вариант и частот. Вес каждой варианты различен, поэтому расчет производят по средней арифметической взвешенной.
xi = ?xi •fi / ?fi,
Где Xi - средняя арифметическая.
Xi - значение варианты определяемого признака (средина интервала).
fi - частота (вес) варианты.
Чтобы вычислить среднюю вначале следует взвесить варианты (перемножить варианты на их частоты (Xi*fi), затем найти сумму их произведений (Xi*fi), сумму частот (fi) и поделить сумму произведений вариант на частоты на сумму частот (1)). Расчет дисперсии - производят по формуле:
?2 = ? (xi - xi)2 • fi / ? fi
Следовательно, прежде всего, необходимо найти отклонения вариант от средней (xi - xi), затем возвести их в квадрат ([(xi - xi)2]) квадраты отклонения взвесить [(xi - xi)2 • fi] и просуммировать взвешенные квадраты отклонений [? (xi - xi)2 • fi.]. Полученную сумму разделить на сумму частот (2).
Среднее квадратическое отклонение устанавливают извлечением корня квадратного из значения дисперсии
? = v ?2
Коэффициент детерминации вычисляется по формуле
?2 = ?2 вн / ?2 об,
Где ?2 вн - внутригрупповая дисперсия.
?2 об - общая дисперсия.
Эмпирическое корреляционное отношение рассчитывается по формуле
? = v ?2 вн / ?2 об,
Задача 1.
Имеются следующие данные о рабочих одного из участников механического цеха
|
Рабочий | Возраст, лет | Месячная З/П, грн. | Рабочий | Возраст, лет | Месячная З/П, грн. | |
1 | 25 | 180,00 | 11 | 18 | 100,00 | |
2 | 24 | 210,00 | 12 | 37 | 280,00 | |
3 | 46 | 390,00 | 13 | 25 | 190,00 | |
4 | 45 | 320,00 | 14 | 30 | 220,00 | |
5 | 42 | 260,00 | 15 | 26 | 210,00 | |
6 | 50 | 310,00 | 16 | 36 | 300,00 | |
7 | 29 | 240,00 | 17 | 40 | 330,00 | |
8 | 36 | 290,00 | 18 | 28 | 240,00 | |
9 | 54 | 390,00 | 19 | 35 | 280,00 | |
10 | 29 | 250,00 | 20 | 25 | 280,00 | |
|
Для выявления зависимости между возрастом рабочих и оплатой их труда произведите их группировку по возрасту образовав пять групп с равными интервалами.
По каждой группе и совокупности рабочих в целом подсчитайте:
1. Число рабочих;
2. Средний возраст;
3. Среднюю заработную плату;
Результаты представьте в таблице. Проанализируйте показатели и сделайте краткие выводы.
Решение
1.1 Найдем минимальное и максимальное значение варианты данной совокупности
Min = 18 лет;
Мах = 54 лет.
Определим размах вариации:
D = 54 - 18 = 36;
Тогда величина интервала составит:
d = (54 - 18) / 5 = 7 (лет).
Определим границы интервалов (групп) и их середины:
Таблица 1.
|
№ группы | Границы интервала | Середина интервала | |
1 | 18-25 | 21,5 | |
2 | 25-32 | 28,5 | |
3 | 32-39 | 35,5 | |
4 | 39-46 | 42,5 | |
5 | 46-54 | 49,5 | |
|
1.3 Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку)
В группу 1 (границы: 18 - 25) входят рабочие:
№11 возраст составляет 18 лет с заработной платой 100,00 грн
№2 (возраст = 24 года) с (з/п = 210,00 грн)
№1 (возраст = 25 лет) с (з/п = 180,00 грн)
№13 (возраст = 25 лет) с (з/п = 190,00 грн)
№20 (возраст = 25 лет) с (з/п = 280,00 грн)
Количество человек в 1_ой группе - 5
В группу 2 (границы: 25 - 32) входят рабочие:
№15 (возраст = 26 лет) с (з/п = 210,00 грн)
№18 (возраст = 28 лет) с (з/п = 240,00 грн)
№7 (возраст = 29 лет) с (з/п = 240,00 грн)
№10 (возраст = 29 лет) с (з/п = 250,00 грн)
№14 (возраст = 30 лет) с (з/п = 220,00 грн)
Количество человек во 2_ой группе - 5
В группу 3 (границы: 32 - 39) входят рабочие:
№19 (возраст = 35 лет) с (з/п = 280,00 грн)
№8 (возраст = 36 лет) с (з/п = 290,00 грн)
№16 (возраст = 36 лет) с (з/п = 300,00 грн)
№12 (возраст = 37 лет) с (з/п = 280,00 грн)
Количество человек в 3_й группе - 4
В группу 4 (границы: 39 - 46) входят рабочие:
№17 (возраст = 40 лет) с (з/п = 330,00 грн)
№5 (возраст = 42 года) с (з/п = 260,00 грн)
№4 (возраст = 45 лет) с (з/п = 320,00 грн)
№3 (возраст = 46 лет) с (з/п = 390,00 грн)
Количество человек в 4_й группе - 4
В группу 5 (границы: 46 - 54) входят рабочие:
№6 (возраст = 50 лет) с (з/п = 310,00 грн)
№9 (возраст = 54 года) с (з/п = 390,00 грн)
Количество человек в 5_й группе - 2
1.4 Определим средний возраст работы по каждой группе и по совокупности рабочих в целом
Группа 1 х1 = (18+24+25+25+25) / 5 = 23,4 (года);
Группа 2 х2 = (26+28+29+29+30) / 5 = 28,4 (года);
Группа 3 х3 = (35+36+36+37) / 4 = 36 (лет);
Группа 4 х4 = (40+42+45+46) / 4 = 43,25 (года);
Группа 5 х5 = (50 + 54) / 2 = 52 (года);
По совокупности в целом:
Х = (23,4 · 5 + 28,4 · 5 + 36 · 4 + 43,25 · 4 + 52 · 2) / 20 = 34 (года)
1.5 Определим среднюю заработную плату по каждой группе и по совокупности рабочих в целом
Группа 1 х1 = (100+210+180+190+280) / 5 = 192,00 (грн);
Группа 2 х2 = (210+240+240+240+250+220) / 5 = 280,00 (грн);
Группа 3 х3 = (280+300+290+280) / 4 = 287,50 (грн);
Группа 4 х4 = (330+260+320+390) / 4 = 325,00 (грн);
Группа 5 х5 = (310+390) / 2 = 350,00 (грн);
По совокупности в целом: Х = (192,00 · 5 + 280,00 · 5 + 287,50 · 4 + 325,00 · 4 + 350,00 · 2) / 20 = 236,50 (грн).
Таблица 3. Группировка рабочих по возрасту работы.
|
№ группы | Границы интервалов | Показатели по каждой группе | Показатели по совокупности в целом | |
| | Вес варианты | Средний возраст работы | Средняя заработная плата | Средний возраст работы | Средняя заработная плата | |
1 | 18-25 | 5 | 23,4 | 192,00 | | | |
2 | 25-32 | 5 | 28,4 | 280,00 | | | |
3 | 32-39 | 4 | 36 | 287,50 | 34 | 236,50 | |
4 | 39-46 | 4 | 43,25 | 325,00 | | | |
5 | 46-54 | 2 | 52 | 350,00 | | | |
|
Выводы: На основании полученных результатов по группировке рабочих по возрасту и проведенных расчетов можно сделать следующие выводы:
- наибольшее количество рабочих имеют возраст в пределах 18 - 25 лет (в среднем 23,4 года) и 25 - 32 лет (в среднем 28,4 года), наименьшее количество рабочих имеют возраст в интервале 46 - 54 года (в среднем 52 года). Средний же возраст работников предприятия составляет 34 года.
- наибольшую среднюю заработную плату имеют рабочие входящие в пятую группу возрастных пределов 46 - 54 года (в среднем 350,00 грн), наименьшую среднюю заработную плату имеют рабочие входящие в первую группу возрастных пределов 18 - 25 лет (в среднем 192,00 грн). Средняя заработная плата работников предприятия составляет 236,50 грн.
Задача 7
По данным задачи 1 для выявления тесноты связи между возрастом рабочих и оплатой труда вычислить коэффициент детерминации.
Решение
Определим дисперсию по каждой группе рабочих и по совокупности в целом:
Группа 1 21 = ((18 - 23,4)2 + (24 - 23,4)2 + 3 • (25 - 23,4)2) / 5 = 7,44;
Группа 2 22 = ((26 - 28,4)2 + (28 - 28,4)2 + 2 • (29 - 28,4)2 + (30 - 28,4)2) / 5 = 1,84;
Группа 3 23 = ((35 - 36)2 + 2 • (36 - 36)2 + (37 - 36)2) / 4 = 0,5;
Группа 4 24 = ((40 - 43,25)2 + (42 - 43,25)2 + (45 - 43,25)2 + (46 - ? 43,25)2) / 4 = 5,69;
Группа 5 25 = ((50 - 52)2 + (54 - 52)2) / 2 = 4.
По совокупности в целом:
2 = ((21,5 - 34)2 · 5 + (28,5 - 34)2 · 5 + (35,5 - 34)2 · 4 + (42,5 - 34)2 · 4 + (49,5 - 34)2 · 2) / 20 = 85,55.
Определим общую дисперсию
= [(21,5 2 · 5 + 28,52 · 5 + 35,52 · 4 + 42,52 · 4 + 49,52 · 2) / 20] - [(21,5 · 5 + 28,5 · 5 + 35,5 · 4 + 42,5 · 4 + 49,5 · 2) / 20)]2 = 1176,95 - 1092,30 = 84,65.
Задача 2
За отчетный период имеются следующие данные об электровооруженности труда выработке продукции рабочими завода
|
Рачий | Электровооруженность труда одного рабочего, кВт*ч | Рачий | Электровооруженность труда одного рабочего, кВт*ч | |
1 | 24,7 | 11 | 27,4 | |
2 | 23,0 | 12 | 26,7 | |
3 | 24,0 | 13 | 23,3 | |
4 | 28,0 | 14 | 22,1 | |
5 | 26,3 | 15 | 25,8 | |
6 | 24,3 | 16 | 22,6 | |
7 | 24,7 | 17 | 23,6 | |
8 | 20,0 | 18 | 25,9 | |
9 | 21,4 | 19 | 21,9 | |
10 | 25,0 | 20 | 23,8 | |
|
Сгруппируйте рабочих по электровооруженности труда, образовав четыре группы с равными интервалами.
По каждой группе и совокупности рабочих в целом подсчитайте:
Их число;
Среднюю электровооруженность труда;
Дисперсию и среднее квадратическое отклонение;
Коэффициент вариации.
Постройте гистограмму и полигон распределения рабочих. Сделайте вывод.
Решение
Группировка рабочих по электровооруженности труда.
1. Найдем минимальное и максимальное значение варианты данной совокупности по признаку возраста:
Min = 20 кВт·ч;
Мах = 28 кВт·ч.
Опредилим размах вариации:
D =28 - 20=8 (кВт·ч);
Тогда величина интервала составит:
d = (28 - 20) / 4 = 2 (кВт·ч).
2. Определим границы интервалов (групп) и их середины:
Таблица 1
|
№ группы | Границы интервала | Середина интервала | |
1 | 20 - 22 | 21 | |
2 | 22 - 24 | 23 | |
3 | 24 - 26 | 25 | |
4 | 26 - 28 | 27 | |
|
4. Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку)
В группу 1 (границы: 20 - 22) входят рабочие:
№8 (Электровооруженность труда =20,0 кВт·ч)
№9 (Электровооруженность труда =21,4 кВт·ч)
№19 (Электровооруженность труда = 21,9 кВт·ч)
Количество человек в 1_ой группе = 3
В группу 2 (границы: 22 - 24) входят рабочие:
№2 (Электровооруженность труда = 23,0 кВт·ч)
№13 (Электровооруженность труда = 23,3 кВт·ч)
№14 (Электровооруженность труда = 22,1 кВт·ч)
№16 (Электровооруженность труда = 22,6 кВт·ч)
№17 (Электровооруженность труда = 23,6 кВт·ч)
№20 (Электровооруженность труда = 23,8 кВт·ч)
Количество человек во 2_ой группе = 6
В группу 3 (границы: 24 - 26) входят рабочие:
№1 (Электровооруженность труда = 24,7 кВт·ч)
№3 (Электровооруженность труда = 24,0 кВт·ч)
№6 (Электровооруженность труда = 24,3 кВт·ч)
№7 (Электровооруженность труда = 24,7 кВт·ч)
№10 (Электровооруженность труда = 25,0 кВт·ч)
№15 (Электровооруженность труда = 25,8 кВт·ч)
№18 (Электровооруженность труда = 25,9 кВт·ч)
Количество человек в 3_й группе = 7
В группу 4 (границы: 11 - 13) входят рабочие:
№4 (Электровооруженность труда = 28,0 кВт·ч)
№5 (Электровооруженность труда = 26,3 кВт·ч)
№11 (Электровооруженность труда = 27,4 кВт·ч)
№12 (Электровооруженность труда = 26,7 кВт·ч)
Количество человек в 4_й группе = 4
5. Определим среднюю электровооруженность труда по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 х1 = (19,0 + 20,4 + 20,9) / 3 = 20,1 (кВт·ч)
Группа 2 х2 = (22,0 + 22,3 + 21,1 + 21,6 + 22,6 + 22,8) / 6 = 22,1 (кВт·ч);
Группа 3 х3 = (23,7 + 23,0 + 23,3 + 23,7 + 24,0 + 24,8 + 24,9) / 7 = 23,9
(кВт·ч);
Группа 4 х4 = (27,0 + 25,3 + 26,4 + 25,7) / 4 = 26,1 (кВт·ч).
По совокупности в целом:
Х = (20 · 3 + 22 · 6 + 24 · 7 + 26 · 4) / 20 = 23,2 (кВт·ч)
6. Определим дисперсию по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 21 = ((19,0 - 20,1)2 + (20,4 - 20,1)2 + (20,9 - 20,1)2) / 3 = 0,65.
Группа 2 22 = ((22,0 - 22,1)2 + (22,3 - 22,1)2 + (21,6 - 22,1)2 + (21,1 -
-22,1)2 + (22,6 - 22,1)2 + (22,8 - 22,1)2) / 6 = 0,34.
Группа 3 23 = ((23,7 - 23,9)2 + (23 - 23,9)2 + (23,3 - 23,9)2 + (23,7 - 23,9)2
+ (24,0 - 23,9)2+ (24,8 - 23,9)2 + (24,9 - 23,9)2) / 7 = 0,44.
Группа 4 24 = ((27,0 - 26,1)2 + (25,3 - 26,1)2 + (26,4 - 26,1)2 + (25,7 -
26,1)2) / 4 = 0,42.
По совокупности в целом:
2 = ((20 - 23,2)2 ·3+ (22 - 23,2)2 · 6+ (24 - 23,2)2 · 7+ (26 - 23,2)2 · 4) / 20 =3,76
7. Определим среднее квадратическое отклонение по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 1 = 0,65= 0,8. (кВт·ч)
Группа 2 2 = 0,34 = 0,58 (кВт·ч)
Группа 3 3 = 0,44 = 0,66 (кВт·ч)
Группа 4 4 = 0,42 = 0,65 (кВт·ч)
По совокупности в целом:
= 3,76 = 1,94 (кВт·ч).
8. Определим коэффициент вариации по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 v1 = 0,8 / 20,1 = 0,040 (4,0%).
Группа 2 v2 = 0,58 / 22,1 = 0,026 (2,6%).
Группа 3 v3 = 0,66 / 23,9 = 0,028 (2,8%).
Группа 4 v4 = 0,65 / 26,1 = 0,025 (2,5%).
По совокупности в целом:
V = 1,94 / 23,2 = 0,084 (8,4%).
Таблица 1. Группировка рабочих по электровооруженности труда
|
Границы интервалы | Середина интервала | Вес варианты | Показатели по каждой группе | |
| | | Средняя электровооруженность труда. | Дисперсия | Ср. квад. отклонение | Коеффициент вариации % | |
19 - 21 | 20 | 3 | 20,1 | 0,65 | 0,8 | 4,0 | |
21 - 23 | 22 | 6 | 22,1 | 0,34 | 0,58 | 2,6 | |
23 - 25 | 24 | 7 | 23,9 | 0,44 | 0,66 | 2,8 | |
25 - 27 | 26 | 4 | 26,1 | 0,42 | 0,65 | 2,5 | |
|
Выводы
На основании полученных результатов по группировке рабочих по электровооруженности труда и проведенных расчетов можно сделать следующие выводы:- наибольшее количество рабочих имеют электровооруженности труда в пределах 23-25 кВт·ч (в среднем 24 кВт·ч), наименьшее количество рабочих имеют электровооруженности труда в интервале 19 - 21 кВт·ч (в среднем 20 кВт·ч). Средняя электровооруженности труда работников предприятия составляет 23,2 кВт·ч.- в среднем отклонение от средней электровооруженности труда работников как в сторону увеличения, так и в сторону уменьшения составляет 1,94 кВт·ч, что составляет 8,4%.Лабораторная работа №2Расчет средней и показателей по данным сгруппированного массива
Цель - научиться производить расчеты на ЭВМ по данным интервального вариационного ряда. Рассчитать среднюю, среднее квадратическое отклонение. Построить полигон и гистограмму. Проанализировать полученные данные.
Расчет средней, дисперсии и среднего квадратического отклонение производя по формулам (1) и (3). Однако в качестве вариант в задачах приведены так называемые «открытые» варианты. В начале следует закрыть варианты, а затем, найдя полу сумму интервалов, ввести их в программу в виде усредняемых значений признака xi и fi - частоты повторения каждой варианты.
Среднее линейное отклонение L - есть средняя арифметическая из абсолютных значений отклонений вариант от средней и определяется по формуле:
L=((Xi-X)*fi)/fi
Согласно формуле в начале находят абсолютные отклонения каждой варианты от средней ((Xi-X), а затем каждое абсолютное отклонение взвешивают ((Xi-X)*fi), суммируют взвешенные абсолютные отклонения ((Xi-X)*fi) и это суммы делят на сумму частот (fi).
Задача 1
В целях изучения норм расхода сырья на единицу продукции из партий изделий проведена двухпроцентная механическая выборка, в результате которой получена двухпроцентная механическая выборка, в результате которой получено следующее распределение
|
Расход сырья, г | Изготовлено изделий, шт. | |
До 20 | 25 | |
20-22 | 32 | |
22-24 | 67 | |
24-26 | 37 | |
Свыше 26 | 24 | |
Итого | 185 | |
|
Определите:
средний расход сырья на одно изделие;
дисперсию и среднее квадратическое отклонение;
среднее линейное отклонение;
коэффициент вариации.
Решение предоставьте в таблице. Поясните значение исчисленных
показателей.
Решение
Для упрощения решения представим его в виде таблицы и для нахождения средней и дисперсии воспользуемся способом моментов:
|
Расход сырья на 1_цу изделия, г. | Изготовленно изделий, шт. | Середина интервала. | |Х-Х|·f | (X - A) | (X - A) i | (Х - А)·f i | (Х - А) 2 i2 | (X - A) 2 ·f i2 | |
До 20 | 25 | 19 | 100 | -4 | -2 | -50 | 4 | 100 | |
20 - 22 | 32 | 21 | 64 | -2 | -1 | -32 | 1 | 32 | |
22 - 24 | 67 | 23 | 0 | 0 | 0 | 0 | 0 | 0 | |
24 - 26 | 37 | 25 | 72 | 2 | 1 | 37 | 1 | 37 | |
Свыше 26 | 24 | 27 | 96 | 4 | 2 | 48 | 4 | 96 | |
Итого | 185 | | |Х-Х| · f= 332 | | | (X-A) ·f/ i = 3 | | ((X - A) / i) 2·f = 265 | |
|
1. Для нахождения средней и дисперсии воспользуемся способом моментов: Х=m1 · i +A; 2 = i 2 (n ·(m2 - m1 2);
m1= ((X - A) ·f / i))/f; m2= ((X - A) / i) 2·f)/f;
где
m1, m2 - соответственно моменты первого и второго порядка;
i - величина интервала;
А - варианта, имеющая наибольшую частоту;
F - значение весов или частот каждой варианты.
Наиболее частото встречаются изделия с расходом сырья на единицу продукции =23 г. Значит А=23 (г.).
Определим величину интервала (визуально видно, что интервалы имееют равную величину):
I=22-20=24-22=26-24=2 (г.)
На основании расчетов представленных в таблице найдем Х и 2:
Х= (3/185) · 2 + 23=23,03 (г.)
2 = 4 · ((265/185) - (3/185) 2)= 4 · (1,43 - 0)=5,72
Найдем среднее квадратическое отклонение:
=v5,72=2,39 (г.)
2. Определим среднее линейное отклонение:
L= 332/185=1,79 (г.)
3. Определим коэффициент вариации:
V=1,79/23,03=0,078 (7,8%).
Вывод
На основании проведенных расчетов можно сделать следующие выводы:
- средний расход сырья на единицу изделия равен ? 23 г.
- среднее квадратическое отклонение показывает, что возможно отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения на 2,39 г., что составляет 7,8% (см. коэффициент вариации).
- среднее линейное отклонение также показывает возможное отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения, но менее точно, чем среднее квадратическое отклонение, и составляет 1,79 г.
Лабораторная работа №3
Расчет внутри групповой и межгрупповой дисперсии. Правило сложения дисперсийЦель - изучить элементы дисперсионного анализа. Получить практические навыки производства на ЭВМ трудоемких расчетов показателей внутригрупповой, межгрупповой дисперсий для различного количества групп. Произвести расчет корреляционного отношения.Проверить правило сложений дисперсий. Приобрести навыки анализа и практического применения этих показателей.Выполнение задания предусматривает расчет показателей, характеризующих случайную и систематическую вариации и их роли в общей вариации. Эти показатели широко используются на производстве при количественной оценке влияния различных факторов на те или иные показатели, осуществляемой с помощью дисперсионного анализа.Общая дисперсия рассматривалась при выполнение заданий 1 и 2. Она характеризует общую вариацию под влиянием всех причин, ее вызывающих и исчисляется по формуле (3).Для оценки влияния группировочного признака (постоянного фактора) на величину вариаций рассчитывают межгрупповую дисперсию, исчисляемую на основании групповых средних:U? =((Xi-X)? *fi)/fi (1)U? - межгрупповая дисперсия;Xi - групповые средние исчисляются по формуле (1)X - общее среднее (также исчисляется по формуле (1)fi - групповые частоты.При оценке влияния случайных факторов и их роли в общей вариации определяют внутригрупповую дисперсию. Она исчисляется как средняя арифметическая из групповых дисперсий. ? =( ? i *fi)/fi (2)? - внутригрупповая (средняя из групповых) дисперсия;? - групповые дисперсии (исчисляются по формуле (2)).В математической статистика доказано, что общая дисперсия ? равна сумме внутригрупповой и межгрупповой дисперсий, т.е.? = ? +U?Исходя из этого правила, можно определить влияние случайной и систематической дисперсий на общую дисперсию, установить тесноту связи между признаками. Для этого применяется в дисперсионном анализе корреляционное отношение ?:?= /хЗадача 2
Имеются следующие данные о распределении рабочих по возрасту работы двух заводов и объединения
|
Возраст работы, лет | | Количество рабочих | | |
| Завод 1 | Завод 2 | Объединение | |
До 5 лет | 67 | 32 | 99 | |
5-10 | 125 | 77 | 202 | |
10-15 | 162 | 119 | 281 | |
15-20 | 89 | 70 | 159 | |
Свыше 20 | 42 | 37 | 79 | |
|
Определите:
средний возраст работы одного рабочего по каждому заводу и по объединению в целом;
дисперсию для каждого завода (внутригрупповую) и для объединения в целом (общую);
среднюю из внутригрупповых дисперсий;
межгрупповую дисперсию;
корреляционное отклонение.
Проверьте правило сложения дисперсий. Поясните сущность исчисленных показателей.
Решение
1. Определим средний возраст работы одного рабочего по каждому заводу и по объединению в целом.
Так как нам дан интервальный ряд с равными интервалами, то определим сначала середины интервалов и полученные данные занесем в таблицу.
Таблица 1
|
Возраст работы, лет. | Середина интервала. | Количество рабочих. | |
| | Завод 1 | Завод 2 | Объединение. | |
До 5 | 2,5 | 67 | 32 | 99 | |
5 - 10 | 7,5 | 125 | 77 | 202 | |
10 - 15 | 12,5 | 162 | 119 | 281 | |
15 - 20 | 17,5 | 89 | 70 | 159 | |
Свыше 20 | 22,5 | 42 | 37 | 79 | |
Итого | | 485 | 335 | 820 | |
|
Средний возраст работы одного рабочего на заводе 1:
Х1 = (2,5 ? 67 + 7,5 ? 125 + 12,5 ? 162 + 17,5 ? 89 + 22,5 ? 42)/485=11,6 (лет).
Средний возраст работы одного рабочего на заводе 2:
Х2 = (2,5 ? 32 + 7,5 ? 77 + 12,5 ? 119 + 17,5 ? 70 + 22,5 ? 37)/335=12,5 (лет).
Средний возраст работы одного рабочего на объединении в целом:
Х =(2,5 ? 99 + 7,5 ? 202 + 12,5 ? 281 + 17,5 ? 159 + 22,5 ? 79)/820=12,0 (лет).
2. Определим дисперсию для каждого завода в отдельности (внутригрупповую) и по объединению в целом:
Дисперсия на заводе 1:
2 1= ((2,5-11,6) 2 ? 67 + (7,5-11,6) 2 ? 125 +(12,5-11.6) 2 ? 163 + (17,5 -11,6)2? 89 + (22,5-11,6) 2 ? 42)/485=32,72;
Дисперсия на заводе 1:
22=((2,5-12,5) 2 ? 32 + (7,5-12,5) 2? 77 + (12,5-12,5) 2 ?119 + (17,5-12,5) 2? 70+ (22,5-12,5) 2 ? 37)/335=31,57
Дисперсия по объединению в целом (общую дисперсию):
u 2=((2,5-12.0) 2 ? 99 + (7,5-12,0) 2 ? 202 + (12,5-12,0) 2 ? 281 + (17,5-12,0) 2 ?159 + (22,5-12,0) 2 ? 79)/820=32,46
3. Определим среднюю из внутригрупповых дисперсий:
2 =(32,72+31,57) /2=32,15
4. Определим межгрупповую дисперсию:
2 = ((11,6-12,0) 2 ?485 +(12,5-12,0) 2 ?335)/820=0,20
5. Определим среднее квадратическое отклонение для каждого завода в отдельности и по объединению в целом:
Завод 1:
1=v32,72=5,72 (лет).
Завод 2:
2=v31,57=5,62 (лет).
Объединение:
=v32,46=5.7 (лет).
6. Определим корреляционное отклонение (коэффициент вариации):
Корреляционное отклонение (коэффициент вариации) для завода 1:
? =v32,72 /11,6=0,493 (49,3%);
Корреляционное отклонение (коэффициент вариации) для завода 2:
? = v31,57 /12,5=0,449 (44,9%);
Корреляционное отклонение (коэффициент вариации) по объединению в целом (общее):
? = v32,46 /12,0=0,475 (47,5%).
7. Проверим правило сложения дисперсий:
u 2= 32,17 +0,2=32,37?32,46
Выводы
На основании проведенных расчетов можно сделать следующие выводы:
- средний возраст работы одного рабочего на заводе 1 равен 11,6 лет, на заводе 2 -12,5 лет и по объединению в целом -12,0 лет.
- в среднем отклонение от среднего возраста работы одного рабочего, как в сторону увеличения, так и в сторону уменьшения по заводу 1 составляет 5,72 лет (или 49,3%), по заводу 2 -5,62 лет (или 44,9%), по объединению в целом -5,7 лет (или 47,5%).