Метод главных компонент
Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
ВОСТОЧНО-СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ
(ГОУ ВПО ВГТУ)
ИНСТИТУТ ЭКОНОМИКИ И ПРАВА
Кафедра «Макроэкономика, экономическая информатика и статистика»
Индивидуальное задание по МСА
Метод главных компонент
Выполнила: ст-ка гр 527
Горюнова Зинаида
Проверила: Орехова Р.А.
Улан-Удэ
2009
Задача
Провести компонентный анализ на основе показателей Х1 - товарооборот единицы продукции, Х2 - цена продукции. По данным годовых отчетов 6 предприятий имеем:
|
№ предприятия | Х1 | Х2 | |
1 2 3 4 5 6 | 0.36 0.39 0.27 0.25 0.35 0.33 | 0.83 0.81 0.70 0.77 0.69 0.72 | |
xj | 0.33 | 0.74 | |
sj | 0.014 | 0,026 | |
|
Решение
1 ЭТАП
1. Определим среднее значение показателей Х1 и Х2 и их среднеквадратическое отклонение
2. Постоим матрицу коэффициентов корреляции, если R12 = 0.28
R= =
3. Оценим вклад в суммарную дисперсию первой и второй компоненты. Преобразуем матрицу R в диагональную матрицу Л собственных значений характеристического многочлена ¦лE - R¦
¦лE - R¦ = = = (л - 1)2 - (-0.28)2 = 0
л - 1 = ф
ф2 - 0,282 = 0 ф = ±0.28
ф1 = 0.28 ф2 = -0.28
л1 - 1 = ф1 л2 - 1 = ф2
л1 - 1 = 0.28 л2 - 1 = -0.28
л1 = 1.28 л2 = -0.72
лj упорядочены, т.е. л1 > л2
D = ? лj = л1 + л2 = k = 2
Вклад в суммарную дисперсию первой главной компоненты можно подсчитать так:
(Лr/ m)*100%
л1/2 *100% = 64%
л2/2*100% = 36%
Вывод: расчеты показали, что оба фактора Х1 и Х2 необходимы для включения в дальнейшие расчеты.
2 ЭТАП.
Рассчитаем элементы матрицы нормированных собственных векторов U, т.е. ортогональную матрицу, составленную из собственных векторов матрицы R Собственный вектор Uj, отвечающий собственному числу лj, находится как отличное от 0 решение уравнения (лjE - R) = 0
Т.к. определитель ¦лE - R¦= 0, то строки системы линейно зависимы.
Составим нужные нам 2 уравнения.
j =1 ¦л1E - R¦= 0
(л1 - 1)u11 + (-r12)u21 = 0
-r21u11 + (л1 - 1)u21 = 0
Видим, что система линейных уравнений зависима. Это значит, что для нахождения параметров можно воспользоваться только одним из уравнений. Используем только первое.
(л1 - 1)u11 + (-r12)u21 = 0
0.28 u11 - 0.28 u21 = 0
Примем u11 = 1, тогда u21 = 1
U1 = (1,1)
Находим норму вектора U1
¦U1¦ = v uij2 = v u11 2 + u212 = v2 = 1.41
v1 = u1/ ¦u1¦=
Повторяем эту операцию для j = 2 ¦л1E - R¦= 0
(л2 - 1)u12 + (-r12)u22 = 0
-r21u12 + (л2 - 1)u22 = 0
Также выбираем первое уравнение
(л2 - 1)u12 + (-r12)u22 = 0
Примем u12 =1, тогда u22 = -1
U2 = (1,-1)
¦ U2¦ = v uij2 = v u12 2 + u222 = v2 = 1.41
V2 = u2/ ¦u2¦=
U =
Данная матрица является ортогональной.
UUT = UTU = E
UT=
* = =
3 ЭТАП
А = U Л Ѕ
Л Ѕ = =
A = =
?ajr2 = лr
л1 = a112 + a212 = 0.64 + 0.64 = 1.28
л2 = a122 + a222 = 0.36 + 0.36 = 0.72
Из матрицы факторных нагрузок А видно, что первая главная компонента имеет одинаковую тесноту связи 0.80 с обоими признаками Х1 и Х2. Вторая главная компонента также определяется признаками Х1 и Х2, но со вторым признаком связь обратная -0.60
В результате анализа можно сказать, что первая главная компонента, складывающаяся под влиянием обоих факторов, может быть интерпретирована как фактор, характеризующий уровень организации в отрасли.
4 ЭТАП.
Рассчитаем элементы матрицы F значений главных компонент
F = A-1z = Л-ЅUTz
m=2, n=6
Строим матрицу нормированных значений z
zji = (xij - xj)/ sj
z11 = (x11 - x1)/s1 = = 2.14
z12 = 4.29
z13 = -4.29
z14 = -5.71
z15 = 1.42
z16 = 0
z21 = (x12 - x2)/s2 = = 3.46
z22 = 2.69
z23 = -1.92
z24 = 1.15
z25 = -3.84
z26 = -0.77
z =
Значения главных компонент получаем из выражения
fr1 =( 1/ vлl )*? uilzji
l = 1,2
f11 = 1/vл1 (u11z11 +u21z21) = (0.71*2.14 + 0.71*3.46) = 0.88(1.519 + 2.456) = 3.50
f12 = 4.36
f13 = -3.88
f14 = -2.85
f15 = -1.51
f16 = -0.48
f21 = 1/vл2 (u12z11 +u22z21) = (0.71*2.14 - 0.71*3.46) = 1.18(1.519 - 2.456) = 1.11
f22 = 0.99
f23 = -1.48
f24 = -4.30
f25 = 3.30
f26 = 0.48
Таким образом, матрица значений главных компонент имеет вид:
F =
Элементы каждого столбца характеризуют предприятия в пространстве главных компонент
По рисунку видно, что организация производства в отрасли не стабильна.