Вы находитесь на сайте журнала "Вопросы психологии" в восемнадцатилетнем ресурсе (1980-1997 гг.).  Заглавная страница ресурса... 

138

 

О КОРРЕКТНОСТИ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА И

О КРИТЕРИЯХ ФАКТОРИЗАЦИИ

 

Н. Г. ЛЕВАНДОВСКИЙ

Кафедра психологии Ленинградского педагогического института

 

В советской психологии факторный анализ применяется на протяжении последних двадцати лет. К сожалению, применяется он не всегда корректно. Часто нарушается принцип простой структуры, выдвинутый Терстоном и реализованный аналитически для некоррелирующих факторов Г. Кайзером (этот способ вращения назван «Варимакс») [см. 2; 326—335].

Особое затруднение в применении факторного анализа вызывает задача отбора значимых факторов. Это единственная задача, которая пока недоступна для ЭВМ.

Существует ряд критериев для отбора числа значимых факторов. Самый простой из них (критерий Хамфри) состоит в том, что абсолютная величина проведения двух максимальных факторных весов должна быть вдвое больше единицы, деленной на корень квадратный из числа наблюдений N, т. е.| rlmax r2max | > 2 |. Фрахтер отмечает, что этот критерий применим для небольших выборок [4; 80]. Второй простой критерий принадлежит Г. Кайзеру, который пришел к выводу, что для главных компонент значимы все первые m факторов, имеющих собственные значения больше единицы [см. 2; 216].

Наш опыт сопоставления факторных весов с корреляционной матрицей показывает, что оба этих простых критерия завышают число значимых факторов, особенно критерий Кайзера. Мы взяли в случайном порядке из результатов факторного анализа наших задач 12 случаев. Фиксировались величины собственных чисел последнего значимого фактора и следующего за ним незначимого фактора. Максимальное собственное число значимых факторов составило 5,05, минимальное — 1,97. Для первых отброшенных факторов максимальное число составило 3,13, а минимальное — 1,34. Средние величины собственных чисел равны соответственно 3,14 и 2,21. Различие между средними равно 0,93 и значимо на однопромильном уровне (Р < 0,001). Среднее число значимых факторов, по критерию Хамфри, равно 3,75, а по нашим критериям — 2,83. Различие это существенно и также значимо на однопромильном уровне. Из 12 величин совпадают только 3. В остальных 9 случаях 7 раз количество значимых факторов, по критерию Хамфри, превышает таковое по нашим критериям на один фактор и 2 раза — на 2 фактора. Что же касается критерия Кайзера, то только в двух случаях удалось установить количество санкционированных этим критерием факторов, так как факторизация прерывалась значительно раньше.

Фрахтер [4; 77—84] описывает еще два критерия: фи-критерий Такера и критерий Кумза. Первый основывается на анализе матриц остаточных корреляций с учетом числа признаков. Без специальной машинной программы этим критерием пользоваться нельзя. Серьезным недостатком этого критерия является полное отсутствие сопоставления факторных весов с корреляционной матрицей. (Этот недостаток характерен также и для критериев Хамфри, Кайзера и Кумза.)

Критерий Кумза также основан на анализе матриц  остаточных корреляций. Он не применим к исходным корреляционным матрицам с отрицательными коэффициентами. Это серьезный недостаток, а кроме того, для этого критерия также нужна машинная программа.

Фрахтер говорит, что описанные им критерии следует применять лишь совместно, так как они построены на разных основаниях [2; 81].

Насколько нам известно, соотношение извлеченных факторов с исходной корреляционной матрицей обсуждал только Кэттелл (см. [3; 998]).

Основной предпосылкой при разработке критерия фильтра мы приняли положение, что значимые факторные веса не могут быть получены из незначимых исходных корреляций.

Извлечем из однородной корреляционной матрицы факторы способами главных факторов и центроидным, а также извлечем общий фактор по формуле Спирмена (см. [1; 255]). Для решения задачи первыми двумя способами по диагонали берутся не единицы, а общности (communalities). Поскольку точные значения последних могут быть известны лишь после факторизации, обычно для данной строки матрицы берется максимальный в данной строке коэффициент корреляции, взятый с положительным знаком.

В табл. 1 дана корреляционная матрица с коэффициентами, равными 0,360. Извлечем сначала центроидный фактор. Сумма всех (без диагональных значений) равна в каждом столбце 1,440, а общая сумма в шести столбцах равна 7,200. Поскольку все знаки положительны, обращения знаков делать не надо. Добавляя диагональные значения к суммам каждого столбца, получаем величины t1, равные 1,800. gt1=T1=9,000, a     Разделив на 3 величины t1, получим факторные веса α1. Все они равны

 

139

 

0,600. Суммируя все веса, получим число 3, равное . Следовательно, факторизация сделана правильно.

В строках 9—15 представлено извлечение общего фактора по Спирмену по формуле

 

 

Диагональные значения в этом случае не берутся вовсе. Как видим, факторные веса по общему фактору тоже точно равны 0,600.

В табл. 1а представлена процедура извлечения первого главного фактора. Она отличается от процедуры извлечения первой главной компоненты только тем,

 

Таблица 1

ИЗВЛЕЧЕНИЕ ЦЕНТРОИДНОГО И ОБЩЕГО ФАКТОРА

 

 

Таблица 1 а

ИЗВЛЕЧЕНИЕ ГЛАВНОГО ФАКТОРА

 

 

В этих двух таблицах, равно как и в следующих, запись ведется в тысячных долях единицы.

 

что в последнем случае по диагонали стоят единицы. В строке 1 даны суммы всех r по каждому столбцу. Первый пробный вектор (строка 2) получаем делением каждой суммы на модуль максимальной суммы. В строках 3—7 представлена процедура умножения пробного вектора на исходную корреляционную матрицу. В строке 8 представлены суммы строк 3—7. Поскольку величины в строке 8 совпадают с величинами строки 1, итерации не нужны, и снова, разделив суммы строки 8 на 1,8, получаем окончательный собственный вектор матрицы (строка 9), состоящий из единиц. Умножая вектор uI на  вектор u1, получим uI u1 = 5,000. Разделим собственное число матрицы 1,800 на uI u1 получим 0,36. Извлекая корень квадратный из 0,36, получим 0,600. Умножая это число на собственный вектор (строка 9), получим факторные веса. Они все равны 0,600.

Таким образом, при извлечении факторных весов из однородной матрицы все три способа факторизации дают один и тот же результат: факторный вес равен корню квадратному из коэффициента корреляции. Естественно при этом считать, что вообще из незначимых корреляций нельзя получить значимых факторных весов.

В табл. 2 дана корреляционная матрица, вычисленная на основе ответов на пунктаты характерологического вопросника СХО. Взяты ответы на 5 вопросов-суждений, характеризующих ответственность в коллективных делах; 6-й признак — прямая самооценка ответственности.

Вопросы-суждения были следующие:

1) Выполняет поручения классного коллектива; 2) выполняет поручения классного руководителя; 3) выполняет поручения комсорга или старосты; 4) берет на себя ответственность в коллективных делах; 5) берет свою долю  нагрузки в коллективных делах

В табл. 2 кроме корреляционной матрицы даны: 1) в строке 7 — суммы коэффициентов корреляции по каждому столбцу без диагональных значений; 2) в строке 8 даны величины t1 т. е. суммы г, включая диагональные значения; 3) в строке 9 — величины

 

140

 

a1, т. е. центроидные веса; 4) в строке 10 — величины w1, т. е. веса по первому главному фактору; 5) в строке 11 — величины а, т. е. факторные веса по общему фактору Спирмена.

Сумма строки 8 T1 = 18,177. Разделив это число на 36, получим средний коэффициент корреляции: . Корень квадратный из этой величины равен 0,711. Разделив суммы строк 9 и 10 на 6, получим  0,711;  0,710. Этот результат можно сформулировать следующим образом, средняя величина факторного веса центроидного (или главного) фактора равна корню квадратному из средней величины коэффициента корреляции исходной матрицы корреляций. Это же верно и для общего фактора, по Спирмену, но факторный вес здесь немного меньше вследствие исключения диагональных значений; здесь средний факторный вес равен 0,690, а корень квадратный из среднего r равен 0,694.

Следовательно, в качестве общего вывода мы можем сформулировать правило квадратного корня, составляющее первую часть критерия фильтра. Это правило служит для

 

Таблица 2

N = 60; n = 6; r 0,05 = 0,250; а 0,05 =w 0,05 =0,500

 

первичной ориентации в отборе факторов для вращения: оно определяет значимый факторный вес. Кроме того, оно служит для обоснования второй части критерия фильтра. Второй критерий может быть сформулирован так: фактор является значимым, если произведение модулей двух максимальных факторных весов равно или больше значимого коэффициента корреляции при данном числе наблюдений (индивидов). Нетрудно видеть, что эта часть критерия фильтра является видоизменением критерия Хамфри.

Обе первые части нашего критерия служат для ориентировки и не являются окончательными, поскольку реальные соотношения между отдельными коэффициентами в корреляционной матрице обычно сложнее тех, которые представлены в табл. 1 и даже в табл. 2.

Третий критерий является гораздо более строгим. Он может быть сформулирован так: если в n-м факторе есть веса, удовлетворяющие условиям второго критерия, но при этом соответствующие признаки не имеют ни одной значимой корреляции, то этот фактор должен быть отброшен. В таком случае предшествующий (n—1)-й фактор обычно является значимым. Эта часть критерия фильтра может быть сформулирована как критерий истощаемости корреляционной матрицы. Этот критерий тоже применим для первичного отбора значимых факторов.

Четвертый критерий применяется для проверки результатов вращения. По данному фактору находится максимальный по модулю факторный вес и по корреляционной матрице прослеживаются все другие признаки, имеющие значимые веса по правилу квадратного корня и значимые корреляции с данным признаком. Если все корреляции значимы, то этот фактор полностью оправдан. Допускаются отдельные корреляции десятипроцентного уровня, если соответствующий признак значимо коррелирует с другими признаками, входящими в данный фактор. Чтобы надежно убедиться в этом, следует выписать в отдельную корреляционную матрицу все интеркорреляции признаков, имеющих значимые веса по данному фактору по правилу квадратного корня.

 

141

 

Таблица 3

ИСХОДНАЯ МАТРИЦА ИНТЕРКОРРЕЛЯЦИЙ

 

 

Таблица 3 а

ПЕРВАЯ МАТРИЦА ОСТАТОЧНЫХ КОРРЕЛЯЦИЙ

 

 

При использовании критериев фильтра следует различать два этапа: 1) отбор значимых факторов для вращения и 2) окончательную проверку результатов факторизации. Это различие имеет большое значение, так как при вращении обычно происходит значительное перераспределение факторных весов, и то, что было до вращения незначимо, может стать после вращения значимым, или наоборот. Обычно происходит максимизация средних и крупных весов и минимизация средних и мелких. Поэтому иногда приходится повторять вращение с измененным (обычно меньшим) числом факторов. Что же касается окончательного итога, то наши критерии в своей совокупности приводят к вполне надежному и корректному результату.

Остановимся еще на двух примерах, ярко подтверждающих необходимость вращения. В табл. 3 представлены интеркорреляции шести признаков. Первые три признака коррелируют только между собой и не коррелируют с тремя другими, которые тоже

 

Таблица 4

ФАКТОРНЫЙ АНАЛИЗ ИНИЦИАТИВНОСТИ

N = 62; r 0,05 = 0,250; a 0,05 = 0,500

 

 

142

 

коррелируют только между собой. Извлечение первого центроида, как видно из строк 7—9 табл. 3, приводит к центроидным весам, равным для всех признаков +0,424. Можно подумать, что получился один общий фактор. Но такой вывод был бы слишком поспешным. В табл. За представлены остаточные корреляции, которые равны по модулю и отличаются лишь знаками. В строках 8—10 показаны результаты процедуры обращения отрицательных знаков. Прибавив к каждой величине строки 10 диагональные значения, получаем в графе 11 величины t2, каждая из которых равна 1,080. Складывая все t2, получаем Т2=6,480,  = 2,5456.Деля на эту величину все t2, получаем вторые центроидные веса, которые все равны по модулю 0,424. Но поскольку первые три признака подверглись обращению знаком, то они имеют знак минус (строка 12). Этот результат указывает на необходимость вращения референтных осей. Аналитическое вращение «Варимакс» приводит к решению, полностью соответствующему исходной корреляционной матрице. Этот результат представлен в строках 13 и 14 табл. 3а.

Обратимся теперь к примеру, взятому из конкретного исследования.

В табл. 4 дан факторный анализ инициативности по данным ответов на характерологический вопросник СХО. Доминирующие веса отмечены звездочками. Веса 0,500 подчеркнуты. Легко видеть, что оба центроида не удовлетворяют требованиям четвертого критерия, а факторы после вращения «Варимакс» полностью удовлетворяют им.

 

1.       Б. М. Теплов. Простейшие способы факторного анализа. — В кн.: Типологические особенности высшей нервной деятельности человека, т. V. М., 1967.

2.       Г. Харман. Современный факторный анализ. — М., 1972.

3.        Buros О. К. (ed.). The fifth measurement year book. New Hersey, 1959.

4.        Fruchter B. Introduction to factor abalysis. N. Y., 1954.