Вы находитесь на сайте журнала "Вопросы психологии" в девятнадцатилетнем ресурсе (1980-1998 гг.).  Заглавная страница ресурса... 

145

 

ЭКСПЕРИМЕНТАЛЬНЫЕ МЕТОДИКИ И АППАРАТУРА

 

ПРИМЕНЕНИЕ МЕТОДОВ НЕПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ В ПСИХОЛОГО-ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

 

Н. Ф. ДЖУЖА

 

За последние три десятилетия возникла и сформировалась особая отрасль психологической науки математическая психология, характеризующаяся прежде всего «тенденцией к применению математических методов в исследовании объекта психологического изучения» [5; 8]. Основной целью использования математических методов в психологии является создание формального математического аппарата, пригодного для адекватного описания и моделирования систем, обладающих психическими свойствами, выражение открываемых закономерностей и зависимостей в компактной форме и т.д.

Использование математических методов в психологии, к сожалению, не всегда сопровождается четкими представлениями о возможностях и границах их применения. Зачастую психолог использует тот или иной метод анализа данных не потому, что он наиболее целесообразен, а лишь в силу его доступности. В результате этого значительная часть прикладных исследований (особенно в области возрастной и педагогической психологии) довольствуется упрощенным, одномерным анализом данных, который существенно обедняет информацию, игнорирует множественную детерминацию психологических явлений, снижает диагностическую и прогностическую ценность получаемых выводов.

Использование более сложных видов анализа (многомерный, факторный, дисперсионный, регрессионный, латентный и др.) сопряжено с рядом трудностей. Между тем существуют математические методы, которые пока очень редко применяются в психологических исследованиях, хотя их использование позволило бы проводить вполне корректную математическую обработку данных, не заставляя психолога осваивать сложные разделы высшей математики, и значительно упростило бы расчеты и вычисления. Мы имеем в виду методы непараметрической статистики сравнительно новой и бурно развивающейся в настоящее время математической дисциплины.

Популярность непараметрических методов объясняется широкой областью их применения, устойчивостью выводов, простотой математических средств. Непараметрические критерии значительно менее трудоемки, а при распределениях, далеких от нормального, более эффективны и точны, чем параметрические.

Каковы же основные особенности непараметрических методов и как их можно использовать в психолого-педагогических исследованиях? Непараметрическая статистика, как мы уже упоминали, рассматривает только такие ситуации, в которых о функциональном виде распределений ничего не известно. Единственной априорной информацией считается информация о характере случайных величин (например, непрерывны они или дискретны) и о типе различий между их распределениями. Легко заметить, что многие психологические и педагогические исследования с чисто математической стороны сводимы именно к данному кругу вопросов. Существенны ли различия в объеме и качестве знаний, усвоенных несколькими группами учащихся, обучаемых различными методами? Можно ли определить как соотносятся между собой некоторые личностные черты и успехи в овладении определенным видом деятельности? Верно ли, что учителям с более структурированной волевой сферой личности присущ более высокий уровень волевого развития и, в свою очередь, лучшая успешность в осуществлении профессиональной деятельности?

Прежде чем искать ответы на такие вопросы с помощью методов непараметрической

 

146

 

статистики, необходимо тщательно проанализировать методологический и собственно психологический аспекты исследования, корректно сформулировать гипотезу, четко спланировать эксперимент. Не менее важно хорошо представлять, к какому типу непараметрических задач относится решаемая исследователем задача (сведения об этих типах см. [8; 23—25]).

Наиболее часто в педагогике и психологии встречается задача проверки непараметрических гипотез. В чем ее суть? Прежде чем приступить к проведению эксперимента, исследователь обычно выдвигает две взаимоисключающие гипотезы. Одна из них является статистической гипотезой, которую исследователь обычно предполагает отклонить, и называется нулевой гипотезой0). В ней выдвигаются различные предположения относительно значений одного или нескольких параметров исходной совокупности. Например, проводится эксперимент по типу социально-психологического тренинга. Затем равные выборки испытуемых, прошедших и не прошедших тренинг сензитивности, исследуются с помощью специальных диагностических методик. Нулевая гипотеза состоит в том, что доля лиц, отвечающих примерно одинаково на вопросы об эффективности межличностных отношений и удовлетворенности ими, будет одинакова для обеих выборок.

Альтернативная гипотеза (Н1) фактически отрицает нулевую гипотезу. В нашем случае она предполагает, что значительно больший процент лиц, удовлетворенных межличностными отношениями, находится в выборке, члены которой предварительно обучались общению с помощью активных методов. Таким образом, если альтернативная гипотеза подтвердится (т.е. Н0 будет отвергнута), исследователь может делать выводы об эффективности метода социально-психологического тренинга. Несколько забегая вперед, укажем, что чем выше абсолютные значения разности критериев значимости1 тем более существенны обнаруженные различия в выборках.

Любая задача проверки непараметрических гипотез выглядит следующим образом. Из двух конкурирующих гипотез альтернативная всегда непараметрична, а Н0 может быть либо простой, либо непараметрической.

Поскольку по крайней мере одна гипотеза есть класс неизвестных распределений, различие между гипотезами задается в некотором общем виде, не связанном с конкретным видом функции распределения. Требуется предложить процедуру, результатом которой явилось бы решение об истинности одной из гипотез на основании предъявленной выборки (или нескольких выборок).

Приведем конкретный пример. В исследовании автора (схема эксперимента излагается упрощенно с целью большей наглядности математической стороны) с помощью метода компетентных судей была проведена оценка уровня профессионального мастерства в некоторой выборке школьных учителей (описание методики см. в [6]). В результате были выделены две группы (условно названные высоко- и низкоуспешными). Далее у всех испытуемых было проведено измерение уровня субъективного контроля по Е.В. Бажину, разделившее их на две группы с внешним и внутренним локусом. В этом случае нулевая гипотеза (Н0) гласит: количество учителей с внешним и внутренним локусом контроля среди высокоуспешных учителей одинаково. Н1: а) среди высокоуспешных учителей доля лиц с внутренним локусом контроля значительно выше, б) среди высокоуспешных учителей доля лиц с внутренним локусом контроля значительно ниже, в) среди высокоуспешных учителей доля лиц с внутренним локусом существенно отличается от доли лиц с внешним локусом.

Очевидно, что из трех вариантов альтернативной гипотезы наибольшего внимания заслуживает гипотеза а), так как она более информативна, чем гипотеза в), а с содержательной стороны верно отражает концепцию автора в отличие от гипотезы б). Необходимо статистически проверить две альтернативные гипотезы (Н0 и Н1), причем нулевую гипотезу мы заранее предполагаем отклонить.

При использовании непараметрических методов психолог-исследователь обычно не испытывает затруднений при выборе типа задачи и ее математическом формулировании. Однако следующий этап выбор критерия, т.е. конкретного инструмента решения полученной задачи, сопряжен с определенными трудностями. Прежде чем излагать принципы отбора наиболее подходящего критерия, охарактеризуем вкратце общие подходы к решению непараметрических задач.

Первый из них основан на применении принципа инвариантности, который по существу является алгоритмом синтеза статистических

 

147

 

процедур для задач, обладающих симметрией определенного вида. Для решения необходимо найти метод, который давал бы решающие процедуры (аналогичные функциям правдоподобия или функционалу среднего риска в классической статистике) без предположения об известности распределений случайных величин.

Начальный этап синтеза состоит в том, чтобы указать группу С преобразований D величины X, сохраняющих инвариантной задачу проверки гипотезы Н0 против альтернативы Н1. Вторым этапом синтеза является отыскание максимального инварианта Тх. Суть этой операции состоит в отображении рассматриваемого множества объектов (эмпирических данных, результатов измерений), снабженного фиксированным отношением эквивалентности на другое множество математических объектов. После того как максимальный инвариант найден, задача редуцирована, т.е. сведена к совокупности новых случайных величин, сохранивших всю информацию о задаче в том смысле, что их статистические свойства при гипотезе и ее альтернативе различаются известным образом. Следующий этап состоит в построении решающей функции на основе Тх, представляющей собой статистическое правило, согласно которому на основании полученных наблюдений делается статистический вывод: принимается решение о справедливости одной из двух гипотез. Этим и заканчивается синтез. Если удается пройти все три этапа без осложнений, то можно получить хороший (иногда даже равномерно наиболее мощный) критерий для решения данной задачи.

Однако некоторые особенности принципа инвариантности ограничивают его практическое применение в непараметрической статистике. Во-первых, соображения инвариантности не являются универсальными, т.е. пригодными для решения любых задач. Приходится вводить дополнительные требования к другим свойствам критериев (несмещенности, мощности и т.д.), а это не всегда устраивает исследователя. В некоторых случаях принцип инвариантности вообще неприменим [4]. Во-вторых, использование данного принципа даже в случае его успешного применения не обязательно приводит к получению непараметрических критериев, и наконец, еще один существенный недостаток неполная алгоритмизуемость процедур. В ряде случаев нахождение подходящей группы преобразований не представляет труда, но нет четких рецептов построения такой группы для более сложных случаев. Нет также алгоритма нахождения максимального инварианта. В психолого-педагогических исследованиях его поиск затруднен еще и тем, что для облегчения ориентировки в массивах данных аналогичная процедура («сжатие эмпирического материала») часто выполняется автором до начала формулирования статистической задачи. Поэтому в настоящее время развиваются принципиально новые подходы к синтезу процедур решения непараметрических задач, примерами которых являются эвристический метод и метод функционалов. Не останавливаясь подробно на характеристике эвристического метода, использование которого предполагает фундаментальную математическую подготовку исследователя и наличие у него математической интуиции, рассмотрим основные особенности метода функционалов.

В традиционных методах решения статистических задач статистики рассматриваются как измеримые функции случайных величин. Если же рассматривать статистику как функционал от эмпирической функции распределения, то вместо конструирования самой статистики достаточно построить функционал, выражающий априорную информацию о задаче. Сущность этой процедуры составляет операция отражения произвольного множества значений данных на множество чисел, задаваемых эмпирической функцией распределения. Тогда сама статистика получается автоматически, путем подстановки в функционал оценки функции распределения [8; 35—39]. Анализ свойств статистики упрощается благодаря тому, что они могут быть выражены через свойства оценки функции распределения. Эти преимущества делают актуальным такое развитие и обобщение данного подхода, которое позволило бы охватить возможно более широкий класс статистик, т.е. прежде всего обобщить интерпретацию статистики как оценки функционала.

Всякая задача проверки гипотез или оценивания параметров может рассматриваться как задача отбора из подклассов некоторого класса распределений, т.е. различения подклассов на основе результатов наблюдений. Подобные задачи особенно часто приходится решать при профотборе, в психодиагностических исследованиях, а также в исследованиях по возрастной и педагогической психологии.

Различение подклассов достигается путем введения количественной характеристики различий между подклассами в виде функционала. Непараметрическая постановка задачи обычно задает различие между распределениями в настолько общем виде, что допускает неоднозначное толкование

 

148

 

при формулировке количественной меры различий. Другими словами, непараметрические методы позволяют в рамках решаемой задачи любое различие параметров однозначно интерпретировать как принадлежность к разным подклассам.

Проиллюстрируем это на простейшей задаче различения распределений по параметру расположения. Например, задача определения уровня волевого развития школьника, если известно, какое место он занимает в соответственно упорядоченной по данному фактору выборке. Математически нам требуется оценить параметр, если задано только то, что он входит в неизвестное распределение Fa(x) следующим образом: Fa(x)=F(x—а). Как видим, указанное различие носит характер сдвига, но сам сдвиг еще не определен. Мы можем доопределить его как математическое ожидание, медиану, моду, полусумму симметричных квантилей и т.п. Заданное различие (в данном случае сдвиг) может быть выражено несколькими функционалами, каждый из которых можно оценить по выборке. Разумеется, выбор соответствующего функционала полностью определяется задачами исследования. Психолог сам решает, важно ли ему знать, насколько часто в выборке встречается данный параметр (мода), или насколько близок он к средним значениям выборки (медиана), или какая доля объектов исследуемой выборки входит в тот же класс, что и оцениваемый параметр (квантиль). В зависимости от этого выбирается тип критерия (медианный, знаково-ранговый и т.д.).

Точно так же он может получить полную характеристику параметра в исследуемой выборке и делать выводы о ее свойствах, используя все возможные функционалы. Этот метод не только упрощает вычисление статистики, но и делает эту задачу более строгой математически, а психологически гораздо более обоснованной и корректной.

Вопрос об обоснованности применения того или иного статистического критерия представляется весьма значимым с точки зрения методологии исследования, метод функционалов способствует прояснению этой сложной задачи. Многообразие статистик, подходящих для решения каждой отдельной задачи, обусловлено не только тем, что заданное различие может быть выражено не единственным функционалом, но и тем, что одно и то же представление распределения может быть оценено несколькими способами. Например, плотность в непараметрическом случае может быть оценена гистограммой, оценкой РозенблаттаПарзена, матричным методом, полиграммой и т.д. Использование каждой из таких оценок для функционала будет давать новую статистику, со своими особенностями в свойствах. Поэтому последующий психологический анализ и интерпретация полученной статистики могут подсказать новую, не предполагаемую ранее экспериментатором оценку исследуемого явления, свойства или процесса.

Охарактеризуем теперь конкретные виды непараметрических критериев и принципы их выбора для проверки гипотез. Остановимся на нескольких, выбор которых обусловлен, с одной стороны, соображениями прикладного характера, с другойотносительной простотой вычислений и наглядностью получаемых результатов. Подробное описание математической процедуры для каждого критерия см. [3], [7], [10] и др. Мы ограничимся лишь описанием возможностей применения этих критериев в психолого-педагогических исследованиях разных типов, а также характеристикой пригодности данного критерия в зависимости от типа шкалы измерения.

1. Критерий точной вероятности Фишера используется для оценки различий в двух независимых выборках и позволяет получить точные значения вероятности событий, столь же или еще менее вероятных, чем те, которые в действительности наблюдались. Этот критерий особенно пригоден для малых выборок, если же объем обеих выборок больше 30, вычислительные процедуры становятся громоздкими и следует использовать критерий χ2.

Простейшее альтернативное распределение, состоящее из двух градаций, часто встречается в исследованиях при оценке качественных эффектов: распределение испытуемых, успешно и неуспешно выполнивших задание, распределение по наличию или отсутствию какой-либо личностной черты или количественный эффект, достигший определенного предела и т. д. Используем приводившийся выше пример из наших исследований. При изучении локуса контроля личности в выборке из 10 успешных и 10 малоуспешных учителей было обнаружено, что двое из успешных учителей имеют внешний локус, а 8 — внутренний; и наоборот, среди малоуспешных учителей только трое имели внутренний локус, а остальные внешний. Возникает вопрос, можно ли по такой малой выборке сделать вывод о существенных различиях в типе локализации контроля над событиями у успешных и малоуспешных учителей.

 

149

 

Нулевая гипотеза будет состоять в том, что доля лиц с внешним локусом среди успешных и неуспешных учителей одинакова, альтернативная что она различна. Эффективность критерия точной вероятности Фишера при оценке различий двух выборок можно существенно повысить, изменив характер нулевой гипотезы и оценивая не различия в средних тенденциях, а разницу в частоте появлений некоторой величины изучаемого показателя, превышающую определенный предел. Этот метод позволяет также выявлять различия в форме распределений при отсутствии различий в средних тенденциях [4].

2. Критерий значимости изменений Макнимара. В большинстве исследований по педагогической психологии используются связанные выборки. Простейший примерисследование, в котором одни и те же субъекты испытываются как до воздействия экспериментальной переменной, так и после него. Наибольший интерес вызывает изменение от «до» к «после». Так, психолога может интересовать сравнительная эффективность различных методов обучения, изменение уровня развития определенного личностного свойства после соответствующих воспитательных воздействий, улучшение результатов деятельности после тренировки навыков и т.д.

При проведении исследований по схеме «до после» ответы обычно связаны с дихотомическими категориями типа «данет», «согласен несогласен», «за.против». Разумеется, ответы испытуемых «до» и «после» могут различаться. При использовании критерия Макнимара типичная ненаправленная нулевая гипотеза состоит в том, что в генеральной совокупности доля тех, кто изменяет положительный ответ на отрицательный, равна доле изменяющих отрицательный ответ на положительный.

Если критериальная мера носит двузначный характер («лучше хуже», «использоватьне использовать»), то подходящим критерием значимости будет Qкритерий Кокрена. Этот критерий может быть использован также, когда группы однородных субъектов подвергаются более чем двум экспериментальным воздействиям и их ответы носят двухвариантный характер см. [2], [3], [7].

3. Критерий Колмогорова—Смирнова наиболее эффективен, если есть основания предполагать, что частоты каждого из порядковых значений (рангов) будут располагаться не случайным образом, а в соответствии с некоторой предсказуемой схемой. Например, мы можем предположить, что при оценке профессиональной значимости волевых качеств личности учителя руководители школ будут отдавать предпочтение таким свойствам, как организованность и исполнительность. Мы предлагали завучам и директорам школ проранжировать по степени значимости для учителя список, состоящий из 10—15 волевых качеств. Математическая процедура требует накапливания частот по всем порядковым значениям. Затем сравниваются два распределения: имеющее место при справедливой Н0 (например, исполнительность и ответственность будут так же часто иметь первые ранги, как смелость, решительность и другие качества) и наблюдаемое в действительности распределение.

При работе с выборками большого объема для подсчета частот составляется таблица, в которой значения записываются в форме интервального ряда. Число интервалов при этом должно быть не менее 8 (иначе достоверность выводов снижается). Если же оно больше 15, то использовать критерий КолмогороваСмирнова нецелесообразно, так как объем вычислений будет очень велик. Нельзя также забывать о том, что распределения случайных переменных обязательно должны быть непрерывными. В противном случае законы распределения статистик критерия будут зависеть от законов распределения самих Случайных величин, а это делает невозможным применение любого непараметрического критерия вообще [10].

4. Критерий Манна Уитни применяют в случае независимых выборок, например при сравнении результатов экспериментальной и контрольной серий по одному или нескольким показателям. Этот критерий является одним из наиболее мощных при выявлении различий между центральными параметрами (мода, медиана). При использовании критерия Манна Уитни наиболее часто в нулевой гипотезе формулируются утверждения относительно конкретного параметра. Воспользуемся примером, приведенным в [7; 76].

Перед началом игры двум группам детей дошкольного возраста показали два мультипликационных фильма. Одна группа смотрела фильм с ярко выраженными агрессивными элементами, вторая без них. После просмотра каждый ребенок некоторое время играл отдельно от своих товарищей, причем опытные наблюдатели регистрировали количество поступков агрессивного характера, совершенных ребенком по отношению к своим игрушкам в течение этого периода. Нулевая гипотеза (Н0): не существует различия между медианами для отметок об агрессивности детей после

 

150

 

просмотра фильмов. Альтернативная гипотеза (Н1): такое различие существует.

В данном случае нас интересовал конкретный параметр (медиана). Однако не всегда результаты наблюдений описываются количественными значениями, которые затем можно ранжировать. Кроме того, в некоторых случаях нас интересуют более общие нулевые гипотезы, касающиеся любых различий между генеральными совокупностями. Тогда применяют критерий серий Вальда Вольфовица, который является чувствительным по отношению к целому ряду различий, включая различия в медианах, мерах изменчивости и асимметрии.

Например, в процессе эксперимента по воспитанию воли две группы учеников получили два разных типа подготовки. После окончания эксперимента способность к волевой деятельности каждого учащегося была индивидуально проверена в различных жизненных и учебных ситуациях, причем учителя-эксперты, оценивающие их действия, не были осведомлены о типе подготовки. Но: оценки способности к волевой деятельности, полученные в обеих группах, были отобраны из общей генеральной совокупности (т.е. обе группы ничем не отличаются друг от друга по этому параметру). Hi: в результате различий в типе подготовки обе группы отличаются по своей способности к волевой деятельности (т.е, оценки не были отобраны из общей генеральной совокупности).

Описанные ранее критерии Макнимара и Кокрена пригодны для случаев, предполагающих использование номинальных шкал и связанных выборок. Критерии КолмогороваСмирнова и ВальдаВольфовица употребляются для порядковых шкал с одной или несколькими независимыми, несвязанными выборками, в случае связанных выборок используется знаково-ранговый критерий Уилкоксона (Т-критерий). Например, план эксперимента предусматривает разбиение выборки на однородные пары, каждая из которых затем подвергается экспериментальному воздействию в различных для членов пары условиях. Тогда разности между отметками внутри пар являются непрерывной переменной и могут быть проранжированы (с учетом знаков получаемых разностей). Т-критерий определяет, насколько справедлива нулевая гипотеза о том, что в генеральной совокупности доля лиц из экспериментальной группы, получающих более высокие отметки по сравнению с подобными для них контрольными напарниками, равна доле лиц из экспериментальной группы, получающих отметки ниже, чем их контрольные напарники [3], [7].

При описании различных непараметрических критериев мы постоянно обращались к проверке статистических гипотез непараметрическими методами. Однако проверка гипотезы, в частности нулевой, обычно лишь начало статистического исследования. После того как нулевая гипотеза отвергнута, необходимо делать более содержательные выводы из статистического материала: проводить точечное и интервальное оценивание дисперсионный анализ и т.д.

Универсальность, простота и точность, математическое изящество непараметрических методов привлекают к ним все большее внимание исследователей. Применение этих методов в психолого-педагогических исследованиях значительно повысит их эффективность и качество.

 

1. Бикел П., Доксам К. Математическая статистика. М., 1983. Вып. 2. 242 с.

2. Грабарь М. И., Краснянская К. А. Применение математической статистики в педагогических исследованиях. М., 1977. 136 с.

3. Захаров В. П. Применение математических методов в социально-психологических исследованиях. Л., 1985. 64 с.

4. Леман Э. Проверка статистических гипотез. М., 1964. 297 с.

5. Математическая психология: методология, теория, модели / Под ред. В.Ю. Крылова. М., 1985. 236 с.

6. Методы системного педагогического исследования / Под ред. Н.В. Кузьминой. Л., 1980. 172 с.

7. Рунион Р. Справочник по непараметрической статистике. М., 1982. 198 с.

8. Тарасенко П. П. Непараметрическая статистика. Томск, 1976. 292 с.

9. Тюрин Ю. Н. Непараметрические методы статистики. М., 1978. 64 с.

10. Холлендер М., Вульф Д. А. Непараметрические методы статистики. М., 1983. 518 с.

 

Поступила в редакцию 11. Х 1985 г.



1 Поскольку непараметрические критерии значимости не требуют предварительных предположений относительно вида распределений, их обычно называют критериями, не зависимыми от распределения [7].