Вы находитесь на сайте журнала "Вопросы психологии" в девятнадцатилетнем ресурсе (1980-1998 гг.).  Заглавная страница ресурса... 

30

 

МЕТОД ПСИХОЛОГИЧЕСКИХ ТЕСТОВ: СУЩНОСТЬ И ЗНАЧЕНИЕ

 

Ю.З. ГИЛЬБУХ

 

Состояние проблемы. Сложный и противоречивый вопрос о сущности и значении метода тестов к началу 20-х гг. приобрел печальную репутацию одной из наиболее запутанных проблем психологии, что и было отмечено в то время В. Штерном, писавшим, что по отношению к тестам «в преувеличенных надеждах и преждевременных требованиях нет недостатка, так же как и в бессмысленных нападках и бесплодной критике» [25; 65].

 

31

 

За минувшие шесть десятилетий ситуация, естественно, во многом изменилась. При этом ее противоречивость еще более возросла. С одной стороны, давно развеялись преувеличенные, наивные надежды. С другой стороны, многие предъявлявшиеся в тот начальный период требования сегодня, увы, уже не могут считаться преждевременными, необоснованными.

Возьмем кардинальный вопрос о сущности данного метода. Разве еще не пришло время для того, чтобы дать на него глубокий, основательный ответ? Но если в поисках такого ответа мы обратимся к буржуазной тестологии, которая недавно отметила столетнюю годовщину своего существования, то обнаружим малоутешительную и на первый взгляд парадоксальную картину: несмотря на то, что за этот период на Западе изданы многие сотни объемистых монографий, тысячи пространных статей, а главное, разработано огромное множество разнообразнейших тестовых методик, сущностные черты самого метода и сегодня освещаются весьма поверхностно. Дело ограничивается самыми общими определениями: «Систематизированная процедура для наблюдения и описания поведения индивида с помощью шкалы или понятийной системы» [28; 26]; «Объективное и стандартизованное измерение выборки поведения» [3; 31]; «Некоторый набор стандартизованных или контролируемых ситуаций для реагирования, предъявляемых испытуемому с целью вызывать у него репрезентативную выборку его поведения, которое имеет место, когда он сталкивается с некоторым определенным видом требований, предъявляемых окружающей средой» [29; 547].

Как видим, все характеристики даются исключительно в бихевиористских терминах и, естественно, не раскрывают сколько-нибудь глубоко не только психологические механизмы, на которых строится рассматриваемый метод, но и его логические основания. При этом вопросов о специфических, отличительных чертах метода тестов даже не затрагивается. Не случайно все приведенные выше определения с одинаковым успехом могут быть приложены и к методу лабораторного эксперимента. Этому отнюдь не препятствует имплицитно отмеченная в последней из процитированных дефиниций модельная природа тестовых методик, поскольку для эксперимента этот признак характерен в не меньшей степени.

В противоположность только что описанному подходу, в советской психологии уже в 20-х гг. наметилась тенденция к разработке в первую очередь методологических, в частности логических, основ построения тестовых методик и определения особенностей, отличающих метод тестов от других психологических методов. В частности, следует отметить интересную, хотя и незавершенную, попытку К.Н. Корнилова определить место, которое занимают в функциональной структуре тестовых методик логические операции индукции и дедукции [13]. Полезный анализ метода тестов был проведен в тот период П.П. Блонским, А.П. Болтуновым, П.А. Шеваревым, Г.С. Костюком [23], М.С. Бернштейном [5], С.Г. Геллерштейном [9].

К сожалению, столь плодотворно начавшаяся методологическая и методическая работа вскоре оказалась неоправданно прерванной и что особенно прискорбно в течение весьма длительного времени, фактически и по сей день, не получила надлежащего продолжения. Правда, можно с удовлетворением констатировать, что за последние 10—15 лет метод тестов не только завоевал формальное признание, заняв принадлежащее ему по праву место в учебниках, но и приобрел ряд убежденных активных сторонников, которые его пропагандируют, а главное, способствуют его совершенствованию, осуществляя конструирование и модифицирование конкретных тестовых методик [2], [4], [6] [8], [15], [17], [21], [24], [26], [27]1. Появились признаки оживления и теоретико-методологической работы в данной области. Так, например,

 

32

 

центральный для валидности всех психологических методов вопрос о «логическом переходе от результатов выполнения какого-либо задания к характеристике психологических качеств субъекта» [20; 19] вновь, как видим, поставлен на повестку дня методологических исследований, причем именно в связи с разработкой проблем психодиагностики.

Однако все это скорее подчеркивает, чем опровергает, общее впечатление о неоправданно затянувшемся отставании в развитии методологии тестирования. Картина явного неблагополучия окажется еще более яркой, если принять во внимание тот факт, что бессмысленные и бесплодные нападки, о которых писал в свое время В. Штерн, имеют место и в наши дни, в том числе и в публикациях советских авторов, причем «метод тестов критикуют и отвергают особенно остро те, кто этого метода не знает» [15; 62].

Между тем актуальные запросы общественной практики, в том числе школьная реформа, поставившая задачу «улучшить психолого-педагогическое изучение школьников» [1; 70], все более настоятельно требуют повышения эффективности психодиагностических методик, включая, разумеется, и психологические тесты. Последнее, однако, окажется возможным только в том случае, если уже в сравнительно недалеком будущем удастся добиться глубокого раскрытия сущности данного метода, адекватно определить его возможности и значение.

Исходные принципы. Отметим ряд принципиальных положений, которые, по нашему мнению, должны быть исходными при решении только что названных задач.

1.Органическое соединение методологической оснащенности и специальной эрудированности. Для развития метода тестов, как, впрочем, и всех других методов психологии, одинаково губительны как огульное отрицание, так и некритическое, неразборчивое приятие всего с ним связанного, проявляющееся, в частности, в неквалифицированном, вульгаризаторском по своей сути применении любых практически доступных тестов. Оба эти, казалось бы, полярно противоположных явления в действительности имеют еще и общий источник очевидную некомпетентность тех, кому мы обязаны их существованием. При этом отсутствие достаточной методической вооруженности означает отсутствие тормоза, удерживающего от формулирования оценок с позиций либо полного незнания, либо, в лучшем случае, полузнания.

Сошлемся на один из наиболее простых примеров. Многие ошибочные характеристики и оценки возникают из-за того, что их авторы не проводят различия между понятиями «метод тестов» (как обобщенным способом выявления и оценки психических свойств личности) и «тестовая методика, тест» (как более или менее конкретной «техникой», приемом, которым данный метод реализуется). Обычно научно-исследовательский метод реализуется многочисленными конкретными методиками. Для метода тестов это особенно характерно его представляют сотни разнообразных методик. Видеть и учитывать в своих оценках все это многообразие, дифференцированно подходить к отдельным тестологическим концепциям, принципам и приемам, а также типам и видам тестовых методик, естественно, может лишь специалист, органически соединяющий в своей подготовке глубокие познания в области общенаучной и специально психологической методологии с широкой компетентностью в отношении более конкретных, специфических вопросов тестологии.

2. Построение анализа на основе диалектико-материалистического принципа историзма. Если обращение к историческим истокам всегда плодотворно для науки, то по отношению к анализу тестологических явлений оно представляется совершенно необходимым. Ведь за свою более чем столетнюю историю метод тестов претерпел существенную эволюцию.

Во-первых, в значительной мере расширились его функции, причем на разных

 

33

 

этапах доминирующими были то одни из них, то другие. Так, возникнув вначале в качестве основного инструмента исследований в области дифференциальной психологии (Ф. Гальтон, Дж. М. Кеттелл), метод тестов впоследствии приобрел и функцию психодиагностического средства (А. Бине и Т. Симон); наконец, в последние десятилетия он во все больших масштабах применяется в качестве опять-таки научно-исследовательского метода, но уже не в одной, а во многих отраслях психологии (кроме дифференциальной, еще и в возрастной, педагогической, социальной, инженерной, причем в последних трех из названных наук он играет роль вспомогательного средства, обеспечивающего точную фиксацию различных зависимых переменных, которые используются в экспериментальных исследованиях) .

Во-вторых, соответственно расширению функционального диапазона изобретались различные типы и виды тестовых методик, а вместе с этим изменялось и существо самого метода: некоторые его признаки, которые вначале играли существенную роль, со временем утратили свое значение, и вместо них на передний план выдвинулись другие признаки.

Принцип историзма, в приложении к анализируемому методу, требует также, чтобы при его оценке мы ориентировались не только на те методики, в которых он реализуется в настоящее время, но и на его возможности к дальнейшему развитию и совершенствованию, вытекающие из присущих ему особенностей. При этом никоим образом нельзя допускать отождествления метода тестов с тем, что достигнуто в данной области на Западе. Многие из созданных там тестов являются, как известно, неудовлетворительными в научном отношении и, естественно, малоэффективными в практическом плане. Это свидетельствует в первую очередь о сложности и трудности тех проблем, с которыми имеет дело тестология, но также и о несостоятельности многих методологических концепций, с позиций которых предпринимаются попытки их решения. Указанные обстоятельства, конечно же, являются весомыми аргументами в пользу отказа от использования таких концепций, а также основанных на них тестовых методик (или по крайней мере ограничения сферы их практического применения). Однако основанием для отказа от метода тестов как такового они служить не могут2, тем более что уже в настоящее время в социалистических странах, и в первую очередь в СССР, создаются тесты принципиально нового типа, обладающие более высокими диагностическими характеристиками, о чем более подробно будет сказано ниже. Не могут служить таким основанием и те преднамеренные извращения, которые имеют место при использовании тестов в буржуазном обществе, в том числе их применение для осуществления интеллектуальной (а фактически классовой и расовой) сегрегации [10]. В этой связи следует отметить, что в тех же целях на Западе используются и другие психодиагностические методы (наблюдения, анализ продуктов деятельности и даже индивидуальные беседы).

3. Принцип классификации и учета различных признаков. Принимая во внимание сложность и многообразие рассматриваемого метода, его генетическую и функциональную взаимосвязь с другими психологическими методами, целесообразно строить анализ в соответствующем контексте, на основе выделения трех групп признаков: 1) необходимых по отношению к методу тестов, но не специфических для него; 2) необходимых и специфических, но лишь по отношению к отдельным видам тестовых методик (для метода тестов в целом не обязательных) ; 3) необходимых и специфических для метода тестов в целом. При этом понятие необходимости должно иметь здесь относительный характер, в том смысле, что слабая выраженность в какой-либо конкретной методике

 

34

 

одного или даже нескольких необходимых признаков не лишает ее права именоваться тестовой такую методику нужно рассматривать как не вполне разработанный, несовершенный тест. Переходим к анализу указанных групп признаков.

Признаки, необходимые по отношению к методу тестов, но не специфические для него. Эта группа признаков в свою очередь может быть разделена на две категории. Первую из них составляет признак, который является необходимым и специфическим для всего класса психологических методов (назовем его условно общепсихологическим). Вторая категория это признаки, необходимые и специфические для отдельных сочетаний, групп психологических методов, в каждую из которых входит и метод тестов (назовем эти признаки групповыми). Очевидно, не проанализировав признаки каждой из названных категорий, не раскрыв их сущности, невозможно выявить те свойства метода тестов, которые являются для него специфически необходимыми.

Общепсихологический признак. Им, по нашему мнению, является своеобразный, психологический по своей природе, процесс обобщения, выражающийся алогически обоснованном переходе от фиксации и оценки некоторой совокупности поведенческих фактов, которая характеризует деятельность отдельных индивидов, к суждениям, формулируемым в терминах определенного психического свойства, группы свойств или «личности в целом». (В дальнейшем такие суждения могут усредняться по отношению ко всей выборке испытуемых, репрезентирующей определенную популяцию.)

Ориентируясь на поведенческие признаки, содержащиеся в принятом им определении исследуемого психического свойства, автор методики подбирает стимульный материал, в реакциях на который и должно проявляться, по его мнению, это свойство. Наряду с качественным анализом, создаются предпосылки и для анализа количественного разрабатывается формула для непосредственного шкалирования поведенческих данных в терминах выбранных показателей. Ими обычно служат либо количество ответов определенного типа, либо время, затраченное на выполнение задания, либо число допущенных при этом ошибок, либо, наконец, несколько показателей одновременно. В последнем случае, как правило, используется специальная формула для сведения значений нескольких показателей к одному значению. Однако и такая сложная формула носит непосредственный характер, поскольку получаемые с ее помощью индивидуальные оценки не опосредуются распределением зафиксированных данных в определенной возрастной, половой или профессиональной выборке. Все эти особенности и составляют, по нашему мнению, признак, который является необходимым и специфическим для всего класса психологических методов.

Групповые признаки. Одним из таких признаков является испытательный характер метода. В свое время В. Штерн утверждал, будто данный признак составляет специфическое свойство тестов [25]. Этот тезис, представляющий, по-видимому, простой вывод из самого термина «тест» (испытание), встретил решительное возражение со стороны М.И. Бернштейна, справедливо отметившего, что и экспериментальный метод имеет испытательный характер [5]. В каком-то смысле свойством «испытательности» обладают также анализ продуктов деятельности и даже наблюдение (включая самонаблюдение).

Именно испытательный характер самонаблюдения служит основанием для отнесения к методу тестов так называемых личностных опросников [3], [28], [29]. С некоторой степенью условности можно считать, что в роли испытаний здесь выступают естественные жизненные ситуации, с которыми опрашиваемое лицо сталкивалось в прошлом. Различие по сравнению с другими типами тестовых методик состоит в том, что в данном случае непосредственным источником информации об интересующем экспериментатора психическом

 

35

 

свойстве служат не его собственные наблюдения над проявлениями этого свойства при выполнении испытуемыми определенного задания, а основанные на данных самонаблюдения и оформленные в соответствии с экспериментально разработанными вопросами, по определенным стандартам сообщения опрашиваемого о типичных для него формах поведения, психических состояниях, настроениях, эмоциональных переживаниях и т. п. Обработав полученные таким путем фактологические данные с помощью соответствующей формулы шкалирования (так называемого ключа), получают обобщающие оценочные суждения в терминах определенных психических свойств (способностей, ценностных ориентации, интересов, черт характера и т.п.).

Вместе с тем существует и такая категория опросных методик, которая не может быть отнесена к методу тестов ввиду того, что хотя они и имеют в качестве объекта определенную личность, последняя, однако, не выступала в роли испытуемого ни в настоящем, ни в прошлом. Это, во-первых, методики оценочных классификаций (рейтинг) и, во-вторых, социометрические методики. При использовании методик этих двух типов лица, являющиеся объектом обследования, не только не проходят через какие-либо испытания, но, как правило, даже не ставятся в известность о произведенных в отношении них оценках или социометрических выборках. К сожалению, некоторые авторы, признавая неправомерность отнесения методик названных типов к категории тестовых, тем не менее считают нецелесообразным что-либо менять в укоренившейся терминологии (см., например, [2; 182—183]).

В качестве группового признака метода тестов выступает его функция служить одним из основных инструментов психодиагностики. Правда, существует тенденция рассматривать этот признак как опять-таки специфический для данного метода (см., в частности, [16; 41]), но она не имеет под собой достаточных оснований, ибо, с одной стороны, психологический диагноз во многих случаях ставится без использования тестовых методик (на основании материала, полученного путем наблюдений, анализа продуктов деятельности и индивидуальных бесед), а с другой стороны, многие тесты применяются, как мы уже отмечали, не только в психодиагностических целях.

С диагностической функцией метода тестов связан еще один его групповой признак оперирование производными оценками. Выше отмечалось, что все, без исключения, психологические методы предполагают в структуре методики формулы для шкалирования результатов теста в терминах непосредственных оценок. Для исследовательских методов большего и не требуется. Ведь для того, скажем, чтобы сопоставить состояние зависимых переменных в экспериментальной и контрольной группах, достаточно проанализировать разность между средними арифметическими непосредственных оценок, зафиксированных в каждой из этих групп, с точки зрения ее статистической значимости. Совершенно по-иному обстоит дело в отношении психодиагностических методов эти методы обойтись непосредственными оценками не могут. Дело в том, что сами по себе такие оценки практически ничего не говорят о том, что интересует психодиагностику, об уровне или характере развития тестируемого свойства у данного испытуемого. Ибо решение, скажем, 25 % всех задач по одному тесту может означать более высокий уровень развития способности, чем 50 % выполненных заданий по другому тесту. Чтобы индивидуальную непосредственную оценку наполнить определенным содержанием, «заставить ее говорить», сделать источником психодиагностической информации, нужно эту оценку рассмотреть в контексте распределения всех оценок, зафиксированных для той популяции, к которой принадлежит данный испытуемый. В результате такого сопоставления непосредственная оценка трасформируется в производную3. Последняя показывает,

 

36

 

какое место в отношении тестировавшегося свойства занимает наш испытуемый в своей популяции. А это уже весьма информативная, диагностическая по своей сущности, характеристика.

Наконец, групповыми признаками метода тестов являются строгая стандартизация условий испытания и связанная с этим возможность психологически моделировать те или иные жизненные ситуации. Оба эти признака в равной мере присущи и лабораторному эксперименту, так как и здесь все испытуемые, входящие в одну группу (экспериментальную или контрольную) ставятся в тождественные условия, психологически моделирующие, в соответствии с замыслом экспериментатора, определенные ситуации «реальной» жизни.

Признаки, необходимые и специфические, но лишь по отношению к отдельным типам тестовых методик. Таким образом, речь пойдет о типообразующих признаках. Одним из таких признаков является только что упомянутая модельная природа методики. Хотя этот признак принадлежит к числу тех, которые связывают метод тестов с лабораторным экспериментом, тем не менее данная черта присуща отнюдь не всем, а лишь некоторым типам тестовых методик (например, тесты опросного типа не носят модельного характера).

К группе типообразующих принадлежат еще два признака. Это, во-первых, кратковременность процедуры испытания и, во-вторых, его «статичность». Признаки эти нуждаются в анализе прежде всего потому, что некоторыми современными авторами они неправомерно трактуются как специфические для метода тестов в целом. При этом иногда делаются ссылки на следующее авторитетное определение: «Тест стандартен и статичен. Он стягивает весь процесс к одному моменту решения задачи... В нем не виден процесс, операция в ее дифференцированном протекании» [19; 88].

Действительно, первые стандартизованные испытания, направленные на измерение индивидуальных различий (Ф. Гальтон, Дж. Кеттелл, Э. Крепелин, Г. Эббингауз), характеризовались одномоментностью и благодаря этому сравнительной кратковременностью и самой пробы, и процедуры оценивания ее результатов. Однако обусловлено это было не сущностной природой нового метода дело объяснялось относительной простотой предмета тестирования (его составляли, как известно, элементарные, в основном психофизиологические, функции). Разумеется, такие функции и в настоящее время испытываются в кратковременных пробах. Когда же в предмет тестирования были включены и высшие психические функции, а затем и «вся личность в целом», то процедура тестирования намного удлинилась обычно в этих случаях она продолжается от одного до нескольких часов (СтенфордБине, Роршах, ТАТ и др.).

Поскольку речь зашла о тестах, принадлежащих к категории индивидуальных, отметим заодно, что предметом фиксации в них может быть не только конечный результат, но и процесс, который к нему привел. «Стягивание» процесса к заключительному моменту решения характерно лишь для одной категории тестовых методик (которую, несомненно, и имел в виду С.Л. Рубинштейн), а именно для групповых тестов интеллекта. Последние за это подвергаются, как известно, справедливой критике4. Впрочем, и здесь в последнее время наметились сдвиги в лучшую сторону разрабатываются, в первую очередь советскими психологами, так называемые обучающие тесты, обеспечивающие более или менее детальную и точную фиксацию самого процесса решения [11], [12], [18]. Вместе с тем следует учитывать, что далеко не каждый тест должен иметь процессуальную природу. Разумеется, это необходимо,

 

37

 

например, для измерения так называемой обучаемости, но совершенно излишне, нам думается, при испытании элементарных психофизиологических функций (таких, скажем, как восприятие или кратковременная память).

Признаки, необходимые и специфические для метода, тестов в целом. Это, как нетрудно понять, наиболее существенная, главная группа. Она включает два взаимосвязанных признака:

1. Наличие в структуре каждой тестовой методики достаточно сложного математико-статистического аппарата, состоящего из двух основных компонентов: а) специальной системы для оценивания результатов испытания, основанной на использовании шкал (таблиц) производных оценок, и б) критериально-оценочной спецификации данного теста.

2. Широкий, многократный характер практического использования, свойственный методикам данного типа.

Первый из названных признаковэто, по сути, главная демаркационная линия, отделяющая метод тестов от остальных психодиагностических методов.

Возьмем в качестве их представителя метод наблюдения. В его структуре отсутствует какой бы то ни было аппарат для получения производных оценок, вследствие чего наблюдатель каждый раз должен их формулировать, анализируя зафиксированные факты, осуществляя различные сопоставления и опираясь при этом на свой опыт, интуицию. Естественно, при таких условиях производные оценки оказываются весьма грубыми (дифференцируемыми обычно лишь по трем уровням развития наблюдаемого свойства: низкому, среднему и высокому). Однако, несмотря на столь примитивную градацию, они к тому же еще нередко бывают и неточными, ошибочными.

Обратимся теперь к тестовым методикам. В каждой из них, в отличие от метода наблюдения, во-первых, раз и навсегда решена (другой вопросс какой степенью содержательной валидности) задача обобщения фиксируемых поведенческих данных в терминах определенного психического свойства или группы свойств, и сделано это еще при конструировании данного тестав момент определения характера и совокупности тех конкретных заданий, которые будут репрезентировать всю поведенческую сферу тестируемого свойства. Во-вторых, в каждой тестовой методике содержится, причем в качестве обязательного структурного компонента, специальный математико-статистический аппарат для трансформирования первичных оценок в производные таблица норм. Такие таблицы составляются, как известно, путем тестирования специально подобранной группы испытуемых, репрезентирующей определенную (как правило, возрастную) популяцию, нормативной, или стандартизационной, выборки.

В тестах, применяемых в прогностических целях, имеется еще один вид производных шкал таблица прогнозов. Они разрабатываются путем тестирования лиц, представляющих разные уровни овладения прогнозируемой деятельностью (учебной, профессиональной, спортивной и т.д.), и вычисления корреляции между двумя рядами оценок. Естественно, для каждого вида прогнозируемой деятельности должна быть составлена своя таблица прогнозов. С другой стороны, отсутствие в структуре методики каких бы то ни было прогностических шкал само по себе не лишает ее права именоваться тестовой, поскольку такие шкалы при необходимости могут быть разработаны только что упомянутым способом.

Здесь уместно затронуть вопрос о принадлежности к методу тестов методик проективного типа. Это связано с тем, что в последние годы наметилась тенденция (эксплицитно пока не декларируемая) к выделению их в самостоятельный психодиагностический метод [8], [21], [22]. В основе этой тенденции, по-видимому, лежит мнение, согласно которому проективные методики, в отличие от тестов психометрического типа, не имеют в своей структуре производных шкал ни психодиагностических, ни тем более прогностических.

 

38

 

Если бы этот аргумент был признан справедливым, мы оказались бы перед дилеммой: либо согласиться с указанной тенденцией, либо сделать вывод, что рассматриваемая особенность не распространяется на метод тестов в целом. Однако оба эти варианта отпадают, поскольку упомянутый аргумент нельзя считать истинным. Дело в том, что если взглянуть на данный вопрос с несколько более широкой точки зрения, то производные шкалы обнаруживаются не только в психометрических, но и в проективных методиках. Правда, в каждом из этих типов форма таких шкал, а также процедуры их разработки и применения характеризуются определенной спецификой.

В психометрических тестах мы имеем дело с сугубо количественными шкалами, представляющими собой набор импликаций, соединенных отношениями дизъюнкции: «Если А, то В...» При этом и в нормативных, и в прогностических шкалах в роли первого члена импликации выступают первичные оценки. Второй же член импликации представлен в этих шкалах по-разному. Таблицы норм построены таким образом, что любой возможной первичной оценке соответствует определенная оценка обобщающего характера. В таблицах же прогнозов каждой первичной оценке соответствует определенный набор вероятностей, каждая из которых относится к возможности получения одной из оценок шкалы, используемой для характеристики уровня выполнения прогнозируемой деятельности. В обоих случаях благодаря установлению четких соотношений трансформация оценок одного типа в эквивалентные оценки другого, более сложного, типа производится по сути автоматически, без использования личного суждения оценщика, т.е. совершенно объективно (так что выводы любого количества оценщиков во всех случаях полностью совпадают).

Производные шкалы, используемые в методиках проективного типа, имеют менее четкую структуру. В большинстве случаев они представляют собой лишь некоторую схему перевода всех ответов, которые возможны по данному тесту, в соответствующие диагностические или прогностические суждения. Ввиду этого переход от фиксации ответов испытуемых к обобщающим суждениям диагностического или прогностического характера осуществляется здесь далеко не автоматическипроективные тесты, как известно, требуют от оценщика довольно сложной мыслительной деятельности и поэтому характеризуются гораздо меньшей объективностью.

Однако это различие носит скорее количественный, нежели качественный характер. Дело в том, что в производных шкалах, которые входят в структуру проективных методик, также находят применение, хотя и не в такой степени, как в тестах психометрического типа, элементы квантификации (одним из примеров может служить использование в тесте Роршаха критерия оригинальности популярности ответов). Для трансформирования первичных данных в диагностические выводы экспериментатору дается детально разработанная «ориентировочная основа». Реестр возможных ответов, равно как и реестры их диагностических и прогностических значений, составляется путем апробирования разрабатываемого теста на репрезентативных выборках испытуемых с последующей статистической обработкой данных. В качестве примера можно сослаться опять-таки на тест Роршаха. Как известно, при его разработке были использованы данные, полученные при обследовании 288 пациентов, отличавшихся выраженными расстройствами умственной деятельности. В дальнейшем эти данные Роршах сопоставил с ответами, которые дали свыше 100 «нормальных» испытуемых. На этой основе и были разработаны схемы анализа ответов по данному тесту.

Итак, мы убеждаемся, что все тестовые методики, в том числе и проективного типа, имеют в своей структуре, причем в качестве обязательного компонента, тот или иной вид производных шкал, которые вместе со шкалой непосредственных, первичных оценок составляют специальную систему для оценивания полученных результатов.

 

39

 

Второй компонент математико-статистического аппарата тестовой методики ее критериально-оценочная спецификация представляет собой своеобразный технический паспорт, содержащий количественные характеристики данного теста по критериям надежности, а также содержательной и прогностической валидности. В принципе такая спецификация должна входить в состав любой психологической методики, поскольку необходимость в ней вытекает из специфики познания человеческой психики. Однако лишь метод тестов обладает сочетанием всех предпосылок, необходимых для реализации данного требования. Во внутреннем плане такой предпосылкой служит высокий уровень стандартизованности объективности тестовых процедур, во внешнем многократный характер использования тестовых методик, оправдывающий тот значительный объем технической работы, с которым сопряжено составление любой критериально-оценочной спецификации. Правда, эта процедура во многом сливается с разработкой таблиц производных оценок, но, как только что отмечалось, такая разработка сама составляет исключительную особенность рассматриваемого метода.

Упомянув о многоразовом использовании тестовых методик, мы тем самым коснулись второго специфически необходимого признака этого метода. Тестовые методики создаются, как правило, на многие десятилетия (что, конечно, не исключает, а, наоборот, предполагает возможность и необходимость их более или менее существенной модернизации). Кроме того, тесты бланкового, «карандашно-бумажного» типа обычно рассчитываются на массовое тиражирование, а в некоторых случаях и многократное использование каждого экземпляра. Этот редко отмечаемый признак столь же очевиден, как и его взаимосвязь с предыдущим признаком.

Определение. Проведенный анализ признаков можно резюмировать в виде следующего развернутого определения: метод тестов один из основных методов психологии, используемый для решения как диагностико-прогностических, так и научно-исследовательских задач, реализуемый многими типами и видами конкретных методик, которые, принадлежа к классу стандартизованных испытательных измерений, отличаются тем, что с целью получения мер, характеризующихся высокой информативностью, достоверностью (содержательной валидностью), дифференцированностью, точностью и надежностью, в каждую из них включен в качестве интегрального компонента специально разрабатываемый в каждом отдельном случае математико-статистический аппарат, состоящий из двух основных компонентов: 1) системы оценивания результатов испытания и 2) критериально-оценочной спецификации, в которой приведены количественные показатели, характеризующие данный тест по критериям надежности и валидности. В систему оценивания, наряду с формулой для выставления непосредственных, первичных оценок, входят два типа производных шкал: а) таблица норм, выполняющая роль ориентировочной основы для трансформирования поведенческих данных, зафиксированных с помощью первичных оценок, в оценочные суждения обобщающего характера, формулируемые в терминах психических свойств, группы свойств или «личности в целом», и б) таблица прогнозов, где для каждой первичной оценки указаны вероятности получения оценок, характеризующих различные степени успешности в отношении выполнения прогнозируемой деятельности. Ввиду повышенной структурной сложности тестовых методик их разработка оказывается оправданной лишь при условии достаточно широкого, многократного использования. Иными словами, такие методики создаются, как правило, в расчете на длительную перспективу, а наиболее эффективные тесты составляют постоянный инструментарий психодиагностики и психологической науки в целом.

О значении метода тестов и перспективах его дальнейшего развития. Хотя этот вопрос в значительной мере уже получил освещение в предыдущем изложении, все же по нему следует сделать

 

40

 

по меньшей мере три дополнительных замечания.

1. Очевидно, всякий научный метод должен, помимо всего прочего, получить оценку в свете общих критериев научности, как они формулируются в современных публикациях по методологии научного исследования (см., например, [14]). Если под этим углом зрения рассмотреть основные методы психологии, то обнаружится, что метод тестов выглядит, тем более на общем фоне, достаточно убедительно. Информация, получаемая при помощи грамотно построенного теста, обладает признаками воспроизводимости (в данном случае это качество проверяется по специальному критерию надежности), выводимости (и первичные, и тем более производные тестовые оценки представляют собой продукты целой серии индуктивных и дедуктивных выводов, обеспечивающих получение неочевидных следствий из принимаемых допущений), проверяемостью (для проверки содержательной валидности и прогностической ценности каждой конкретной методики в тестологии разработаны, как известно, специальные процедуры), способностью к предсказаниям и обобщениям (как было показано выше, оба эти признака являются для тестовых методик стержневыми), возможностью математического выражения получаемых результатов (этот признак является для метода тестов необходимо специфическим), практической полезностью (напомним в этой связи, что для метода тестов главной является психодиагностическая функция, имеющая ярко выраженную практическую направленность), критичностью (выше неоднократно упоминалось о способности метода тестов к развитию и совершенствованию, в частности к созданию все новых и новых модификаций конкретных методик). Таким образом, в свете основных признаков научности метод тестов предстает как один из наиболее развитых и совершенных инструментов в методическом арсенале психологии.

2. Разумеется, какие бы перспективы ни открывались на пути усовершенствования метода тестов в будущем, его возможности на современном этапе, как и потенции любого другого метода, исторически ограниченны и, следовательно, носят относительный характер. Поэтому представляются не совсем правомерными выступления тех авторов, которые подходят к оценке данного метода с позиций неких абсолютных требований, предусматривающих способность решения едва ли не любой задачи психодиагностического или прогностического характера. Разумеется, такая неправомерно высокая требовательность сама сложилась исторически. Дело в том, что все другие психодиагностические методы возникли, по сути, в обыденной жизни и в психодиагностику были перенесены без каких-либо принципиальных усовершенствований, ввиду чего к их надежности и валидности предъявлялись и предъявляются минимальные требования. Метод же тестов с самого начала создавался учеными, причем с широко декларируемой целью получения высоковалидных и надежных оценок. Однако все это не должно побуждать к неправомерным требованиям. Вместо бесплодных сетований по поводу того, что метод тестов не в состоянии решить ту или иную диагностическую задачу (например, измерять умственные задатки индивида)5, следовало бы, по нашему мнению, с одной стороны, сосредоточить внимание на максимально полном его использовании в тех сферах, где он уже сегодня приносит несомненную пользу, а с другой стороны, интенсифицировать методологические и методические исследования, направленные на его совершенствование.

3. Как показывает исторический анализ, все сколько-нибудь заметные успехи тестологии всегда являлись органической составной частью общих достижений психологической науки в соответствующей области, этими достижениями питались и, в свою очередь,

 

41

 

стимулировали их дальнейший прогресс. Эта взаимосвязь сохранится, судя по всему, и в обозримом будущем. Конечно, у современной тестологии есть и собственные, специфические проблемы. Но не они формируют ее судьбу. Определяющими здесь являются проблемы гораздо более широкиеимеющие общедиагностическое или, более того, «общеметрическое» значение. Условно их можно разделить на две группы: качественные и количественные.

К первым мы относим вопросы, связанные с идентификацией психических свойств как предмета психологического исследования вообще и тестирования в частности. Как, исходя из обобщенной природы таких свойств, можно разграничить сферы их поведенческих проявлений, учитывая при этом такие факторы, как дифференциация и интеграция в онтогенезе, а также функциональная иерархия и взаимодействие? И главное: как конкретно должно решаться диалектическое противоречие между понятием о психических свойствах как относительно самостоятельных характеристиках личности и концепцией, утверждающей ее целостность?

Что же касается «количественных» проблем, то они с необходимостью должны рассматриваться в контексте более общего, кардинального для всей психологии вопроса, который в различных аспектах и все более остро ставит в своих работах А.В. Брушлинский [7]: в каких отношениях и в какой степени принципы и приемы, разработанные для измерения материальных объектов (а именно таковыми являются методы современной математической статистики), приложимы к описанию психических явлений? Применительно к рассматриваемой нами проблеме он формулируется следующим образом: можно ли непрерывные величины, какими являются психические свойства человека, уровни их развития у отдельных индивидов, измерять при помощи таких дискретных единиц, как выполненное задание, допущенная ошибка и т.п.?

Отношения между тестологией и психологической наукой в целом отнюдь не всегда складывались гармонично. В начале века, в период тестологического бума, наметилась тенденция к своеобразной автаркии, к превращению тестологии в замкнутую математико-статистическую дисциплину, почти полностью изолированную от психологической науки в ее широком содержании. Позже, в связи с острым кризисом, охватившим буржуазную тестологию, вульгаризаторскими извращениями в практическом использовании тестовых методик, предпринимались попытки подвергнуть метод тестов некоему остракизму. Рецидивы каждой из этих экстремистских тенденций можно наблюдать и в наше время. Но они лишь оттеняют то, что становится все более очевидным: теперь, когда метод тестов и психология наконец воссоединились, открылись новые, многообещающие горизонты для развития и метода тестов, и той науки, которой он призван служить.

 

1. О реформе общеобразовательной и профессиональной школы: Сборник документов и материалов. М., 1984.— 112 с.

2. Аванесов В. С. Тесты в социологическом исследовании. М., 1982.— 200 с.

3. Анастази А. Психологическое тестирование: В 2 кн. Кн. I / Пер. с англ.; Под ред. К. М. Гуревича, В. И. Лубовского, 1982.— 320 с.

4. Бажин Е. Ф., Голынкина Е. А., Эткинд А. М. Метод исследования уровня субъективного контроля // Психол. журн. 1984. Т. 5. № 3. С. 152—162.

5. Бернштейн М. С. Методологические предпосылки метода тестов // Тесты (Теория и практика). Сб. 3. М., 1930. С. 3—36.

6. Блейхер В. М. Клиническая патопсихология. Ташкент, 1976.— 326 с.

7. Брушлинский А. В. Деятельность, действие и психическое как процесс // Вопр. психол. 1984. № 5. С. 17—29.

8. Бурлачук Л. Ф. Исследование личности в клинической психологии (на основе метода Роршаха). Киев, 1979.— 176 с.

9. Геллерштейн С. Г. Психотехника. М., 1926.— 240 с.

10. Гильбух Ю. З. Интеллектуальное тестирование на Западе: итоги и перспективы // Сов. Педагогика. 1980. № 2. С. 126—136.

11. Гильбух Ю. З., Рычик М. В. Реализация в учебном процессе функций обучения, развития и диагностики // Сов. Педагогика. 1976. № 7. С. 88—95.

12. Иванова А. Я. «Обучающий эксперимент» как принцип оценки умственного развития детей: Автореф. канд. дис.М., 1969.— 16 с.

13. Корнилов К. Н. Сравнительная значимость

 

42

 

методов научного исследования в области психологии и педологии с точки зрения марксизма // Психология. 1928. № 1.С 5—28.

14. Костюк В. И. Методология научного исследования. Киев; Одесса, 1976.— 179 с.

15. Лийметс X. И., Сыэрд Ю. Л., Тойм К. Ю. О развитии психодиагностики в Эстонской ССР // О диагностике психического развития личности. Таллин, 1974. С. 54—64.

16. Общая психология / Под ред. В.В. Богословского, А.Г. Ковалева, А.А. Степанова. М., 1981. — 384 с.

17. Орлов Ю. М., Творогова Н. Д. Ревалидизация теста тематической апперцепции.

18. Проблемы диагностики умственного развития учащихся / Под ред. З.И. Калмыковой. М., 1975.— 208 с.

19. Рубинштейн С. Л. Основы общей психологии. М., 1935.— 496 с.

20. Слободчиков В. И. Вопросы теории и диагностики психического развития // Вопр. психол. 1982. № 1. С. 19—28.

21. Соколова Е. Т. Проективные методы исследования личности. М., 1980.— 176 с.

22. Сарджвеладзе Н. И. Метод монологического интервью // Вопр. психол. 1984. № 2. С. 127—129.

23. Тесты: (Теория и практика). Сб. 2. М., 1928; сб. 3.— М., 1930.

24. Ханин Ю. Л. Адаптация шкалы соревновательной личностной тревожности // Вопр. психол. 1982. № 3. С. 136—141.

25. Штерн В. Одаренность детей и подростков и методы ее исследования. Харьков, 1926.— 403 с.

26. Ядов В. А. Социологическое исследование: (Методология. Программа. Методы). М., 1972.— 174 с.

27. Ямпольский Л. Т. Измерение продуктивности интеллектуальной деятельности // Вопр. психол. 1984. № 5. С. 142—147.

28. Cronbach L. Essentials of psychological testing.  N. Y., 1970.— 745 p.

29. English Н. В., Englich А. С. A comprehensive dictionary of psychological and psycho-analytical terms. N. Y., 1958.— 594 p.

 

Поступила в редакцию 8.II 1985 г.



1 Правда, не все указанные авторы называют тесты этим именем, но из-за этого сущность последних, разумеется, не меняется.

2 Весьма сложный и противоречивый вопрос о критическом и творческом использовании опыта буржуазной тестологии, разумеется, нуждается в отдельном рассмотрении.

3 Следовательно, непосредственная оценка выступает в этом случае как оценка первичная, «сырая».

4 Отметим попутно, что этот же упрек должен быть адресован и групповому эксперименту, в особенности если он направлен на исследование учебного процесса.

5 Кстати, нелишне было бы представить себе, как выглядели бы другие главные методы психологии, в частности эксперимент и наблюдение, если бы к их оценке подходили с тех же позиций.