|
||
новости библиотека общение обучение тесты кто есть кто проекты |
Психологический Журнал, 2000, том 21, № 2, с. 70-75 СОХРАНЕНИЕ НАДЕЖНОСТИ МНОГОФАКТОРНЫХ ТЕСТОВ ПРИ ИХ ИСПОЛЬЗОВАНИИ В СЕТИ ИНТЕРНЕТ©2000г. В. Г. Ромек*, Д. К. Сатин** Выявлено сохранение показателей надежности многошкальных тестов, разработанных с применением факторного анализа при их использовании в сети Интернет. Рефакторизация данных, полученных по тестам уверенности в себе и Айзенка (EPI) на больших выборках (661 и 1637 человек), доказала, что надежность тестов при их использовании в сети Интернет не уменьшается при сохранении факторной структуры тестов. В то же время, усредненные значения по шкалам при тестировании в сети отличаются от данных, полученных на "бланковых" выборках. Авторы делают вывод о возможности использования тестов в сети, но оговаривают необходимость дальнейшего анализа специфики выборок пользователей сети Интернет. Ключевые слова: факторная структура теста, психометрические характеристики теста, надежность, компьютерное тестирование. ЦЕЛИ, ЗАДАЧИ, ГИПОТЕЗЫГлобальная компьютерная сеть Интернет все в большей степени осваивается специалистами-психодиагностами в качестве новой среды для организации и проведения исследований [4-6]. Компьютерная сеть предоставляет несколько возможностей, которые отсутствуют при бланковом тестировании, а именно:
Особенности профессионального тестирования в глобальной сети ставят перед диагностами ряд проблем этического, практического и научного плана. Тестирование в сети происходит в отсутствие психолога, который мог бы проконтролировать ход диагностической процедуры, и от которого испытуемый получает интерпретацию результатов. Это ставит перед диагностом дополнительные задачи контроля переменных, связанных с ситуацией тестирования, а также задачу составления таких интерпретаций, которые бы не оставляли испытуемому возможностей для неверного истолкования. Процесс заполнения формы на экране компьютера, или прохождение последовательности диалогов, существенно отличается от традиционной работы с карандашом и бумагой. Испытуемый может отвлекаться, одновременно выполнять какую-либо другую работу в открытой программе, он может, наконец, просто случайным образом заполнить тест, чтобы посмотреть, что в итоге получится. В связи с этим возникает ряд важных для психодиагностики задач:
Настоящее исследование направлено на решение второй из перечисленных выше задач. В ходе исследования обсуждаются основные подходы к решению первой задачи. ХАРАКТЕРИСТИКИ ВЫБОРОКТест уверенности в себе Выборка 1 (бланковое тестирование) составила 535 человек (60.6% женщин, 39.4% мужчин). Она включала испытуемых с разным образовательным уровнем (в ней не было студентов-психологов). Тестирование проводилось частично в групповой форме, основная масса бланков была заполнена испытуемыми в ходе консультационной работы. Все испытуемые получали интерпретацию результатов тестирования. Выборка 2 (тестирование в сети Интернет) составила 661 человек (53.6% женщин, 46.4% мужчин). Контролировать иные демографические показатели выборки не представлялось возможным. Тестирование проходило на сайте "Психология уверенности в себе" путем заполнения формы, по внешнему виду приближенной к бумажному бланку. Интерпретация либо рассылалась по электронной почте, либо выводилась на экран компьютера. Тест Айзенка Выборка 3 (бланковое тестирование) составила 153 человека (студенты МГУ обоего пола непсихологических специальностей). Выборка 4 (тестирование в сети Интернет) составила 1637 человек (46% женщин, 54% мужчин). Тестирование проходило на сайте "Книжная полка научно-психологической литературы" путем прохождения испытуемым последовательных диалогов, в каждом из которых нужно выбрать один из двух вариантов ответа. После осуществления выбора программа автоматически предъявляла испытуемому новый пункт опросника. После ответа на последний пункт опросника программа автоматически выводила испытуемому интерпретацию его результатов. Для всех выборок, полученных при тестировании в сети Интернет, собирались также данные о возрасте испытуемых. Разброс значений составил от 12 до 54 лет, при значении медианы - 25 лет. МЕТОДИКАМы сопоставили надежность двух тестов - уверенности в себе и личностного опросника Айзенка при их использовании в бланковой форме и при выполнении теста анонимными пользователями в сети Инернет. Это сопоставление должно было дать ответ на вопрос, требуется ли дополнительная адаптация тестов при их использовании в сети, т.е. происходит ли изменение надежности и других психометрических характеристик при тестировании в сети Интернет, и существует ли разница между нормами при выполнении бланковых тестов и их версий в сети Интернет? Тест Айзенка (Eysenck Personality Inventory, EPI) особого представления специалистам не требует. Он содержит три шкалы: Экстраверсии, Нейротизма, Лжи [I]. Для сравнения использовалась его русская адаптация (форма А), выполненная А.Г. Шмелевым [7], и данные о нормах и составе шкал [2]. Тест уверенности в себе представляет собой опросник из 30 пунктов, разработанный с использованием факторного анализа и дающий оценки по шкалам общей уверенности в себе, социальной смелости и инициативы в контактах [3]. Для проверки зависимости психометрических характеристик названных тестов от ситуации тестирования (бланковое или тестирование в сети Интернет) мы сравнили на двух выборках по каждому тесту факторные структуры, показатели надежности отдельных шкал (а-Кронбаха) и нормы, полученные при бланковом тестировании и тестировании в сети Интернет. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕПолученные данные обрабатывались по одной и той же схеме с использованием статистического пакета SPSS-7.5. На первом этапе мы сравнили факторные веса отдельных пунктов теста уверенности в себе по трем его шкалам на двух описанных ранее выборках. Результаты сравнения мы приводим в табл. 1. Как можно увидеть из этой таблицы, в целом в факторной структуре теста не произошло существенных изменений, за исключением вопроса № 191, что гипотетически можно объяснить преимущественно ночным образом жизни тех, кто тесно связан с работой в Интернете (ночью - дешевле и связь лучше). Именно во второй выборке (Интернет) мы получили значимо меньше ответов "неверно" на этот вопрос2. Таблица 1. Факторные веса вопросов теста уверенности при тестировании в бланковой форме и в сети Интернет
Примечание. Факторный анализ проводился с экстракцией факторов методом главных компонент и последующей Varimax-ротацией. В таблице приводятся факторные веса после ротации. Первая цифра соответствует факторному весу, полученному на "бланковой" выборке, вторая - при тестировании в сети Интернет. В таблице приводятся факторные веса, большие, чем 0.25. Соответственно, можно было ожидать сохранения хорошего уровня надежности при тестировании в сети. Мы проверили это предположение, рассчитав индексы надежности на двух выборках. Как видно из табл. 2, надежность всех трех шкал теста уверенности при тестировании в сети либо уменьшилась крайне незначительно, либо даже, увеличилась (шкала уверенности). Были также проверены различия в средних значениях по трем шкалам на двух выборках. По всем трем шкалам обнаружены значимые различия средних между двумя выборками (а < 0.01). Дисперсия значимо различалась лишь по шкале общей уверенности (а = 0.03). Означает ли это, что нормы при тестировании в сети должны быть пересмотрены? Таблица 2. Сравнение индексов надежности теста уверенности при тестировании в бланковой форме и в сети Интернет
Примечание. Первая цифра соответствует коэффициенту, полученному на "бланковой" выборке, вторая - при тестировании в сети Интернет. Полученные различия могут быть объяснены разным характером мотивации тестирования у испытуемых при проведении бланкового варианта и при проведении в сети Интернет. В случае бланкового тестирования мотивация участия в тестировании варьирует от ориентации на получение интерпретации до желания помочь исследователю в осуществлении стандартизации теста. При проведении тестирования в сети Интернет мотивация тестирования ограничена мотивацией самопознания, так как исследователь не имеет никакого влияния на поведение испытуемого. Приходится также признать, что сам выбор методики испытуемым может быть не случаен. Вполне может оказаться, что люди, испытывающие недостаточность, например, уверенности в себе, чаще проходят тест уверенности в себе, чем самоуверенные. Подобному искажению состава подвержены те тесты, в названии которых указана измеряемая ими психологическая черта. Таблица 3. Факторные веса вопросов теста Айзенка при тестировании сети Интернет
Примечание. Результаты факторного анализа после Varimax-ротации. Факторные веса отсортированы в нисходящем порядке. Показаны факторные веса, большие чем 0.1. В первом столбце после номера вопроса следует номер шкалы, в которую вошел данный вопрос в результате адаптации 1984 г. В скобках отмечена полярность вопроса. Соответствующие расчеты для теста Айзенка при его использовании в сети Интернет дали схожие результаты. В факторном анализе мы установили практически полное соответствие факторной структуры теста ключам к тесту, которые разработаны А.Г. Шмелевым в процессе его адаптации. Как это можно увидеть из табл. 3, несмотря на то, что русская адаптация проводилась в бланковом варианте в 1984-85 гг., при тестировании в Интернете с последовательным предъявлением вопросов испытуемым группировка отдельных вопросов теста практически не изменилась. Лишь единичные вопросы имели большие факторные веса в "неправильном" факторе, что, однако, не сказалось на надежности шкал теста в целом. Расчеты надежности по отдельным шкалам теста также дали достаточно хорошие результаты (табл.4). Таблица 4. Оценка надежности шкал теста Айзенка при тестировании в сети Интернет
Таблица 5. Показатели ретестовой надежности, полученные при тестировании в сети Интернет
Примечание. Уровень значимости для всех полученных значений произведения моментов Пирсона составил р < 0.01. Повторное тестирование, проходившее через две недели после проведения первого, по тесту Айзенка прошли 64 испытуемых, а по тесту уверенности в себе - 74. Следует отметить, что, конечно, самым большим достоинством проведения тестирования в сети Интернет является возможность получения больших выборок, без которых проблематично разработать достаточно точную психодиагностическую методику. На малых выборках (от 100 до 200 человек), которые обычно набираются при бланковой стандартизации, невозможно выявить важные характеристики, необходимые для оценки точности и эффективности методики. Примером такого уточнения данных, полученных при бланковой стандартизации больших выборок в сети Интернет, является установление фактов чувствительности шкалы нейротизма теста Айзека к полу испытуемых и неоднородности шкалы экстраверсии-интроверсии [6]. Учитывая бурное развитие сети Интернет в России, работа по проведению психодиагностических исследований в сети представляется очень важной и перспективной. Она может стать важным стимулом дальнейшего развития отечественной психодиагностики. ВЫВОДЫТаким образом, на примере теста уверенности в себе и теста Айзенка обнаружено сохранение основных психометрических характеристик многошкальных тестов, построенных с применением факторного анализа при их использовании в сети Интернет. Следовательно, правомерно сделать вывод о том, что надежность психологических тестов этого типа не снижается. Вопрос о необходимости дополнительного нормирования остается открытым, но глобальная компьютерная сеть предоставляет огромные возможности для научного исследования этой проблемы. При тестировании в сети психолог может получить уникальный материал, так как есть возможность составления больших выборок, равномерно распределенных на определенной территории. Размещение тестов на разных сайтах и в разных вариантах позволит изучить зависимость норм и надежности тестов от содержания сайтов, на которых они размещены, от вариантов программирования и предъявления испытуемым заданий теста. По окончании данного исследования была осуществлена разработка универсальной системы проведения психодиагностических исследований в сети Интернет (http://testology.psychology.ru). Система предоставляет зарегистрированным пользователям возможность прохождения в стандартизованных условиях ряда исследовательских методик и получения интерпретации результатов. Уже сейчас система позволила собрать данные о ретестовой надежности тестов, которым посвящена данная работа (табл. 5). СПИСОК ЛИТЕРАТУРЫ
RELIABILITY INDICES OF MULTISCALE TESTS WHEN APPLIED IN THE INTERNETV. G. Romek*, D. K. Satin** The paper displays invariability of reliability indices of multiscale tests elaborated by means of factor analysis when applied in Internet. Refactorization of Assertiveness and Eysenck (EPI) tests data obtained on great samples (661 and 1637 respondents accordingly) proved that reliability of these tests when applied in Internet does not decrease; their factor structure retains. At the same time mean scores of scales testing obtained in Internet differ from the data of "blank" samples. The authors state the possibility of applying psychological tests in Internet while focussing on the necessity of further exploration of the peculiarities of Internet samples. Key words: factor structure of tests, psychometric characteristics, internal consistency, computer based testing, Internet based testing.
1. "Если мне срочно нужен мой друг, то я звоню ему даже поздно ночью". |
новости библиотека общение обучение тесты кто есть кто проекты |
psychology.ru © 2000 |