Психометрика как фундамент общей психодиагностики

Обновлено: 02.05.2024

Обращаем Ваше внимание, что в соответствии с Федеральным законом N 273-ФЗ «Об образовании в Российской Федерации» в организациях, осуществляющих образовательную деятельность, организовывается обучение и воспитание обучающихся с ОВЗ как совместно с другими обучающимися, так и в отдельных классах или группах.

Рабочие листы и материалы для учителей и воспитателей

Более 2 500 дидактических материалов для школьного и домашнего обучения

Онлайн
формат
Диплом
гособразца
Помощь в трудоустройстве

Видеолекции для
профессионалов

Свидетельства для портфолио
Вечный доступ за 120 рублей
311 видеолекции для каждого

3. Психометрические основы психолого-педагогической диагностики

Цель — ознакомление с основными психометрическими требованиями к измерительным диагностическим методикам.

— рассмотреть основные типы измерительных шкал;

— определить необходимость стандартизации и ознакомить с видами норм принятыми в диагностике;

— рассмотреть и описать процедуру разработки и применения основных психометрических требований.

3.1. Типы шкал измерения

Психометрия — базовая дисциплина, являющаяся фундаментом общей психодиагностики, связанная с теорией и практикой измерения психических явлений. Понятие «психометрии» было введено в 1734 г. Христианом Вольфом, который впервые указал на возможность измерения в психологии.

Знание психометрии дает диагносту необходимый материал для понимания ограниченности методик, тех допущений, которые были сделаны авторами для целей исследования.

Психометрия — наука, обосновывающая и разрабатывающая измерительные диагностические методы. Она научно обосновывает те требования, которым должны удовлетворять измерительные психодиагностические методы, и описывает определенные процедуры их разработки и применения.

Психометрические требования касаются качества того инструмента (теста), посредством которого собираются данные. Психологический тест может быть охарактеризован как эффективный при условии, что он удовлетворяет следующим требованиям: использование шкалы интервалов; наличие нормативных данных (либо критериев, установленных экспертами); надежность; валидность; достоверность; репрезентативность; дискриминативность.

Шкала — это форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему.

Значения признака или переменной определяются (измеряются) при помощи специальных шкал измерения:

1) номинативная (наименований);

4) равных отношений.

Рассмотрим особенности каждой из вышеперечисленных шкал.

Номинативная (наименований) шкала. Это шкала, классифицирующая по названию. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого. Это простейшая классификация испытуемых, например: мужчина-женщина; имеет братьев и сестер — единственный ребенок в семье и т.п.

Данная шкала позволяет подсчитывать частоты встречаемости разных «наименований», или значений признака, и затем работать с этими частотами с помощью математических методов.

Порядковая (ранговая) шкала. Это шкала классифицирует по принципу «больше — меньше». Субъекты ранжированы, например, по весу или росту. В порядковой шкале должно быть не менее трех классов, например «положительная реакция — нейтральная реакция — отрицательная реакция» или «подходит для занятия вакантной должности — подходит с оговорками — не подходит».

В данной шкале не известно истинное расстояния между классами, а известно лишь то, что они образуют последовательность.

От классов переходят к числам (низший класс получает ранг 1, средний класс 2, а высший — ранг 3, или наоборот).

Шкала равных отношений. Это шкала, классифицирующая объекты или субъекты пропорционально степени выраженности измеряемого свойства. В отличие от интервальной шкалы она имеет значимую нулевую точку, которая не произвольна, а указывает на полное отсутствие измеряемого свойства.

Наличие нулевой точки — проблема для большинства психологических переменных, так как возможности человеческой психики столь велики, что трудно представить абсолютный нуль в какой-либо измеряемой психологической переменной.

3.2. Понятие норм и стандарта в диагностике

Стандартизация — это единообразие процедуры проведения и оценки выполнения теста, которую рассматривают в двух планах:

1. Стандартизация процедуры, что подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов и условий проведения обследования.

2. Выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний. Такой точкой отсчета являются нормы.

Нормы — это множество показателей из четко определенных выборок. Психологические тесты не имеют заранее определенных стандартов их успешного или неуспешного выполнения; критерии выполнения каждого теста устанавливаются опытным путем. В большинстве случаев тестовый показатель индивидуума выявляется на основе сравнения с оценками, полученными по данному тесту другими людьми. Для обоснования вывода о норме необходимо: 1) сравнить результаты с выборкой стандартизации, т.е. выборкой испытуемых численностью не меньше 200 человек и совпадающих по полу, возрасту, образованию, социальному положению и т.п.; 2) полученный результат перевести в некую относительную меру. Всякая норма обычно со временем изменяется вместе с естественными изменениями, которые с годами происходят в психологии людей, поэтому есть правило, согласно которому нормы теста, особенно интеллектуального, должны пересматриваться, как минимум один раз в пять лет.

Принято различать два вида норм: статистические и социокультурные (социально-психологический норматив).

Первый вид применяется для оценки стилевых и мотивационных черт, второй — для оценки способностей и достижений.

Статистическая норма — это уровень развития человека, который соответствует среднестатистическим (количественным) показателям, полученным при обследовании представительной группы людей того же возрастного диапазона, пола, культуры и т.п.; это близость значения свойства к тому уровню, который характеризует статистически среднего индивида.

Для вычисления статистической нормы обратились к приемам математической статистики — определение распределения .

Распределением называется закономерность встречаемости разных значений измеряемого признака. Форма распределения является обобщенной характеристикой выборки. Кривые распределения бывают одновершинные и многовершинные.

В психологии рассматривают нормальное распределение, или распределение по нормальному закону, кривая распределения Гаусса, предложенная им в 1908 г.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко (16%), а значения, близкие к средней величине, достаточно часто (68%).

Для описания нормального распределения достаточно знать два показателя — среднее арифметическое признака (Хср) и стандартное отклонение (σ). Границы статистической нормы определяются по формуле Хср ± σ.

В диагностике существует и другой подход к оценке результатов диагностических испытаний. В нашей стране под руководством К.М. Гуревича были разработаны тесты, в которых в качестве точки отсчета выступает не статистическая норма, а независимый от результатов испытания, объективно заданный социально-психологический норматив.

Социокультурный или социально-психологический норматив (СПН) — это уровень свойства, который явно или неявно считается в обществе необходимым; это система требований, которые общество предъявляет к психическому и личностному развитию каждого из его членов.

Требования закреплены в виде правил, норм, предписаний, они присутствуют в образовательных программах, в профессиональных и квалификационных характеристиках, общественном мнении.

СПН меняется вместе с развитием общества.

Социально-психологический норматив реализуется в совокупности заданий, составляющих тест.

Сам тест в полном его объеме и является таким нормативом (100%). В качестве критерия оценки выступает показатель, отражающий степень близости результатов к нормативу. 39

Для анализа данных относительно их близости к социально-психологическому нормативу, условно рассматриваемому как 100%-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на пять подгрупп (%):

1) наиболее успешные — 90-100% (10%);

2) близкие к успешным — 70-90% (20%);

3) средние по успешности — 30-70% (40%);

4) малоуспешные — 10-30% (20%);

5) наименее успешные — 0-10% (10%).

3.3. Н адежность как важное психометрическое требование к диагностической методике

Надежность — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.

1) состояние и настроение обследуемых;

2) мотивация испытуемых к тестированию;

3) эргономические факторы: время дня, освещенность, температура в помещении, наличие шумов и запахов и т.п.;

4) характеристика деятельности (монотонность — динамичность и др.);

5) степень обучаемости (или натренированности) испытуемых.

К.М. Гуревич предложил толковать надежность как:

1) надежность самого измерительного инструмента;

2) стабильность изучаемого признака;

3) относительная независимость результатов от личности экспериментатора.

Показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности ; показатель, характеризующий стабильность измеряемого свойства, — коэффициентом стабильности ; а показатель оценки влияния личности экспериментатора — коэффициентом константности .

Остановимся более подробно на рассмотрении этих показателей, характеризующих с разных сторон надежность психодиагностической методики.

1. Определение надежности измерительного инструмента. Для проверки надежности измерительного инструмента, говорящего о его однородности (или гомогенности), используют метод расщепления.

Задания делятся на четные и нечетные, отдельно обрабатываются, а затем результаты двух полученных рядов коррелируются, сравниваются между собой.

Методика признается надежной, когда полученный коэффициент не ниже 0,75—0,85. Лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.

2. Определение стабильности изучаемого признака. Для проверки стабильности диагностируемого признака, свойства используется прием тест—ретест. Он заключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и повторного обследования (не ниже, чем 0,7).

При определении стабильности признака большое значение имеет промежуток времени между первым и повторным обследованием.

Используется временной интервал в несколько месяцев, но не более полугода. У детей интервалы могут быть порядка нескольких недель.

3. Определение константности. Коэффициент константности определяется путем корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами. Коэффициент корреляции не должен быть ниже 0,80.

К.М. Гуревич считает, что каждый в отдельности показатель никак не заменит других способов проверки и, следовательно, не может рассматриваться в качестве необходимой и достаточной характеристики надежности.

Методика, располагающая полной характеристикой надежности, наиболее пригодна для практического применения.

3.4. Валидность диагностической методики

Вопрос о валидности методик решается лишь после того, как установлена достаточная ее надежность, поскольку ненадежная методика не может быть валидной. Но самая надежная методика без знания ее валидности является практически бесполезной.

Валидность — обоснованность методики.

А. Анастази: « Валидность теста — понятие, указывающее нам на то, что тест измеряет и насколько хорошо он это делает», т.е. она предусматривает прямую проверку того, насколько хорошо тест выполняет свою функцию.

Характеристика валидности методики включает в себя не только сведения о том, что данная методика на самом деле измеряет, но и информирует об условиях, о сфере ее применения. Существует несколько разновидностей валидности, каждую из которых нужно рассматривать и оценивать отдельно, когда стоит вопрос о выяснении валидности психодиагностической методики. Валидность может быть внутренней (конструктной) и внешней (критериальной). Внутренняя валидность определяет, насколько полно тестовые баллы отражают исследуемые психические свойства или умения и знания, обозначает соответствие содержащихся в методике заданий, суждений и тому подобное общей цели и замыслу методики в целом. Тестовая методика считается внутренне невалидной или недостаточно внутренне валидной тогда, когда все или часть включенных в нее вопросов и заданий измеряют не то, что требуется от данной методики. Внешняя валидность определяет полезность тестового измерения в качестве предсказателя поведения, насколько тестовые баллы связаны с некоторой другой деятельностью. Речь идет о связи между показателями методики и наиболее важными, ключевыми внешними признаками, относящимися к поведению испытуемого.

Проверка валидности методики называется валидизацией. Принято выделять:

1) теоретическую валидизацию — проверка валидности измерительного инструмента;

2) прагматическую валидизацию — валидность цели ее использования.

Основным элементом проверки валидности тестов является критерий валидности . Это независимый от теста, внешний по отношению к тесту источник информации об измеряемом психическом свойстве.

В качестве критерия могут выступать:

— успеваемость — для тестов способностей к обучению, тестов достижений, тестов интеллекта;

— производственные достижения — для методик профессиональной направленности;

— эффективность реальной деятельности (рисования, моделирования и т.д.) — для тестов специальных способностей;

— субъективные оценки — для тестов личности.

Виды валидности, обусловленные особенностями диагностических методик и временным статусом внешнего критерия:

1. Валидность «по содержанию» (логическая валидность) применяется для тестов достижений. Она отвечает на вопрос: «Можно ли быть уверенным в том, что правильные ответы на немногие вопросы свидетельствуют об усвоении всего материала?». Для этого проводится сопоставление успешности по тесту с экспертными оценками учителей, преподавателей по данному курсу, предмету, разделу.

2. Валидность «по одновременности» (текущая валидность). Определяется с помощью внешнего критерия, по которому информация собирается одновременно с экспериментами по проверяемой методике.

3. «Предсказывающая» валидность («прогностическая» валидность). Определяется также по надежному внешнему критерию, но информация по нему собирается некоторое время спустя после испытания.

4. «Ретроспективная» валидность. Определяется на основе критерия отражающего события или состояние качества в прошлом.

3.5. Достоверность, репрезентативность и дискриминативность — психометрические требования к диагностическим методикам

Достоверность — это способность теста защищать информацию от мотивационных искажений. Проблема достоверности остро стоит в случае тест-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.

Типичный прием обеспечения достоверности — наличие шкалы лжи или контрольной шкалы. Они основываются на феномене социальной желательности — стремлении испытуемых давать в ходе тестирования социально одобряемую информацию. Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз более откровенно, либо выполнить другой тест.

Репрезетативность — это соответствие тестовых норм выборки стандартизации тестовым нормам той популяции, на которой применяется тест. Она определяется путем сопоставления качественных и количественных характеристик исследуемой популяции с целью определения их однородности.

Дискриминативность — это способность отдельных заданий и теста в целом дифференцировать обследуемых относительно максимального и минимального результатов. Точность информации измеряется тем, насколько дробной шкалой являются применяемые метрики. В оценке может быть использовано около девяти градаций, а в опросах — наиболее эффективно использовать три (или пять) градаций.

Психология соответствующей предметной области составляет одну из составных частей психодиагностики. Другая базовая дисциплина, являющаяся фундаментом общей психодиагностики и тем самым составляющей ее частью, — это дифференциальная психометрика — наука, обосновывающая и разрабатывающая измерительные диагностические методы; этому разделу общей психодиагностики посвящены специальный параграф в данной главе и особая глава в руководстве.

Психометрика – область психологии, связанная с теорией и практикой измерения психических явлений. Понятие психометрики было введено в 1734г Христианом Вольфом, он впервые указал на возможность измерения в психологии.

Одним из первых параметров в психологии были измерения времени реакции. В силу этого первоначально психометрика понималась как измерение временных характеристик психических процессов. По мере развития психологического экспериемнта к психометрике начинают относить всё, что связано с количественным определением психических явлений. При таком пониманиипсихометрика включает весь спектр психологических измерений – от психофизических до личностных.

По мере усложнени психологических параметров, подлежащих измерению и совершенствованию специальных математико-статистических процедур, разрабатываемых в рамках тестологии, содержание психометрики начинает отождествляться с тестологией. Именно развитие тестологии в начале 1930г способствовало формировании особой области психометрики, которая имеет дело с индивидуальными психологическими различиями – дифференциальной психометрики. Она включает проблемы определения и обоснования требований к оценке индивидуально-психологических различий в психологической диагностике. Основные направления дифференциальной психодиагностики:

1. общая теория измерения психологических феноменов;

2. концептуализация и алгоритмизация процедур конструирования средств измерения;

3. психометрическая адаптация этих средств к новым условиям использования;

4. анализ задач тестирования;

5. обеспечение их валидности, надежности и стандартизации.

Стандартизация теста.

Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки. Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

С. т. - это установление унифицированных процедур для а) его проведения и б) подсчета получаемых с его помощью показателей. Первые стандартизированные тесты появились в начале XX столетия, когда Э. Л. Торндайк, занимающийся эксперим. психологией, наряду с др. учеными, распространили принципы, полученные в лабораториях, на психол. измерения. "Стандарты для образовательных и психологических тестов" (Standards for educational and psychological tests, American Educational Research Association, 1985) лают общие рекомендации относительно процедуры, к-рым должны следовать издатели и пользователи тестов, для того, чтобы гарантировать применение стандартизированных процедур. Контроль за процедурой проведения тестов в значительной степени достигается за счет инструкций, приведенных в руководствах по тестам. Что касается процедуры оценки, то в "Стандартах" указано, что желательно, чтобы детальные инструкции как для субъективных, так и объективных тестов были помещены в руководстве по тесту, и, в случае субъективно градуированных тестов, следует указать результаты исслед. степени согласия лиц, проводящих оценку. С. т. тж должна давать детальную информ. по поводу того, кто имеет квалификацию, достаточную для применения и оценки результатов теста. Заключительным моментом С. т. яв-ся разработка норм теста. Эти величины, в сочетании с данными о надежности и валидности, позволяют психологам надлежащим образом интерпретировать результаты, полученные в результате тестирования. Тесты можно приравнять к др. аналогичным тестам, так, чтобы сравнивать их результаты друг с другом. Очевидны три потенциальных преимущества стандартизированных психол. тестов. Во-первых, стандартизированные тесты часто имеют более высокое качество, чем составленные для проведения в конкретных местах. Во-вторых, проведение стандартизированных обследований может освободить психологов и др. специалистов от траты времени на конструирование тестов, личное проведение тестирования и других оценочных мероприятий, и дает им возможность заняться более важными вещами - терапией, обучением, и интерпретацией результатов, например. Наконец, использование стандартизированных измерений облегчает общение психологов друг с другом. Следует отметить и один важный недостаток стандартизированных процедур: из-за своей доступности, стандартизированные тесты иногда используют в неподходящих ситуациях. См. также Измерение К. Ф. Гейзингер

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни.

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого.

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰).

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим.

© cyberpedia.su 2017-2020 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

тов теста при повторных исследованиях на одних и тех же испытуемых.

Таким образом, можно сказать, что надежность методики позволяет судить

о том, насколько внушают доверие полученные результаты.

Результаты психологического исследования обычно подвержены

влиянию большого количества неучитываемых факторов (эмоциональное

состояние и утомление, если они не входят в круг исследуемых характери-

стик; физические факторы: освещенность, температура и другие особенно-

сти помещения, где проводится исследование; уровень мотивированности

испытуемых на обследование; влияние личности экспериментатора). Лю-

бое изменение ситуации исследования усиливает влияние одних и ослаб-

ляет воздействие других факторов на результат теста.

Общий разброс (дисперсия) результатов тестового обследования

можно, таким образом, представить как результат влияния двух групп

причин: изменчивости, присущей самому измеряемому свойству, и факто-

ров нестабильности измерительной процедуры.

В самом широком смысле надежность теста – это характеристика то-

го, в какой степени выявленные у испытуемых различия по тестовым ре-

зультатам являются отражением действительных различий в измеряемых

свойствах и в какой мере они могут быть приписаны случайным ошибкам.

В более узком смысле, связанном с непосредственными методами оп-

ределения характеристик надежности, под этой группой показателей по-

нимают степень согласованности результатов теста, получаемых при пер-

вичном и повторном его применении, по отношению к тем же испытуемым

в различные моменты времени, с использованием разных (но сопостави-

мых по характеру) наборов тестовых заданий или при других измерениях

На практике используют три основных метода оценки надежности тес-

тов: повторное тестирование, параллельное тестирование и расщепление.

1. Повторное тестирование

2. Параллельное тестирование

Валидность теста показывает в какой мере он измеряет то качество, для

оценки которого он предназначен.

Проверка валидности методики называется валидизацией -

психометрическое исследование, направленное на определение валидности

теста или другого измерительного инструмента. Кроссвалидизация – про-

цедура дополнительной проверки валидности теста или результатов иссле-

дования посредством применения теста на новой выборке или проведения

исследования с другими группами испытуемых, а также с применением

других методов регистрации зависимых переменных.

Основным элементом практически всех этих методов является так

называемый «критерий». Критерий валидности – это независимый от тес-

та, внешний по отношению к тесту источник информации об измеряемом

В качестве критерия валидности, используемых при валидизации тес-

та, на практике обычно используют: объективные социально-

демографические и биографические данные (стаж, образование, профес-

сия, прием и увольнение с работы) и т.д.

Особой разновидностью валидности является достоверность.

Речь идет о сознательных или бессознательных искажениях, которые

вносит в тестовые результаты сам испытуемый, руководясь в ходе теста

особой мотивацией, отличающийся от той, которая присуща ему в реаль-

ном поведении. Способность теста защищать информацию от мотивацион-

ных искажений и есть достоверность теста.

Репрезентативность тестовых норм

Репрезентативность (от фр. – показательный) тестовых норм – свойст-

во выборочной совокупности представлять генеральную совокупность.

Для повышения репрезентативности, выборка должна быть рандомизирована, а тест стандартизован.

Надежность психологического теста. Факторы, влияющие на точность измерения.

Коэффициенты надежности и способы их измерения.

Валидность психологического теста, ее сущность и предназначение.

Виды валидности.

Репрезентативность, достоверность и дискриминативность психологического теста.

Ситуации применения психодиагностики. Классификация психодиагностических ситуаций.

Подходы к обработке психодиагностических данных.

Этапы психодиагностического исследования.

Виды психодиагностики.

Понятие нормы объекта психодиагностики.

Психологический диагноз.

Диагностика черт личности. Теоретические проблемы и практика.

Первые исследования проведения качественного обследования психометрики связаны с именем Ч. Спирмена (ученик Ф. Гальтона).

Психометрика – область психодиагностики, которая изучает особенности научного обоснования, создания и исследования психологических методов измерения психических свойств и проверку их надёжности. Это математизированная технология создания стандартизированных, измерительных, психодиагностических методик, т.е. обосновывает требования, которым должны удовлетворять эти методики.

Цель психометрики – обеспечить качественные результаты: повышение качества методики и качества процедуры обследования, т.е. решает 2 вопроса: чем и как проводить обследование.

Задачи психометрики:

- создание новых методик, обоснование требований к методикам;

- разработка процедуры применения методики;

- обоснование требований предъявляемых к психодиагносту.

Качественная методика достигается при соблюдении условий:

надёжность, валидность, достоверность, дискриминативность.

Качественная процедура диагностического обследования достигается при соблюдении условий: репрезентативность выборки, стандартизация процедуры, нормативность данных.

Показатели качества психодиагностических методик.

1. Надёжность – отражает точность, относительное постоянство диагностических измерений и устойчивость при первичном и повторном его применении на одних и тех же испытуемых. Результаты д.б. устойчивы к действиям случайных факторов.

· Разнообразные внешние условия (освещённость, время суток, температура). Важно соблюдать единообразия проведения обследования: например, если первое тестирование проводилось утром, то и повторное д.б. утром; если 1-ый опыт сопровождался предварительным показом заданий, то и при 2-ом испытании это условие д.б. соблюдено.

· Внутренние факторы (утомляемость, недомогание, сонливость. )

· Информационно-социальные обстоятельства (опыт, личность).

Методика будет эффективна, когда результаты не будут зависеть от этих факторов.

Надёжность в отношении времени является выражением того, что метод является независимым от случайных колебаний во времени.

Под достоверностью понимаем вероятность совпадения результатов при повторном измерении у одних и тех же испытуемых, когда второе обследование непосредственно следует за первым.

Стабильность метода обозначает, что результаты одних и тех же испытуемых не меняются значительно даже при повторном обследовании после длительного времени (приблизительно спустя 8 недель – 3 месяца, но не более 6 мес.). Однако нельзя рассчитывать на абсолютную стабильность психологических признаков. Колебания исследуемого признака не должны быть резкими.

Для проверки стабильности диагностируемого признака используется тест- ретест, который заключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и второго обследования.

Надёжность в отношении заданийговорит о том, насколько каждое задание (вопрос, задача) метода вносят вклад в изучение данной характеристики. Имеется в виду, что метод настолько хорош, насколько качественными являются элементы, из которых он состоит. Различают 2 формы: эквивалентность и согласованность.

Эквивалентностьобозначает, что метод существует в двух или нескольких вариантах, которые взаимозаменяемы. Согласованностьявляется существенным свойством каждого метода, предназначенного для выявления одной характеристики личности.

Надёжность субъективных оценок–это степень согласия между разными экспериментаторами при оценке результатов одного метода или при оценивании тех же испытуемых. Гетерогенностьопределяет, насколько метод применим для разных групп испытуемых, которые различаются по возрасту, образованию, профессии, национальности и т.п.

2. Валидность – выражает практическую полезность теста, его диагностическую прогностическую силу и возможность его использования в определённых целях. Это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность. Анастази: «Валидность теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Т.е. это способность методики измерить именно те характеристики, которые нужно измерить. Проверка валидности методики называется валидизацией.

Подлинная валидность отражает отношения между результатами метода и тем, что с помощью метода изучалось.

В ложной валидности зафиксирована видимость ценности метода основанная на опыте, на убеждении, которые исходят из необоснованного убеждения, что данный метод является хорошим, потому, что хорошей является теория, на которой он построен. Часто такое убеждение усиливается по мере овладения методом, без исследования его реальной валидности. Валидность, основанная на желании, предполагает участие предубеждений исследователя относительно возможностей метода.

С точки зрения подлинной валидности можно говорить о следующих типах валидности: содержательная, конструктная, текущая, прогностическая.

Содержательная – выражает соответствие между тестом и исследуемой характеристикой. Включение таких заданий исходит из знаний автора, отзывов специалистов о предполагаемых явлениях. Например, включение в опросник вопросов, о которых предполагаем, что они направлены на проявление интровертированного поведения.

Прогностическая валидность – выражает соответствие между результатами теста и критерием спустя определённое время. Например, при исследовании доминантности мы следим за поведением и сопоставляем его с результатами тестирования.

Валидизация теста – это поиск ответа на вопрос, измеряет ли данная методика то, что, по замыслу автора, она должна измерять, и насколько точно она это делает.

Способы проверки валидности:

1. сравнение результатов, полученных с помощью данной методики, с методикой, которая уже прошла проверку;

2. использование экспертных оценок (оценивается содержательная валидность);

3. использование объективных показателей (оценивается прогностическая валидность).

Для расчета валидности испытуемых не д.б. меньше 50, лучше всего более 200.

3. Достоверность – психометрическое свойство теста, обеспечивающее защиту его результатов от сознательных фальсификаций или непреднамеренных мотивационных искажений. Обеспечивается с помощью шкалы лжи или коррекционной шкалы. Она состоит из вопросов, касающихся незначительных поступков, которые, как правило, совершают большинство людей. Используется в личностных опросниках.

Критерий объективности применительно к психологическим тестам имеет три значения. Два из них являются общими для всех психологических тестов. Это, во-первых, стандартность условий тестирования по отношении ко всем испытуемым. Во-вторых, строгая регламентация процедуры оценивания, обусловливающая выставление одной и той же оценки за данный результат любым количествам оценщиков. Третье значение – специфическое для личностных тестов – заключается в обеспечении независимости результатов теста от возможных попыток их сознательного искажения испытуемым.

4. Дискриминативность – способность методики дифференцировать испытуемых относительно максимального и минимального результатов. Это способность методики разделить на группы испытуемых. Оптимальный вариант – 5-7 групп.

5. Репрезентативность. Репрезентативная выборка – это выборка, которая представляет все характеристики генеральной совокупности по всем показателям. Выборка должна быть достаточно большой: мин. – 25 человек, статистические данные получают при выборке мин 200- 250 человек. Ошибки репрезентативности появляются тогда, когда характеристики выборки и генеральной совокупности не совпадают по каким-то параметрам (систематические или случайные ошибки). Систематические ошибки возникают, когда неправильно построена выборка, случайные – определяются вероятностью.

Стандартизация методики предполагает строгие правила работы с методикой, единые требования к инструкции, к способам регистрации результатов, к условиям проведения обследования.

- стандартизация результатов – чтобы сравнить результаты разных методик: перевод сырых баллов в стандартную шкалу. Распространённые шкалы: Z – шкала Линерта, SN – шкала школьных оценок, Т – шкала (100-бальная), шкала IQ. Или Векслера (200 бальная). Z – шкала с центром, равным 0.

Данные – множество определённых показателей из чётко определённой выборки. У каждой выборки свои нормативные данные (по полу, возрасту, профессии).

Нормативное оценивание – подход к оценке и интерпретации измеряемых тестом показателей, отражающих особенности личности и поведения, путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки.

Специфика психодиагностических процедур по сравнению с обычными физическими измерениями заключается в том, что здесь сама процедура измерения взаимодействует с «объектом» измерения. В физических измерениях объект в значительных пределах пассивен и не влияет со своей стороны на физический прибор. Человек, напротив, всегда активен и может применять такую тактику, которую психодиагност при разработке методики вовсе не предусматривал.

Строгое следование требованиям психометрики особенно необходимо при переносе тестов, разработанных за рубежом. В условиях недостаточной разработки отечественных методик многие психологи склонны рассматривать в качестве готовых зарубежные методики. Тогда как реальные языковые и социокультурные различия бывают столь сильны, что полная эмпирическая адаптация зарубежных методик по своему объёму не уступает разработке оригинальной методики. Это относится к шкалам ценностных ориентаций, к характерологическим опросникам и другим личностным тестам. Для того чтобы убедиться в пригодности того или иного зарубежного теста, психолог должен уметь повторить процедуру, с помощью которой конструировался и обосновывался этот тест его авторами. Если при конструировании многомерного теста использовался факторный анализ, то нельзя считать адаптированным тест без повторного факторного анализа.

Рабочие листы и материалы для учителей и воспитателей

Более 2 500 дидактических материалов для школьного и домашнего обучения

Онлайн
формат
Диплом
гособразца
Помощь в трудоустройстве

311 лекций для учителей,
воспитателей и психологов

Получите свидетельство
о просмотре прямо сейчас!

Курс повышения квалификации

Правовое регулирование деятельности медицинских сестер

Курс повышения квалификации

Актуальные вопросы преподавания технологии в условиях реализации ФГОС

Сейчас обучается 103 человека из 44 регионов

Курс повышения квалификации

Культурология: теория и методика преподавания в образовательной организации

«Домашнее обучение. Лайфхаки для родителей»

«Учись, играя: эффективное обучение иностранным языкам дошкольников»

Свидетельство и скидка на обучение
каждому участнику

Описание презентации по отдельным слайдам:

Психометрические основы психолого-педагогической деятельности

План
Типы шкал измерения.
Понятие норм и стандарта в диагностике.
Надежность как важное психометрическое требование к диагностической методике.
Валидность диагностической методики.
Достоверность, репрезентативность и дискриминативность — психометрические требования к диагностическим методикам.

Типы шкал измерения.
Психометрия — базовая дисциплина, являющаяся фундаментом общей психодиагностики, связанная с теорией и практикой измерения психических явлений. Понятие «психометрии» было введено в 1734 г. Христианом Вольфом, который впервые указал на возможность измерения в психологии.
Психометрия — наука, обосновывающая и разрабатывающая измерительные диагностические методы. Она научно обосновывает те требования, которым должны удовлетворять измерительные психодиагностические методы, и описывает определенные процедуры их разработки и применения.

Шкала — это форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему.
Значения признака или переменной определяются (измеряются) при помощи специальных шкал измерения:
1) номинативная (наименований);
2) порядковая;
3) интервальная;
4) равных отношений.

Номинативная (наименований) шкала - это шкала, классифицирующая по названию. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого. Это простейшая классификация испытуемых, например: мужчина-женщина; имеет братьев и сестер — единственный ребенок в семье и т.п.
Порядковая (ранговая) шкала. Это шкала классифицирует по принципу «больше — меньше». Субъекты ранжированы, например, по весу или росту. В порядковой шкале должно быть неменее трех классов, например «положительная реакция — нейтральная реакция — отрицательная реакция» или «подходит для занятия вакантной должности — подходит с оговорками — не подходит».

Интервальная шкала. Это шкала, классифицирующая по принципу «больше на определенное количество единиц — меньше на определенное количество единиц». Шкала представляет собой полностью упорядоченный ряд с измеренными интервалами между пунктами, причем отсчет начинается с произвольно выбранной величины. Каждое из возможных значений признака отстоит от другого на равном расстоянии.
Шкала равных отношений. Это шкала, классифицирующая объекты или субъекты пропорционально степени выраженности измеряемого свойства. В отличие от интервальной шкалы она имеет значимую нулевую точку, которая не произвольна, а указывает на полное отсутствие измеряемого свойства.

2. Понятие норм и стандарта в диагностике

Стандартизация — это единообразие процедуры проведения и оценки выполнения теста, которую рассматривают в двух планах:
1. Стандартизация процедуры, что подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов и условий проведения обследования.
2. Выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний. Такой точкой отсчета являются нормы.
Нормы — это множество показателей из четко определенных выборок.

Принято различать два вида норм:
статистические (применяется для оценки стилевых и мотивационных черт);
социокультурные (социально-психологический норматив) (применяется для оценки способностей и достижений).

Для вычисления статистической нормы обратились к приемам математической статистики — определение распределения.
Распределением называется закономерность встречаемости разных значений измеряемого признака. Форма распределения является обобщенной характеристикой выборки. Кривые распределения бывают одновершинные и многовершинные.

Социокультурный или социально-психологический норматив (СПн) — это уровень свойства, который явно или неявно считается в обществе необходимым; это система требований, которые общество предъявляет к психическому и личностному развитию каждого из его членов.

Для анализа данных относительно их близости к социальнопсихологическому нормативу, условно рассматриваемому как 100%-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на пять подгрупп (%):
1) наиболее успешные — 90-100% (10%);
2) близкие к успешным — 70-90% (20%);
3) средние по успешности — 30-70% (40%);
4) малоуспешные — 10-30% (20%);
5) наименее успешные — 0-10% (10%).

3. Надежность как важное психометрическое требование к диагностической методике
Надежность — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.

Степень надежности методик зависит от многих причин. Важной проблемой практической диагностики является выяснение негативных факторов, влияющих на точность измерений. Многие авторы пытались составить классификацию таких факторов, среди которых чаще называют следующие:
1) состояние и настроение обследуемых;
2) мотивация испытуемых к тестированию;
3) эргономические факторы: время дня, освещенность, температура в помещении, наличие шумов и запахов и т.п.;
4) характеристика деятельности (монотонность — динамичность и др.);
5) степень обучаемости (или натренированности) испытуемых.

Разновидностей надежности методик так же много, как и условий, влияющих на результаты диагностических испытаний. Все виды надежности отражают степень согласованности двух независимо полученных рядов показателей с помощью математико-статистического приема, который и устанавливает надежность методики.
Показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности; показатель, характеризующий стабильность измеряемого свойства, — коэффициентом стабильности; а показатель оценки влияния личности экспериментатора — коэффициентом константности.

Остановимся более подробно на рассмотрении этих показателей, характеризующих с разных сторон надежность психодиагностической методики.
1. Определение надежности измерительного инструмента. Для проверки надежности измерительного инструмента, говорящего о его однородности (или гомогенности), используют метод расщепления.
2. Определение стабильности изучаемого признака. Для проверки стабильности диагностируемого признака, свойства используется прием тест—ретест. Он заключается в повторном обследовании испытуемых с помощью той же методики.
3. Определение константности. Коэффициент константности определяется путем корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами.

4. Валидность диагностической методики
Валидность — обоснованность методики.
А. Анастази: «Валидность теста — понятие, указывающее нам на то, что тест измеряет и насколько хорошо он это делает», т.е. она предусматривает прямую проверку того, насколько хорошо тест выполняет свою функцию.

Валидность может быть внутренней (конструктной) и внешней (критериальной). Внутренняя валидность определяет, насколько полно тестовые баллы отражают исследуемые психические свойства или умения и знания, обозначает соответствие содержащихся в методике заданий, суждений и тому подобное общей цели и замыслу методики в целом.
Внешняя валидность определяет полезность тестового измерения в качестве предсказателя поведения, насколько тестовые баллы связаны с некоторой другой деятельностью. Речь идет о связи между показателями методики и наиболее важными, ключевыми внешними признаками, относящимися к поведению испытуемого.

Валидность — это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность.
Проверка валидности методики называется валидизацией.
Принято выделять:
1) теоретическую валидизацию — проверка валидности измерительного инструмента;
2) прагматическую валидизацию — валидность цели ее использования.

Основным элементом проверки валидности тестов является критерий валидности.
В качестве критерия могут выступать:
— успеваемость — для тестов способностей к обучению, тестов достижений, тестов интеллекта;
— производственные достижения — для методик профессиональной направленности;
— эффективность реальной деятельности (рисования, моделирования и т.д.) — для тестов специальных способностей;
— субъективные оценки — для тестов личности.

Виды валидности, обусловленные особенностями диагностических методик и временным статусом внешнего критерия:
1 Валидность «по содержанию» (логическая валидность) применяется для тестов достижений.
2 Валидность «по одновременности» (текущая валидность).
3 «Предсказывающая» валидность («прогностическая» валидность).
4 «Ретроспективная» валидность.

5. Достоверность, репрезентативность и дискриминативность — психометрические требования к диагностическим методикам
Достоверность — это способность теста защищать информацию от мотивационных искажений. Проблема достоверности остро стоит в случае тест-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.

Вывод
Психометрия — базовая дисциплина, являющаяся фундаментом общей психодиагностики, связанная с теорией и практикой измерения психических явлений.
Знание психометрии дает диагносту необходимый материал для понимания ограниченности методик, тех допущений, которые были сделаны авторами для целей исследования.
В психодиагностике принято различать два вида норм: статистические и социокультурные. Первый вид чаще применяется для оценки стилевых и мотивационных черт, второй — для оценки способностей и достижений.
черт, второй — для оценки способностей и достижений.
Достоинством измерительных методов является объективный характер процедуры, возможность перепроверки, которая обеспечивается не автоматически, а благодаря выполнению следующих психометрических требований: надежность, валидность, репрезететивность, достоверность и дискриминативность. У каждого из этих требований существуют определенные процедуры их разработки и применения.

Список литературы
1 Анастази А., Урбина С. Психологическое тестирование. —7-е изд. — СПб.: Питер, 2005 — 688 с.
2 Бурлачук л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. — 2-е изд., перераб. и доп. — СПб.: Питер, 2003 —528 с.
3 Васильева И.В. Психодиагностика. — Тюмень: Изд-во ТюмГУ, 2010
4 Диагностическая деятельность педагога/ Н.М. Борытко; под ред. В.А. Сластенина, И.А. Колесниковой. — М.: Издательский центр «Академия», 2006
5 Общая психодиагностика / под ред. А.А. Бодалева, В.В. Столина. — СПб: Речь, 2004
6 Психодиагностика: учебник для вузов / л.Ф. Бурлачук — СПб.: Питер, 2008
7 Психологическая диагностика: учебное пособие / под ред. М.К. Акимовой, К.М. Гуревича, — СПб.: Питер, 2007
8 Романова Е.С. Психодиагностика. — СПб.: Питер, 2009
9 Шевандрин Н.И. Основы психологической диагностики: учебник для студ. высш. учеб. заведений: в 3 ч. — М.: Гуманит. изд. центр ВлАДОС, 2003
10 Шмелев А.Г. Основы психодиагностики: учебное пособие для студентов педвузов. — М.; Ростов–на–Дону: Феникс, 1996

Читайте также: