4 различия между надежностью и достоверностью (в науке)

4 различия между надежностью и достоверностью (в науке) / психология

Поскольку в разговорной речи они имеют очень похожие значения, легко спутать термины достоверности и достоверности, когда мы говорим о науке и, в частности, о психометрии..

С этим текстом мы намерены выяснить основные различия между надежностью и достоверностью. Надеюсь, вы найдете полезным прояснить это общее сомнение..

  • Статья по теме: «Психометрия: изучение человеческого разума через данные»

Что такое надежность?

В психометрии понятие «надежность» относится к точности инструмента; В частности, коэффициенты надежности информируют нас о последовательности и стабильности мер, принятых с помощью этого инструмента.

Чем выше надежность инструмента, тем меньше случайных и непредсказуемых ошибок, которые появятся при его использовании для измерения определенных атрибутов. Надежность исключает предсказуемые ошибки, то есть те, которые подлежат экспериментальному контролю.

Согласно классической теории испытаний, надежность - это доля дисперсии, которая объясняется истинными оценками. Таким образом, прямая оценка в тесте будет состоять из суммы случайной ошибки и истинной оценки.

Два основных компонента надежности это временная стабильность и внутренняя согласованность. Первая концепция указывает на то, что оценки мало меняются при измерении в разных случаях, в то время как внутренняя согласованность относится к степени, в которой элементы, составляющие тест, измеряют одну и ту же психологическую конструкцию.

Следовательно, высокий коэффициент надежности указывает на то, что результаты теста незначительно колеблются в зависимости от времени и, в итоге, что на приборе отсутствуют погрешности измерений.

  • Может быть, вы заинтересованы: «Типы психологических тестов: их функции и характеристики»

Определение срока действия

Когда мы говорим о достоверности, мы имеем в виду, правильно ли тест измеряет конструкцию, которую он намерен измерять. Эта концепция определяется как связь между оценкой, полученной в тесте, и другой связанной мерой; Степень линейной корреляции между обоими элементами определяет коэффициент достоверности.

Кроме того, в научных исследованиях высокая достоверность указывает на степень, в которой результаты, полученные с помощью данного инструмента или в исследовании могут быть обобщены.

Существуют различные типы достоверности, которые зависят от способа его расчета; это делает его термином с очень разными значениями. Принципиально мы можем различить валидность контента, критериальная (или эмпирическая) валидность и конструктивная валидность.

Достоверность содержимого определяет, в какой степени элементы психометрического теста являются репрезентативной выборкой элементов, составляющих конструкцию, подлежащую оценке. Инструмент должен включать все фундаментальные аспекты конструкции; Например, если мы хотим сделать адекватный тест для измерения депрессии, мы должны обязательно включать элементы, которые оценивают состояние души и снижение удовольствия..

Критерий достоверности измеряет способность инструмента прогнозировать аспекты, связанные с признаком или областью интереса. Наконец, срок действия конструкции предназначен Определите, измеряет ли тест то, что вы собираетесь измерять, например, из сходимости с оценками, полученными в аналогичных тестах.

Различия между надежностью и достоверностью

Хотя эти два психометрических свойства тесно связаны, правда заключается в том, что они относятся к четко дифференцированным аспектам. Давайте посмотрим, что эти различия.

1. Объект анализа

Надежность является характеристикой инструмента в том смысле, что он измеряет свойства элементов, которые его составляют. С другой стороны, срок действия относится не только к инструменту, но к обобщениям, которые сделаны из результатов полученный через этот.

2. Информация, которую они предоставляют

Хотя это несколько упрощенный подход к нему, обычно утверждается, что валидность указывает, что психометрический инструмент фактически измеряет конструкцию, которую он намерен измерять, в то время как надежность означает, правильно ли он измеряет его, без ошибок.

3. Способ их расчета

Три процедуры в основном используются для измерения надежности: метод двух половинок, параллельных форм и тест-ретест. Наиболее используемой является процедура двух половинок, в которой элементы делятся на две группы после ответа на тест; Затем анализируется соотношение между двумя половинами..

Метод параллельных или альтернативных форм состоит в создании двух эквивалентных тестов, чтобы измерить, насколько они соотносят элементы среди них. Тест-повторный тест просто основан на прохождении теста дважды, в условиях, максимально похожих. Обе процедуры могут быть объединены, давая начало тесту-повторному тесту с параллельными формами, который состоит из оставления временного интервала между первой формой теста и второй.

С другой стороны, срок действия рассчитывается по-разному в зависимости от типа, но в целом все методы основаны на сравнении оценки в объективном тесте и других данных одних и тех же предметов по сходным признакам; цель состоит в том, что тест может выступать в качестве предиктора черты.

Среди методов, используемых для оценки достоверности, мы находим факторный анализ и метод мульти-метод-мульти-черты матриц. Кроме того, достоверность контента часто определяется рациональным, нестатистическим анализом; например, он включает в себя кажущуюся достоверность, которая относится к субъективному суждению экспертов о достоверности теста.

4. Связь между обоими понятиями

Надежность психометрического инструмента влияет на его достоверность: чем оно надежнее, тем больше. Следовательно, коэффициенты достоверности инструмента всегда ниже, чем коэффициенты надежности, и достоверность косвенно информирует нас о надежности.