4 различия между надежностью и достоверностью (в науке)
Поскольку в разговорной речи они имеют очень похожие значения, легко спутать термины достоверности и достоверности, когда мы говорим о науке и, в частности, о психометрии..
С этим текстом мы намерены выяснить основные различия между надежностью и достоверностью. Надеюсь, вы найдете полезным прояснить это общее сомнение..
- Статья по теме: «Психометрия: изучение человеческого разума через данные»
Что такое надежность?
В психометрии понятие «надежность» относится к точности инструмента; В частности, коэффициенты надежности информируют нас о последовательности и стабильности мер, принятых с помощью этого инструмента.
Чем выше надежность инструмента, тем меньше случайных и непредсказуемых ошибок, которые появятся при его использовании для измерения определенных атрибутов. Надежность исключает предсказуемые ошибки, то есть те, которые подлежат экспериментальному контролю.
Согласно классической теории испытаний, надежность - это доля дисперсии, которая объясняется истинными оценками. Таким образом, прямая оценка в тесте будет состоять из суммы случайной ошибки и истинной оценки.
Два основных компонента надежности это временная стабильность и внутренняя согласованность. Первая концепция указывает на то, что оценки мало меняются при измерении в разных случаях, в то время как внутренняя согласованность относится к степени, в которой элементы, составляющие тест, измеряют одну и ту же психологическую конструкцию.
Следовательно, высокий коэффициент надежности указывает на то, что результаты теста незначительно колеблются в зависимости от времени и, в итоге, что на приборе отсутствуют погрешности измерений.
- Может быть, вы заинтересованы: «Типы психологических тестов: их функции и характеристики»
Определение срока действия
Когда мы говорим о достоверности, мы имеем в виду, правильно ли тест измеряет конструкцию, которую он намерен измерять. Эта концепция определяется как связь между оценкой, полученной в тесте, и другой связанной мерой; Степень линейной корреляции между обоими элементами определяет коэффициент достоверности.
Кроме того, в научных исследованиях высокая достоверность указывает на степень, в которой результаты, полученные с помощью данного инструмента или в исследовании могут быть обобщены.
Существуют различные типы достоверности, которые зависят от способа его расчета; это делает его термином с очень разными значениями. Принципиально мы можем различить валидность контента, критериальная (или эмпирическая) валидность и конструктивная валидность.
Достоверность содержимого определяет, в какой степени элементы психометрического теста являются репрезентативной выборкой элементов, составляющих конструкцию, подлежащую оценке. Инструмент должен включать все фундаментальные аспекты конструкции; Например, если мы хотим сделать адекватный тест для измерения депрессии, мы должны обязательно включать элементы, которые оценивают состояние души и снижение удовольствия..
Критерий достоверности измеряет способность инструмента прогнозировать аспекты, связанные с признаком или областью интереса. Наконец, срок действия конструкции предназначен Определите, измеряет ли тест то, что вы собираетесь измерять, например, из сходимости с оценками, полученными в аналогичных тестах.
Различия между надежностью и достоверностью
Хотя эти два психометрических свойства тесно связаны, правда заключается в том, что они относятся к четко дифференцированным аспектам. Давайте посмотрим, что эти различия.
1. Объект анализа
Надежность является характеристикой инструмента в том смысле, что он измеряет свойства элементов, которые его составляют. С другой стороны, срок действия относится не только к инструменту, но к обобщениям, которые сделаны из результатов полученный через этот.
2. Информация, которую они предоставляют
Хотя это несколько упрощенный подход к нему, обычно утверждается, что валидность указывает, что психометрический инструмент фактически измеряет конструкцию, которую он намерен измерять, в то время как надежность означает, правильно ли он измеряет его, без ошибок.
3. Способ их расчета
Три процедуры в основном используются для измерения надежности: метод двух половинок, параллельных форм и тест-ретест. Наиболее используемой является процедура двух половинок, в которой элементы делятся на две группы после ответа на тест; Затем анализируется соотношение между двумя половинами..
Метод параллельных или альтернативных форм состоит в создании двух эквивалентных тестов, чтобы измерить, насколько они соотносят элементы среди них. Тест-повторный тест просто основан на прохождении теста дважды, в условиях, максимально похожих. Обе процедуры могут быть объединены, давая начало тесту-повторному тесту с параллельными формами, который состоит из оставления временного интервала между первой формой теста и второй.
С другой стороны, срок действия рассчитывается по-разному в зависимости от типа, но в целом все методы основаны на сравнении оценки в объективном тесте и других данных одних и тех же предметов по сходным признакам; цель состоит в том, что тест может выступать в качестве предиктора черты.
Среди методов, используемых для оценки достоверности, мы находим факторный анализ и метод мульти-метод-мульти-черты матриц. Кроме того, достоверность контента часто определяется рациональным, нестатистическим анализом; например, он включает в себя кажущуюся достоверность, которая относится к субъективному суждению экспертов о достоверности теста.
4. Связь между обоими понятиями
Надежность психометрического инструмента влияет на его достоверность: чем оно надежнее, тем больше. Следовательно, коэффициенты достоверности инструмента всегда ниже, чем коэффициенты надежности, и достоверность косвенно информирует нас о надежности.