信頼性と有効性の4つの違い(科学における)
口語ではそれらは非常に似た意味を持っているため、科学、特に心理測定学について話すとき、信頼性と妥当性という用語を混同しがちです.
このテキストで、私たちは、 信頼性と有効性の主な違い. このよくある質問を明確にすることが役立つことを願っています。
- 関連記事:「心理測定学: データを通じて人間の心を研究する"
信頼性とは?
心理測定では、「信頼性」という概念 計器の精度を指す; 具体的には、信頼係数は、このツールで取得した測定値の一貫性と安定性を知らせてくれます。
計測器の信頼性が高いほど、それを使用して特定の属性を測定するときに発生するランダムで予測不可能なエラーが少なくなります。 信頼性は、予測可能なエラー、つまり実験的制御の対象となるエラーを除外します。
古典的なテスト理論によると、信頼性は真のスコアによって説明される分散の割合です。 したがって、テストの直接スコアは、ランダム エラーと真のスコアの合計で構成されます。
信頼性の 2 つの主な要素 一時的な安定性と内部の一貫性. 最初の概念は、さまざまな機会に測定した場合、スコアがほとんど変化しないことを示しています。 内部整合性とは、テストを構成する項目が同じ構造を測定する度合いを指します。 心理的な。
したがって、信頼係数が高いということは、テストのスコアが内部的にも時間の関数としてもほとんど変動しないことを示しています。つまり、 測定器に測定誤差がないこと.
- あなたは興味があるかもしれません: "心理テストの種類:その機能と特徴"
妥当性の定義
妥当性について話すときは、テストが測定しようとしている構成を正しく測定するかどうかを指します。 この概念は、 テストで得られたスコアと別の関連する尺度との関係; 両方の要素間の線形相関の程度によって、有効係数が決まります。
同様に、科学研究では、高い妥当性は、特定の機器または研究で得られた結果がどの程度一般化できるかを示します。
妥当性にはさまざまな種類があり、計算方法によって異なります。 これは、非常に異なる意味を持つ用語であることを意味します。 基本的には区別できる コンテンツの妥当性、基準 (または経験的) 妥当性、構成概念の妥当性.
コンテンツの有効性は、心理測定テストの項目が、評価される構成要素を構成する要素の代表的なサンプルである範囲を定義します。 手段には、構造のすべての基本的な側面が含まれている必要があります。 たとえば、うつ病を測定するために適切なテストを実行したい場合は、気分と喜びの減少を評価する項目を必ず含める必要があります。
基準妥当性は、特性または関心領域に関連する側面を予測する機器の能力を測定します。 最後に、構成概念妥当性は、 テストが測定しようとしているものを測定するかどうかを決定する、たとえば、同様のテストで得られたスコアとの収束から。
信頼性と妥当性の違い
これら 2 つの心理測定特性は密接に関連していますが、実際には、それらは明確に区別された側面を指しています。 これらの違いが何で構成されているか見てみましょう.
1. 分析対象
信頼性は、機器を構成する項目の特性を測定するという意味で、機器の特性です。 一方、妥当性は、正確に手段を指すのではなく、 結果からの一般化 それを通して得た。
2. 彼らが提供する情報
やや単純化した言い方ですが、一般的には、妥当性とは、ツールが 心理測定は、測定しようとしている構造を実際に測定しますが、信頼性は、それを正しく測定するかどうかを指します。 間違い。
3. 計算方法
信頼性の測定には、主に次の 3 つの手順が使用されます。 2つの半分の方法、平行形式の方法、および再テスト. 最も広く使用されているのは、2 つの半分の手順です。この手順では、テストに回答すると、項目が 2 つのグループに分けられます。 次に、2 つの半分の間の相関関係が分析されます。
並列形式または代替形式の方法は、項目が互いにどの程度相関しているかを測定するために、2 つの同等のテストを作成することで構成されます。 再テストは、できるだけ同じ条件で 2 回テストに合格することに基づいています。 両方の手順を組み合わせることができ、テストの最初の形式と 2 番目の形式の間に時間間隔を空けることからなる、並列形式のテスト-再テストを生じさせることができます。
一方、有効性は タイプに応じてさまざまな方法で計算されます、しかし一般的に、すべての方法は、客観的なテストのスコアと、同様の特性に関連する同じ被験者からの他のデータとの比較に基づいています。 目的は、テストが特性の予測因子として機能できるようにすることです。
妥当性を評価するために使用される方法の中には、因子分析とマルチメソッドマルチトレイトマトリックス手法があります。 同様に、コンテンツの有効性は、統計的ではなく合理的な分析によって決定されることがよくあります。 たとえば、テストの有効性に関する専門家の主観的判断を指す顔の有効性が含まれます。
4. 両方の概念の関係
心理測定機器の信頼性は、その有効性に影響を与えます。 信頼性が高いほど、その有効性も高くなります. したがって、ツールの妥当性係数は常に信頼性係数よりも低く、妥当性は信頼性について間接的に知らせてくれます。