コルモゴロフ-スミルノフ検定: それが何であり、統計でどのように使用されるか
統計学では、パラメトリック検定とノンパラメトリック検定がよく知られており、使用されています。 広く使用されているノンパラメトリック検定は、コルモゴロフ-スミルノフ検定です。、これにより、サンプル スコアが正規分布に従うかどうかを検証できます。
これは、いわゆる適合度検定のグループに属します。 この記事では、その特徴、目的、および適用方法について説明します。
- 関連記事:「カイ 2 乗 (χ²) 検定: 検定とは何か、統計でどのように使用されるか"
ノンパラメトリック検定
コルモゴロフ・スミルノフ検定は、 ノンパラメトリック検定の一種. ノンパラメトリック検定 (自由分布とも呼ばれます) は推論統計で使用され、次の特徴があります。
- 彼らは、適合度、独立性についての仮説を提案しています...
- 変数の測定レベルが低い (序数)。
- 過度の制限はありません。
- それらは小さなサンプルに適用できます。
- それらは堅牢です。
Kolmogorov-Smirnov 検定: 特性
コルモゴロフ-スミルノフ検定は、統計に属する独自の検定の 1 つであり、特に 推測統計. 推論統計は、人口に関する情報を抽出することを目的としています。
それは 適合度検定、つまり、サンプルから取得したスコアが正規分布に従うかどうかを検証するために使用されます。 つまり、データセットの分布と特定の理論上の分布との一致度を測定できます。 その目的は、指定された理論上の分布を持つ母集団からデータが得られたかどうかを示すことです。 言い換えれば、それが行うことは、観測が分布から合理的に得られるかどうかをテストすることです 指定。
Kolmogorov-Smirnov 検定は、次の質問に対処します。 サンプルの観測値は、仮定された分布から得られたものですか?
帰無仮説と対立仮説
適合度検定として、「(経験的) サンプリング分布は (理論的) 母集団分布に適合するか?」という質問に答えます。 この場合、 帰無仮説 (H0) は、経験的分布が理論的分布に類似していることを立証します。 (帰無仮説は、棄却を試みていないものです。) 言い換えれば、帰無仮説は、観測された度数分布が理論上の分布と一致する (したがって、適切に適合する) ことを立証します。
対照的に、対立仮説 (H1) は、観測された度数分布が理論上の分布と一致しない (不適切な適合) と述べます。 他の仮説対比検定と同様に、記号 α (アルファ) は検定の有意水準を示します。
- あなたは興味があるかもしれません: "ピアソンの相関係数: それは何であり、どのように使用するか"
どのように計算されますか?
Kolmogorov-Smirnov 検定の結果は、文字 Z で表されます。 Z は、最大の差 (絶対値) から計算されます。 理論上の累積分布関数と観測された (経験的な) 累積分布関数の間.
仮定
Kolmogorov-Smirnov 検定を正しく適用するには、一連の仮定を行う必要があります。 まず、テスト テスト分布のパラメータが以前に指定されていることを前提としています. この手順では、サンプルからパラメーターを推定します。
一方で、 サンプル平均と標準偏差は正規分布のパラメータです、サンプルの最小値と最大値は一様分布の範囲を定義し、サンプル平均 はポアソン分布のパラメーターであり、標本平均は分布のパラメーターです。 指数関数的。
仮定された分布からの偏差を検出するコルモゴロフ-スミルノフ検定の能力は、大幅に低下する可能性があります。 推定されたパラメータを持つ正規分布と対比するには、 K-S Lilliefors 検定を使用する可能性を検討する必要があります。.
応用
コルモゴロフ-スミルノフ検定を標本に適用して、変数 (学業成績や収入など) が正規分布しているかどうかを確認できます。 多くのパラメトリック検定では、使用する変数が正規分布に従う必要があるため、これを知っておく必要がある場合があります。
利点
いくつかの コルモゴロフ・スミルノフ検定の利点 それは:
- これは、カイ 2 乗 (χ²) 検定 (適合度検定でもあります) よりも強力です。
- 計算と使用が簡単で、データをグループ化する必要がありません。
- 統計は、予想される度数分布とは無関係であり、サンプル サイズにのみ依存します。
パラメトリック検定との違い
パラメトリック検定は、コルモゴロフ-スミルノフ検定などのノンパラメトリック検定とは異なり、次の特徴があります。
- パラメータについて仮説を立てます。
- 変数の測定レベルは、少なくとも定量的です。
- 満たさなければならない仮定がいくつかあります。
- 彼らは情報を失いません。
- それらは高い統計力を持っています。
パラメトリック検定の例 次のようになります: 平均差の t 検定または ANOVA。