標準偏差: それは何ですか? また、この測定は何のために行われますか?
標準偏差または標準偏差という用語は、数値データの変動または分散を定量化するために使用される尺度を指します。 確率変数、統計母集団、データセット、または確率分布で。
研究と統計の世界は、一般の人々にとっては複雑で異質なものに見えるかもしれません。 数学的計算は、その根底にあるメカニズムを理解することができなくても、目の前で行われます。 彼ら自身。 現実からかけ離れたものはありません。
この機会に、単純だが網羅的な方法で文脈、 の分野における標準偏差と同じくらい重要な用語の基礎と適用 統計。
- 関連記事: 「心理学と統計:行動科学における確率の重要性」
標準偏差とは何ですか?
統計は、変動性とそれを生成するランダムなプロセスの記録を担当する数学の一分野です。 確率の法則に従う. これはすぐに言われますが、統計プロセスの中に、今日私たちが自然と物理学の世界で「ドグマ」と見なすすべてのものへの答えがあります.
例えば、コインを3回投げて、そのうち2回表裏が出たとします。 単純な偶然ですよね? 一方、同じコインを 700 回投げて 660 回表が出る場合、この現象をさらに有利にする要因が存在する可能性があります。 ランダム性(たとえば、空中で限られた回数のターンしかできないと想像してみましょう。つまり、ほとんどの場合、同じ方向に落ちることを意味します モード)。 したがって、単なる偶然を超えたパターンを観察することで、トレンドの根底にある理由について考えるようになります。
この奇妙な例で実証したいことは、 統計は、あらゆる科学的プロセスに不可欠なツールです。これに基づいて、偶然の結果である現実と自然の法則によって支配される出来事を区別することができるからです。
したがって、標準偏差を性急に定義して、その分散の平方根の積である統計的尺度であると言うことができます。 これは、家を屋根から始めるようなものです。数字の世界に完全に専念しているわけではない人にとって、この定義と用語について何も知らないことはほとんど変わらないからです。 それでは、基本的な統計パターンの世界を分析してみましょう。.
位置と変動性の尺度
位置測定値は、度数分布内のデータの何パーセントがこれらの式を超えるかを示すために使用されるインジケーターです。 その値は、度数分布の中心にあるデータの値を表します. それらをすばやく定義するので、絶望しないでください。
- 平均: サンプルの数値平均。
- 中央値: 一連の順序付けられたデータの中心位置変数の値を表します。
初歩的な言い方をすれば、位置測定は、データ セットを均等なパーセンテージ部分に分割すること、つまり「中間に到達すること」に焦点を当てていると言えます。
一方、変動性の尺度は、 平均位置と比較して、分布の値の近さまたは距離を決定する (つまり、平均に対して)。 これらは次のとおりです。
- 範囲: データの幅、つまり最小値から最大値までを測定します。
- 分散: 変数の平均に対する偏差の 2 乗の期待値 (データ系列の平均)。
- 標準偏差: データセットの分散の数値指標。
もちろん、数学の世界に完全に専念していない人にとっては、比較的複雑な条件で動いています。 これらのパラメーターの数値積が大きいほど、データセットの均質化が少なくなることを知っているため、変動性の他の尺度には入りたくありません。
- あなたは興味があるかもしれません: 「サイコメトリー: それは何で、何に責任があるのですか?」
「非定型の平均」
変動性の尺度とデータ分析におけるその重要性に関する知識を固めたら、標準偏差に再び注意を向ける時が来ました。
複雑な概念に立ち入ることなく (そしておそらく物事を単純化しすぎるという罪を犯すことなく)、次のように言うことができます。 この測定値は、「外れ値」値の平均を計算した結果です. この定義を明確にするために例を挙げましょう。
私たちは、子犬の同腹子を同時に出産したばかりの、同じ品種と年齢の6匹の妊娠中の雌犬のサンプルを持っています. そのうちの 3 匹はそれぞれ 2 匹の子犬を出産し、別の 3 匹は雌ごとに 4 匹の子犬を出産しました。 当然のことながら、子孫の平均値は雌 1 匹あたり 3 匹です (すべての仔の合計を雌の総数で割った値)。
この例では、標準偏差はいくつになるでしょうか? まず、得られた値から平均を引き、この数値を二乗する必要があります (負の数は必要ないため)。たとえば、4-3=1 または 2-3= (-1 、正方形に上げた、 1) 。
分散は、平均値からの偏差の平均として計算されます (この場合は 3)。 ここでは分散に直面することになるため、この値の平方根をとって、平均と同じ数値スケールに変換する必要があります。 この後、標準偏差を取得します。
では、この例の標準偏差はどうなるでしょうか? さて、子犬。 同腹児の平均は 3 匹であると推定されていますが、母親が一腹あたり 1 匹少ないまたは 1 匹多い子を産むのは普通のことです。
おそらく、この例は、分散と偏差に関する限り、少し混乱するかもしれません (1 の平方根は 1)、しかし、分散が 4 の場合、標準偏差の結果は 2 になります (覚えておいてください、その根 四角)。
この例で実証したかったのは、 分散と標準偏差は、平均値以外の値の平均を得ようとする統計的尺度です. 注意: 標準偏差が大きいほど、母集団の分散が大きくなります。
前の例に戻ると、すべての雌犬が同じ品種で同じような体重を持っている場合、偏差が 1 腹あたり 1 匹になるのは正常です。 しかし、たとえば、マウスとゾウを例にとると、子孫の数に関する偏差が 1 よりもはるかに大きい値に達することは明らかです。 繰り返しになりますが、2 つのサンプル グループの共通点が少ないほど、偏差が大きくなることが予想されます。
それでも、1 つのことは明らかです。このパラメーターを使用して、サンプルのデータの分散を計算していますが、これは母集団全体を代表する必要はありません。 この例では 6 頭の雌犬を捕まえましたが、7 頭を監視し、7 頭目に 9 匹の子犬がいた場合はどうなるでしょうか?
もちろん、偏差値のパターンは変わります。 このため、考慮に入れる データセットを解釈する際には、サンプルサイズが不可欠です. 個々の数値が収集され、実験が繰り返されるほど、一般的な真実の仮定に近づきます。
結論
これまで見てきたように、標準偏差はデータ分散の尺度です。 分散が大きいほど、この値は大きくなります。というのは、一連の完全に均一な結果 (つまり、それらがすべて平均値に等しい) に直面した場合、このパラメーターは 0 になるからです。
この値は、統計において非常に重要です。なぜなら、すべてが数字と出来事の間の共通の架け橋を見つけることに還元されるわけではないからです。 より多くの質問をし、長期的により多くの知識を得るために、サンプル グループ間の変動性を記録することも不可欠です。 学期。
参考文献:
- khanacademy.org で標準偏差を段階的に計算します。 8月29日収集 https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- Jaime, S. & Vinicio, M. (1973). 確率と統計。
- パラ、J. メートル。 (1995). 記述統計と推論統計 I. 回収元: http://www. 学校。 教育/ダウンロード/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL。 pdf.
- レンドン・マシアス、M. E.、Villasis-Keeve、M. Á., & Miranda-Novales, M. g. (2016). 記述統計。 アレルギー マガジン メキシコ、63(4)、397-407。
- リカルド、F. Q. (2011). 健康研究に適用される統計。 カイ二乗検定から得られた: http://www. メドウェーブ。 cl/link. cgi/Medwave/シリーズ/MBE04/5266.