표준편차: 무엇이며 이 측정값은 무엇입니까?
표준 편차 또는 표준 편차라는 용어는 숫자 데이터의 변동 또는 분산을 정량화하는 데 사용되는 척도를 나타냅니다. 무작위 변수, 통계 모집단, 데이터 세트 또는 확률 분포에서.
연구 및 통계의 세계는 일반 대중에게 복잡하고 낯설게 보일 수 있습니다. 수학적 계산은 기본 메커니즘을 이해할 수 없는 상태에서 우리 눈 아래에서 발생합니다. 그들 자신. 현실에서 더 먼 것은 없습니다.
이 기회에 우리는 간단하지만 철저한 방식으로 문맥, 표준편차만큼 필수적인 용어의 기초 및 적용 분야 통계.
- 관련 기사: "심리학과 통계: 행동 과학에서 확률의 중요성"
표준 편차는 무엇입니까?
통계는 변동성을 기록하고 이를 생성하는 무작위 프로세스를 담당하는 수학의 한 분야입니다. 확률의 법칙에 따라. 이것은 곧 언급되지만, 오늘날 우리가 자연과 물리학의 세계에서 "도그마"로 간주하는 모든 것에 대한 답은 통계적 프로세스 내에 있습니다.
예를 들어, 동전을 세 번 던질 때 두 번은 앞면과 뒷면이 나온다고 합시다. 단순한 우연의 일치죠? 반면에 같은 동전을 700번 던졌는데 그 중 660개가 앞면이 나온다면, 아마도 그 이상의 현상을 선호하는 요인이 있을 수 있습니다. 임의성(예를 들어 공중에서 제한된 수의 회전을 할 시간만 있다고 상상해 봅시다. 방법). 따라서 단순한 우연 이상의 패턴을 관찰하면 추세의 근본적인 이유에 대해 생각하게 됩니다.
이 기이한 예를 통해 우리가 보여주고 싶은 것은 통계는 모든 과학적 프로세스에 필수적인 도구입니다., 그것을 기반으로 우리는 우연의 결과인 현실과 자연 법칙에 의해 지배되는 사건을 구별할 수 있기 때문입니다.
따라서 우리는 표준편차를 성급하게 정의하고 표준편차는 분산의 제곱근의 곱인 통계적 척도라고 말할 수 있습니다. 이것은 마치 지붕에서 집을 짓는 것과 같습니다. 왜냐하면 숫자의 세계에 완전히 전념하지 않는 사람에게 이 정의와 용어에 대해 아무것도 모르는 것은 거의 다르지 않기 때문입니다. 그럼 잠시 시간을 내어 기본 통계 패턴의 세계를 분석해 봅시다..
위치 및 변동성 측정
위치 측정은 빈도 분포 내에서 이러한 표현을 초과하는 데이터의 백분율을 나타내는 데 사용되는 지표입니다. 그의 값은 빈도 분포의 중심에 있는 데이터의 값을 나타냅니다.. 절망하지 마십시오. 빠르게 정의할 수 있습니다.
- 평균: 샘플의 수치 평균입니다.
- 중앙값: 정렬된 데이터 집합에서 중앙 위치 변수의 값을 나타냅니다.
기초적인 방법으로 우리는 위치 측정이 데이터 세트를 동일한 백분율 부분으로 나누는 데 초점을 맞추고 있다고 말할 수 있습니다.
반면에 변동성 측정은 다음을 담당합니다. 평균 위치와 비교하여 분포 값의 근접성 또는 거리를 결정합니다. (즉, 평균 대비). 이들은 다음과 같습니다.
- 범위: 데이터의 폭, 즉 최소값에서 최대값까지를 측정합니다.
- 분산: 해당 변수의 평균에 대한 편차의 제곱에 대한 기대치(데이터 시리즈의 평균).
- 표준 편차: 데이터 세트 분산의 수치 지수.
물론 우리는 수학의 세계에 완전히 헌신하지 않은 사람을 위해 상대적으로 복잡한 용어로 움직이고 있습니다. 이러한 매개변수의 수치적 곱이 클수록 데이터 세트가 덜 균질화된다는 것을 알기 때문에 다른 변동성 측정에 들어가고 싶지 않습니다.
- 다음 항목에 관심이 있을 수 있습니다. "Psychometry: 그것은 무엇이며 무엇을 담당합니까?"
"비정형의 의미"
변동성 측정과 데이터 분석에서의 중요성에 대한 지식을 확고히 한 후에는 표준 편차에 다시 집중해야 할 때입니다.
복잡한 개념으로 들어가지 않고(그리고 아마도 사물을 지나치게 단순화하는 죄를 범하지 않고), 우리는 다음과 같이 말할 수 있습니다. 이 측정값은 "이상값" 값의 평균을 계산한 결과입니다.. 이 정의를 명확히 하기 위해 예를 들어 보겠습니다.
우리는 동시에 새끼를 낳은 같은 품종과 나이의 6마리의 임신한 암캐 샘플을 가지고 있습니다. 그들 중 3마리는 각각 2마리의 강아지를 낳았고, 다른 3마리는 암컷당 4마리의 강아지를 낳았습니다. 당연히 자손의 평균값은 암컷당 3마리의 새끼입니다(모든 새끼의 합을 암컷의 총 수로 나눈 값).
이 예에서 표준 편차는 얼마입니까? 우선, 얻은 값에서 평균을 빼고 이 수치를 제곱으로 올려야 합니다(음수를 원하지 않기 때문에). 예: 4-3=1 또는 2-3= (-1, 정사각형으로 올렸습니다. 1) .
분산은 평균값에서 편차의 평균으로 계산됩니다. (이 경우 3). 여기서 우리는 분산에 직면할 것이므로 이 값의 제곱근을 평균과 동일한 수치 척도로 변환해야 합니다. 그런 다음 표준 편차를 얻습니다.
그렇다면 우리 예제의 표준편차는 어떻게 될까요? 음, 강아지. 한배 새끼의 평균은 3마리로 추정되지만 어미가 새끼를 한 배에 한 마리 적거나 한 마리 더 낳는 것이 정상입니다.
아마도 이 예는 분산과 편차에 관한 한 약간 혼란스럽게 들릴 수 있습니다(1의 제곱근은 1) 그러나 분산이 4인 경우 표준 편차의 결과는 2가 됩니다. 정사각형).
이 예를 통해 보여주고 싶었던 것은 분산 및 표준 편차는 평균 이외의 값의 평균을 얻으려는 통계적 측정입니다.. 참고: 표준 편차가 클수록 모집단의 분산이 커집니다.
앞의 예로 돌아가서, 모든 암캐가 같은 품종이고 비슷한 체중을 가지고 있다면 편차가 한 배에 한 마리의 새끼가 되는 것이 정상입니다. 그러나 예를 들어 마우스와 코끼리를 사용하면 자손 수의 편차가 1보다 훨씬 큰 값에 도달한다는 것이 분명합니다. 다시 말하지만, 두 샘플 그룹의 공통점이 적을수록 편차가 더 클 것으로 예상할 수 있습니다.
그럼에도 불구하고 한 가지는 분명합니다. 이 매개변수를 사용하여 샘플 데이터의 분산을 계산하지만 이것이 전체 모집단을 대표할 필요는 없습니다. 이 예에서 우리는 6마리의 암컷을 잡았지만 7마리를 모니터링하고 7마리가 9마리의 강아지를 낳았다면 어떨까요?
물론 편차의 패턴은 바뀔 것이다. 이러한 이유로 다음을 고려하십시오. 샘플 크기는 모든 데이터 세트를 해석할 때 필수적입니다.. 더 많은 개별 숫자가 수집되고 실험이 더 많이 반복될수록 일반적인 진실을 가정하는 데 더 가까워집니다.
결론
관찰할 수 있었던 것처럼 표준 편차는 데이터 분산의 척도입니다. 분산이 클수록 이 값이 커집니다., 완전히 동질적인 결과 세트(즉, 모두 평균과 같음)에 직면한 경우 이 매개변수는 0과 같기 때문입니다.
이 값은 통계에서 매우 중요합니다. 모든 것이 수치와 사건 사이의 공통 다리를 찾는 것으로 축소되는 것이 아니라 오히려 장기적으로 더 많은 질문을 하고 더 많은 지식을 얻으려면 샘플 그룹 간의 변동성을 기록하는 것도 필수적입니다. 용어.
참고문헌:
- khanacademy.org에서 단계별로 표준 편차를 계산합니다. 8월 29일 수집 https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
- 제이미, S., & Vinicio, M. (1973). 확률과 통계.
- 파라, J. 중. (1995). 기술 및 추론 통계 I. 에서 복구: http://www. 학원. edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.pdf
- Rendón-Macías, M. E., 빌라시스-키브, M. Á., & 미란다-노발레스, M. g. (2016). 기술 통계. Allergy Magazine Mexico, 63(4), 397-407.
- 리카르도, F. 큐. (2011). 건강 연구에 적용되는 통계. 카이제곱 테스트에서 얻은 결과: http://www. 합니다. cl/링크. cgi/Medwave/Series/MBE04/5266.