분산 분석(ANOVA): 이것이 무엇이며 통계에서 어떻게 사용되는지
통계에서 두 개 이상의 표본의 평균을 관심 변수(예: 불안 심리 치료 후), 검정을 사용하여 평균 간에 유의한 차이가 있는지 여부를 확인합니다.
그 중 하나는 분산 분석(ANOVA)입니다.. 이 기사에서 우리는 이 매개변수 테스트가 무엇으로 구성되어 있고 그것을 사용하기 위해 어떤 가정을 충족해야 하는지 알게 될 것입니다.
- 관련 기사: "심리학 및 통계: 행동 과학에서 확률의 중요성"
분산 분석(ANOVA): 무엇입니까?
통계에서 우리는 분산 분석(ANOVA)의 개념을 찾습니다. 분산이 특정 구성 요소로 분할되는 통계 모델 및 관련 절차의 그룹화, 다양한 설명 변수로 인해. 영어로 ANOVA를 분해하면 ANOVA는 ANalysis Of VAriance(분산 분석)를 나타냅니다.
분산 분석(ANOVA)은 일종의 매개변수 테스트. 이는 이를 적용하기 위해 일련의 가정이 충족되어야 하고 관심 변수의 수준이 다음과 같아야 함을 의미합니다. 최소한 양적(즉, 최소한 간격, 예를 들어 IQ, 0이 있는 경우) 상대적인).
분산 기법 분석
분산 기법의 첫 번째 분석은 1920년대와 1930년대에 R.A. 통계학자이자 유전학자인 Fisher. 그래서 분산분석(ANOVA) "Fisher's Anova" 또는 "Fisher의 분산 분석"이라고도 합니다.; 이것은 또한 가설 테스트의 일부로 Fisher의 F 분포(확률 분포)를 사용하기 때문입니다.
분산 분석(ANOVA) 선형 회귀의 개념에서 발생. 통계에서 선형 회귀는 다음 간의 종속 관계를 근사화하는 데 사용되는 수학적 모델입니다. 종속변수 Y(예: 불안), 독립변수 Xi(예: 다른 치료) 및 용어 무작위.
- 당신은 관심이있을 수 있습니다: "정규 분포: 그것이 무엇인지, 통계의 특성 및 예"
이 매개변수 테스트의 기능
따라서 분산 분석(ANOVA) 다른 치료법(예: 심리 치료)이 유의미한 차이를 보이는지 여부를 결정하는 역할을 합니다., 또는 반대로 평균 모집단이 다르지 않음을 확인할 수 있는 경우(실제로 동일하거나 차이가 크지 않음).
즉, ANOVA는 평균 차이(항상 2개 이상)에 대한 가설을 테스트하는 데 사용됩니다. ANOVA에는 총 변동성의 분석 또는 분해가 포함됩니다. 이것은 차례로 두 가지 변동 원인에 주로 기인할 수 있습니다.
- 그룹 간 변동성
- 그룹 내 변동성 또는 오류
분산 분석의 유형
분산 분석(ANOVA)에는 두 가지 유형이 있습니다.:
1. 아노바 I
분류기준이 하나만 있는 경우(독립변수; 예를 들어, 치료 기술의 유형). 차례로, 그룹 간(여러 실험 그룹이 있음) 및 그룹 내(실험 그룹이 하나만 있음)일 수 있습니다.
2. 아노바 II
이 경우 둘 이상의 분류 기준(독립변수)이 있습니다. 이전의 경우와 마찬가지로 그룹 간 및 그룹 내일 수 있습니다.
특성 및 가정
분산 분석(ANOVA)이 실험 연구에 적용될 때 각 그룹은 특정 수의 피험자로 구성되며 이 수에서 그룹이 다를 수 있습니다. 주제의 수가 일치할 때 균형 또는 균형 모델을 말합니다..
통계에서 분산 분석(ANOVA)을 적용하려면 다음과 같은 일련의 가정이 충족되어야 합니다.
1. 표준
이는 종속 변수(예: 불안)의 점수가 정규 분포를 따라야 함을 의미합니다. 이 가정 소위 적합도 테스트를 통해 확인됩니다..
2. 독립
이는 점수 사이에 자기상관이 없다는 것, 즉 점수가 서로 독립되어 있음을 의미합니다. 이 가정을 준수하려면 MAS(단순 무작위 샘플링)를 수행해야 합니다. 연구하거나 작업할 샘플을 선택합니다.
3. 등분산성
그 용어 "소집단의 분산의 평등"을 의미합니다.. 분산은 변동성과 분산의 통계이며 점수의 변동성 또는 분산이 클수록 증가합니다.
등분산성 가정은 Levene 또는 Bartlett 테스트를 사용하여 확인됩니다. 이를 충족하지 못하는 경우 또 다른 대안은 점수의 대수 변환을 수행하는 것입니다.
기타 가정
그룹간 분산 분석(ANOVA)을 사용할 때 위의 가정을 충족해야 합니다. 그러나 그룹 내 ANOVA를 사용할 때 위의 가정과 두 가지 이상을 충족해야 합니다.
1. 구형
충족되지 않으면 서로 다른 오류 소스가 서로 관련되어 있음을 나타냅니다.. 이 경우 가능한 솔루션은 MANOVA(다변량 분산 분석)를 수행하는 것입니다.
2. 가산성
주제 x 치료 상호작용이 없다고 가정합니다. 이를 준수하지 않으면 오차 분산이 증가합니다.
참고 문헌:
- Bottle, J., Sueró, M., Ximénez, C. (2012). 심리학에서의 데이터 분석 I. 마드리드: 피라미드.
- 폰테스 데 그라시아, S. 가르시아, C. 퀸타닐라, L. et al. (2010). 심리학의 기초 연구. 마드리드.
- 마르티네즈, M.A. 헤르난데스, M.J. 에르난데스, M.V. (2014). 사이코메트리. 마드리드: 얼라이언스.