การทดสอบ Kolmogorov-Smirnov: มันคืออะไรและใช้อย่างไรในสถิติ
ในทางสถิติ การทดสอบแบบพาราเมตริกและแบบไม่อิงพาราเมตริกนั้นเป็นที่รู้จักและใช้กันดี การทดสอบแบบไม่ใช้พารามิเตอร์ที่ใช้กันอย่างแพร่หลายคือการทดสอบคอลโมโกรอฟ-สเมียร์นอฟซึ่งช่วยให้เราสามารถตรวจสอบได้ว่าคะแนนตัวอย่างเป็นไปตามการแจกแจงแบบปกติหรือไม่
อยู่ในกลุ่มของการทดสอบความพอดี ในบทความนี้เราจะทราบลักษณะของมัน มีไว้เพื่ออะไร และนำไปใช้อย่างไร
- บทความที่เกี่ยวข้อง: "การทดสอบไคสแควร์ (χ²): คืออะไรและใช้อย่างไรในสถิติ"
การทดสอบแบบไม่อิงพารามิเตอร์
การทดสอบ Kolmogorov-Smirnov คือ ประเภทของการทดสอบแบบไม่อิงพารามิเตอร์. การทดสอบแบบไม่อิงพารามิเตอร์ (หรือที่เรียกว่าการแจกฟรี) ใช้ในสถิติเชิงอนุมาน และมีลักษณะดังต่อไปนี้:
- พวกเขาเสนอสมมติฐานเกี่ยวกับความพอดี ความเป็นอิสระ...
- ระดับการวัดของตัวแปรอยู่ในระดับต่ำ (ลำดับ)
- พวกเขาไม่มีข้อ จำกัด มากเกินไป
- ใช้ได้กับตัวอย่างขนาดเล็ก
- พวกเขาแข็งแกร่ง
การทดสอบ Kolmogorov-Smirnov: ลักษณะเฉพาะ
การทดสอบKolmogórov-Smirnov เป็นหนึ่งในการทดสอบทางสถิติโดยเฉพาะ สถิติเชิงอนุมาน. สถิติเชิงอนุมานมีวัตถุประสงค์เพื่อดึงข้อมูลเกี่ยวกับประชากร
มันคือ การทดสอบความพอดีนั่นคือใช้เพื่อตรวจสอบว่าคะแนนที่เราได้รับจากตัวอย่างเป็นไปตามการแจกแจงแบบปกติหรือไม่ นั่นคือช่วยให้สามารถวัดระดับของข้อตกลงระหว่างการกระจายของชุดข้อมูลและการแจกแจงทางทฤษฎีที่เฉพาะเจาะจงได้ มีวัตถุประสงค์เพื่อระบุว่าข้อมูลมาจากประชากรที่มีการแจกแจงตามทฤษฎีที่ระบุหรือไม่ นั่นคือ กล่าวอีกนัยหนึ่งคือการทดสอบว่าการสังเกตอาจมาจากการแจกแจงอย่างสมเหตุสมผลหรือไม่ ระบุไว้
การทดสอบ Kolmogorov-Smirnov ตอบคำถามต่อไปนี้: การสังเกตตัวอย่างมาจากการแจกแจงตามสมมติฐานหรือไม่?
สมมติฐานว่างและสมมติฐานทางเลือก
ในฐานะที่เป็นแบบทดสอบความพอดี มันตอบคำถาม: "การแจกแจงตัวอย่าง (เชิงประจักษ์) เหมาะสมกับการแจกแจงประชากร (เชิงทฤษฎี) หรือไม่" ในกรณีนี้, สมมติฐานว่าง (H0) จะระบุว่าการแจกแจงเชิงประจักษ์นั้นคล้ายคลึงกับทฤษฎี (สมมติฐานว่างคือสมมติฐานที่ไม่ได้พยายามที่จะถูกปฏิเสธ) กล่าวอีกนัยหนึ่ง สมมติฐานว่างจะกำหนดว่าการแจกแจงความถี่ที่สังเกตได้นั้นสอดคล้องกับการแจกแจงเชิงทฤษฎี (และเหมาะสมอย่างยิ่ง)
ในทางตรงกันข้าม สมมติฐานทางเลือก (H1) จะระบุว่าการแจกแจงความถี่ที่สังเกตได้นั้นไม่สอดคล้องกับการแจกแจงตามทฤษฎี (พอดี) เช่นเดียวกับการทดสอบคอนทราสต์ของสมมติฐานอื่นๆ สัญลักษณ์ α (อัลฟ่า) จะแสดงระดับความสำคัญของการทดสอบ
- คุณอาจจะสนใจ: "ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน: มันคืออะไรและใช้อย่างไร"
มันคำนวณอย่างไร?
ผลลัพธ์ของการทดสอบ Kolmogorov-Smirnov แสดงด้วยตัวอักษร Z Z คำนวณจากผลต่างที่มากที่สุด (ในค่าสัมบูรณ์) ระหว่างฟังก์ชันการแจกแจงสะสมเชิงทฤษฎีและเชิงสังเกต (เชิงประจักษ์).
สมมติฐาน
เพื่อใช้การทดสอบ Kolmogorov-Smirnov อย่างถูกต้อง จะต้องตั้งสมมติฐานหลายชุด ประการแรกการทดสอบ ถือว่าพารามิเตอร์ของการแจกแจงการทดสอบได้รับการระบุไว้ก่อนหน้านี้. ขั้นตอนนี้ประเมินค่าพารามิเตอร์จากตัวอย่าง
ในทางกลับกัน, ค่าเฉลี่ยตัวอย่างและส่วนเบี่ยงเบนมาตรฐานเป็นพารามิเตอร์ของการแจกแจงแบบปกติ, ค่าต่ำสุดและสูงสุดของตัวอย่างกำหนดช่วงของการแจกแจงแบบสม่ำเสมอ, ค่าเฉลี่ยตัวอย่าง เป็นพารามิเตอร์ของการแจกแจงปัวซองและค่าเฉลี่ยตัวอย่างคือพารามิเตอร์ของการแจกแจง ชี้แจง
ความสามารถของการทดสอบ Kolmogorov-Smirnov ในการตรวจจับการเบี่ยงเบนจากการแจกแจงที่ตั้งสมมติฐานจะลดลงอย่างมาก เพื่อเปรียบเทียบกับการแจกแจงแบบปกติด้วยพารามิเตอร์โดยประมาณ ควรพิจารณาถึงความเป็นไปได้ในการใช้การทดสอบ KS Lillliefors.
แอปพลิเคชัน
การทดสอบ Kolmogorov-Smirnov สามารถนำไปใช้กับกลุ่มตัวอย่างเพื่อตรวจสอบว่าตัวแปร (เช่น เกรดการศึกษาหรือรายได้ยูโร) มีการแจกแจงตามปกติหรือไม่ บางครั้งสิ่งนี้จำเป็นต้องรู้ เนื่องจากการทดสอบพาราเมตริกจำนวนมากต้องการให้ตัวแปรที่ใช้เป็นไปตามการแจกแจงแบบปกติ
ข้อดี
บางส่วนของ ข้อดีของการทดสอบ Kolmogorov-Smirnov เป็น:
- มีประสิทธิภาพมากกว่าการทดสอบไคสแควร์ (χ²) (เช่นเดียวกับการทดสอบความพอดี)
- ง่ายต่อการคำนวณและใช้งาน และไม่ต้องจัดกลุ่มข้อมูล
- สถิตินี้ไม่ขึ้นอยู่กับการแจกแจงความถี่ที่คาดไว้ โดยจะขึ้นอยู่กับขนาดตัวอย่างเท่านั้น
ความแตกต่างกับการทดสอบพาราเมตริก
การทดสอบแบบพาราเมตริก ซึ่งแตกต่างจากการทดสอบแบบไม่อิงพารามิเตอร์ เช่น การทดสอบคอลโมโกรอฟ-สเมียร์นอฟ มีลักษณะดังต่อไปนี้:
- พวกเขาตั้งสมมติฐานเกี่ยวกับพารามิเตอร์
- ระดับการวัดของตัวแปรเป็นเชิงปริมาณเป็นอย่างน้อย
- มีข้อสันนิษฐานหลายประการที่ต้องปฏิบัติตาม
- พวกเขาไม่สูญเสียข้อมูล
- พวกเขามีพลังทางสถิติสูง
ตัวอย่างของการทดสอบพาราเมตริก จะเป็น: t-test สำหรับความแตกต่างของค่าเฉลี่ยหรือ ANOVA