Education, study and knowledge

การทดสอบ Kolmogorov-Smirnov: มันคืออะไรและใช้อย่างไรในสถิติ

ในทางสถิติ การทดสอบแบบพาราเมตริกและแบบไม่อิงพาราเมตริกนั้นเป็นที่รู้จักและใช้กันดี การทดสอบแบบไม่ใช้พารามิเตอร์ที่ใช้กันอย่างแพร่หลายคือการทดสอบคอลโมโกรอฟ-สเมียร์นอฟซึ่งช่วยให้เราสามารถตรวจสอบได้ว่าคะแนนตัวอย่างเป็นไปตามการแจกแจงแบบปกติหรือไม่

อยู่ในกลุ่มของการทดสอบความพอดี ในบทความนี้เราจะทราบลักษณะของมัน มีไว้เพื่ออะไร และนำไปใช้อย่างไร

  • บทความที่เกี่ยวข้อง: "การทดสอบไคสแควร์ (χ²): คืออะไรและใช้อย่างไรในสถิติ"

การทดสอบแบบไม่อิงพารามิเตอร์

การทดสอบ Kolmogorov-Smirnov คือ ประเภทของการทดสอบแบบไม่อิงพารามิเตอร์. การทดสอบแบบไม่อิงพารามิเตอร์ (หรือที่เรียกว่าการแจกฟรี) ใช้ในสถิติเชิงอนุมาน และมีลักษณะดังต่อไปนี้:

  • พวกเขาเสนอสมมติฐานเกี่ยวกับความพอดี ความเป็นอิสระ...
  • ระดับการวัดของตัวแปรอยู่ในระดับต่ำ (ลำดับ)
  • พวกเขาไม่มีข้อ จำกัด มากเกินไป
  • ใช้ได้กับตัวอย่างขนาดเล็ก
  • พวกเขาแข็งแกร่ง

การทดสอบ Kolmogorov-Smirnov: ลักษณะเฉพาะ

การทดสอบKolmogórov-Smirnov เป็นหนึ่งในการทดสอบทางสถิติโดยเฉพาะ สถิติเชิงอนุมาน. สถิติเชิงอนุมานมีวัตถุประสงค์เพื่อดึงข้อมูลเกี่ยวกับประชากร

มันคือ การทดสอบความพอดีนั่นคือใช้เพื่อตรวจสอบว่าคะแนนที่เราได้รับจากตัวอย่างเป็นไปตามการแจกแจงแบบปกติหรือไม่ นั่นคือช่วยให้สามารถวัดระดับของข้อตกลงระหว่างการกระจายของชุดข้อมูลและการแจกแจงทางทฤษฎีที่เฉพาะเจาะจงได้ มีวัตถุประสงค์เพื่อระบุว่าข้อมูลมาจากประชากรที่มีการแจกแจงตามทฤษฎีที่ระบุหรือไม่ นั่นคือ กล่าวอีกนัยหนึ่งคือการทดสอบว่าการสังเกตอาจมาจากการแจกแจงอย่างสมเหตุสมผลหรือไม่ ระบุไว้

instagram story viewer

การทดสอบ Kolmogorov-Smirnov ตอบคำถามต่อไปนี้: การสังเกตตัวอย่างมาจากการแจกแจงตามสมมติฐานหรือไม่?

สมมติฐานว่างและสมมติฐานทางเลือก

ในฐานะที่เป็นแบบทดสอบความพอดี มันตอบคำถาม: "การแจกแจงตัวอย่าง (เชิงประจักษ์) เหมาะสมกับการแจกแจงประชากร (เชิงทฤษฎี) หรือไม่" ในกรณีนี้, สมมติฐานว่าง (H0) จะระบุว่าการแจกแจงเชิงประจักษ์นั้นคล้ายคลึงกับทฤษฎี (สมมติฐานว่างคือสมมติฐานที่ไม่ได้พยายามที่จะถูกปฏิเสธ) กล่าวอีกนัยหนึ่ง สมมติฐานว่างจะกำหนดว่าการแจกแจงความถี่ที่สังเกตได้นั้นสอดคล้องกับการแจกแจงเชิงทฤษฎี (และเหมาะสมอย่างยิ่ง)

ในทางตรงกันข้าม สมมติฐานทางเลือก (H1) จะระบุว่าการแจกแจงความถี่ที่สังเกตได้นั้นไม่สอดคล้องกับการแจกแจงตามทฤษฎี (พอดี) เช่นเดียวกับการทดสอบคอนทราสต์ของสมมติฐานอื่นๆ สัญลักษณ์ α (อัลฟ่า) จะแสดงระดับความสำคัญของการทดสอบ

  • คุณอาจจะสนใจ: "ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน: มันคืออะไรและใช้อย่างไร"

มันคำนวณอย่างไร?

ผลลัพธ์ของการทดสอบ Kolmogorov-Smirnov แสดงด้วยตัวอักษร Z Z คำนวณจากผลต่างที่มากที่สุด (ในค่าสัมบูรณ์) ระหว่างฟังก์ชันการแจกแจงสะสมเชิงทฤษฎีและเชิงสังเกต (เชิงประจักษ์).

สมมติฐาน

เพื่อใช้การทดสอบ Kolmogorov-Smirnov อย่างถูกต้อง จะต้องตั้งสมมติฐานหลายชุด ประการแรกการทดสอบ ถือว่าพารามิเตอร์ของการแจกแจงการทดสอบได้รับการระบุไว้ก่อนหน้านี้. ขั้นตอนนี้ประเมินค่าพารามิเตอร์จากตัวอย่าง

ในทางกลับกัน, ค่าเฉลี่ยตัวอย่างและส่วนเบี่ยงเบนมาตรฐานเป็นพารามิเตอร์ของการแจกแจงแบบปกติ, ค่าต่ำสุดและสูงสุดของตัวอย่างกำหนดช่วงของการแจกแจงแบบสม่ำเสมอ, ค่าเฉลี่ยตัวอย่าง เป็นพารามิเตอร์ของการแจกแจงปัวซองและค่าเฉลี่ยตัวอย่างคือพารามิเตอร์ของการแจกแจง ชี้แจง

ความสามารถของการทดสอบ Kolmogorov-Smirnov ในการตรวจจับการเบี่ยงเบนจากการแจกแจงที่ตั้งสมมติฐานจะลดลงอย่างมาก เพื่อเปรียบเทียบกับการแจกแจงแบบปกติด้วยพารามิเตอร์โดยประมาณ ควรพิจารณาถึงความเป็นไปได้ในการใช้การทดสอบ KS Lillliefors.

แอปพลิเคชัน

การทดสอบ Kolmogorov-Smirnov สามารถนำไปใช้กับกลุ่มตัวอย่างเพื่อตรวจสอบว่าตัวแปร (เช่น เกรดการศึกษาหรือรายได้ยูโร) มีการแจกแจงตามปกติหรือไม่ บางครั้งสิ่งนี้จำเป็นต้องรู้ เนื่องจากการทดสอบพาราเมตริกจำนวนมากต้องการให้ตัวแปรที่ใช้เป็นไปตามการแจกแจงแบบปกติ

ข้อดี

บางส่วนของ ข้อดีของการทดสอบ Kolmogorov-Smirnov เป็น:

  • มีประสิทธิภาพมากกว่าการทดสอบไคสแควร์ (χ²) (เช่นเดียวกับการทดสอบความพอดี)
  • ง่ายต่อการคำนวณและใช้งาน และไม่ต้องจัดกลุ่มข้อมูล
  • สถิตินี้ไม่ขึ้นอยู่กับการแจกแจงความถี่ที่คาดไว้ โดยจะขึ้นอยู่กับขนาดตัวอย่างเท่านั้น

ความแตกต่างกับการทดสอบพาราเมตริก

การทดสอบแบบพาราเมตริก ซึ่งแตกต่างจากการทดสอบแบบไม่อิงพารามิเตอร์ เช่น การทดสอบคอลโมโกรอฟ-สเมียร์นอฟ มีลักษณะดังต่อไปนี้:

  • พวกเขาตั้งสมมติฐานเกี่ยวกับพารามิเตอร์
  • ระดับการวัดของตัวแปรเป็นเชิงปริมาณเป็นอย่างน้อย
  • มีข้อสันนิษฐานหลายประการที่ต้องปฏิบัติตาม
  • พวกเขาไม่สูญเสียข้อมูล
  • พวกเขามีพลังทางสถิติสูง

ตัวอย่างของการทดสอบพาราเมตริก จะเป็น: t-test สำหรับความแตกต่างของค่าเฉลี่ยหรือ ANOVA

10 อันดับจุดหมายปลายทางยอดนิยมสำหรับการเดินทางแบบครอบครัว

10 อันดับจุดหมายปลายทางยอดนิยมสำหรับการเดินทางแบบครอบครัว

ข้อเสนอของสถานที่ท่องเที่ยวในช่วงวันหยุดเพิ่มมากขึ้น และด้วยเหตุนี้จึงเป็นเรื่องยากที่จะเลือกตัวเ...

อ่านเพิ่มเติม

6 ตัวอย่างปัญญาประดิษฐ์ที่ใช้กับสังคม

เป็นความจริงที่ว่าปัญญาประดิษฐ์อยู่ในหมู่พวกเราแล้ว มันไม่ใช่อย่างที่มันแสดงในภาพยนตร์นิยายวิทยาศ...

อ่านเพิ่มเติม

การยศาสตร์: มันคืออะไรและ 4 ประเภทและหน้าที่ของมันคืออะไร

ลองนึกภาพว่าเราทำงานในสำนักงานแปดชั่วโมงต่อวันหน้าคอมพิวเตอร์ แต่บริษัทนั้นวางหน้าจอคอมพิวเตอร์ไว...

อ่านเพิ่มเติม