Güvenilirlik ve geçerlilik arasındaki 4 fark (bilimde)

Konuşma dilinde çok benzer anlamlara sahip olduklarından, bilim ve özellikle de psikometri hakkında konuşurken güvenilirlik ve geçerlilik terimlerini karıştırmak kolaydır.

Bu metinle konuyu aydınlatmak niyetindeyiz. güvenilirlik ve geçerlilik arasındaki temel farklar. Bu yaygın soruya açıklık getirmeyi faydalı bulacağınızı umuyoruz.

İlgili yazı: "Psikometri: insan zihnini veriler aracılığıyla incelemek"

Güvenilirlik nedir?

Psikometride "güvenilirlik" kavramı bir aletin hassasiyetini ifade eder; Spesifik olarak, güvenilirlik katsayıları, söz konusu araçla alınan ölçümlerin tutarlılığı ve kararlılığı hakkında bize bilgi verir.

Bir aracın güvenilirliği ne kadar yüksek olursa, onu belirli özellikleri ölçmek için kullanırken ortaya çıkacak rastgele ve öngörülemeyen hatalar o kadar az olur. Güvenilirlik, öngörülebilir hataları, yani deneysel kontrole tabi olanları hariç tutar.

Klasik test teorisine göre güvenirlik, varyansın gerçek puanlarla açıklanan oranıdır. Böylece, bir testteki doğrudan puan, rastgele hata ile gerçek puanın toplamından oluşacaktır.

instagram story viewer

Güvenilirliğin iki ana bileşeni zamansal kararlılık ve iç tutarlılıktır. İlk kavram, puanların farklı durumlarda ölçüldüğünde çok az değiştiğini belirtirken, İç tutarlılık, testi oluşturan maddelerin aynı yapıyı ölçme derecesini ifade eder. psikolojik.

Bu nedenle, yüksek bir güvenilirlik katsayısı, bir testteki puanların dahili olarak ve zamanın bir fonksiyonu olarak çok az dalgalanma gösterdiğini ve kısacası, enstrüman ölçüm hatası içermez.

İlginizi çekebilir: "Psikolojik test türleri: işlevleri ve özellikleri"

geçerlilik tanımı

Geçerlilikten bahsettiğimizde, testin ölçmeyi amaçladığı yapıyı doğru bir şekilde ölçüp ölçmediğini kastediyoruz. Bu kavram şu şekilde tanımlanır: bir testte elde edilen puan ile ilgili başka bir ölçüm arasındaki ilişki; her iki öğe arasındaki doğrusal korelasyon derecesi, geçerlilik katsayısını belirler.

Aynı şekilde bilimsel araştırmalarda yüksek geçerlilik, belirli bir araçla veya bir çalışmada elde edilen sonuçların genellenebilme derecesini gösterir.

Hesaplanma şekline bağlı olarak farklı geçerlilik türleri vardır; Bu, çok farklı anlamlara sahip bir terim olduğu anlamına gelir. Temel olarak ayırt edebiliriz içerik geçerliliği, ölçüt (veya ampirik) geçerlilik ve yapı geçerliliği.

İçerik geçerliliği, bir psikometrik testin maddelerinin ne ölçüde değerlendirilecek yapıyı oluşturan unsurların temsili bir örneği olduğunu tanımlar. Araç, yapının tüm temel yönlerini içermelidir; Örneğin, depresyonu ölçmek için yeterli bir test yapmak istiyorsak, ruh halini ve azalan zevki değerlendiren maddeleri mutlaka dahil etmeliyiz.

Ölçüt geçerliliği, aracın özellik veya ilgi alanıyla ilgili yönleri tahmin etme yeteneğini ölçer. Son olarak, yapı geçerliliği, Testin ölçmeyi amaçladığı şeyi ölçüp ölçmediğini belirlemek, örneğin benzer testlerde elde edilen puanların yakınsamasından.

Güvenilirlik ve geçerlilik arasındaki farklar

Bu iki psikometrik özellik yakından ilişkili olsa da, gerçek şu ki, açıkça farklılaştırılmış yönlere atıfta bulunuyorlar. Bakalım bu farklılıklar neler içeriyor.

1. analiz nesnesi

Güvenilirlik, onu oluşturan öğelerin özelliklerini ölçmesi anlamında aracın bir özelliğidir. Öte yandan, geçerlilik tam olarak araca atıfta bulunmaz, daha çok araca atıfta bulunur. sonuçlardan yapılan genellemeler aracılığıyla elde edilir.

2. Sağladıkları bilgiler

Biraz basit bir ifade şekli olsa da, genel anlamda geçerliliğin, bir aracın psikometrik aslında ölçmeyi amaçladığı yapıyı ölçerken, güvenilirlik onu doğru bir şekilde ölçüp ölçmediğine atıfta bulunur. hatalar

3. Hesaplanma şekli

Güvenilirliği ölçmek için üç ana prosedür kullanılır: iki yarım yöntemi, paralel formlar yöntemi ve test-tekrar test. En yaygın kullanılanı, test cevaplandıktan sonra maddelerin iki gruba ayrıldığı iki yarı prosedürüdür; daha sonra iki yarı arasındaki korelasyon analiz edilir.

Paralel veya alternatif formlar yöntemi, maddelerin birbiriyle ne ölçüde ilişkili olduğunu ölçmek için iki eşdeğer test oluşturmaktan oluşur. Test-tekrar test, testi olabildiğince benzer koşullarda iki kez geçmeye dayanır. Her iki prosedür de birleştirilerek, testin ilk formu ile ikincisi arasında bir zaman aralığı bırakılmasından oluşan paralel formlarla test-tekrar teste yol açar.

Öte yandan, geçerlilik türüne bağlı olarak farklı şekillerde hesaplanır., ancak genel olarak tüm yöntemler, objektif testteki puan ile benzer özelliklerle ilgili olarak aynı deneklerden alınan diğer veriler arasındaki karşılaştırmaya dayanır; amaç, testin özelliğin bir öngörücüsü olarak hareket edebilmesidir.

Geçerliliği değerlendirmek için kullanılan yöntemler arasında faktör analizi ve çok yöntemli çok özellikli matris tekniğini buluyoruz. Benzer şekilde, içerik geçerliliği sıklıkla istatistiksel değil, rasyonel analizle belirlenir; örneğin, testin geçerliliği konusunda uzmanların sübjektif yargısına atıfta bulunan görünüş geçerliliğini içerir.

4. Her iki kavram arasındaki ilişki

Bir psikometrik aracın güvenilirliği geçerliliğini etkiler: ne kadar güvenilirse geçerliliği de o kadar yüksek olacaktır.. Bu nedenle, bir aracın geçerlilik katsayıları her zaman güvenilirlik katsayılarından daha düşüktür ve geçerlilik dolaylı olarak bize güvenilirlik hakkında bilgi verir.