P Değeri Nasıl Hesaplanır?

P değeri bilim adamlarına, hipotezlerinin doğru olup olmadığını belirlemelerine yardımcı olan istatistiksel bir ölçüdür. P değerleri, deney sonuçlarının gözlemlenen olaylar için normal değerler aralığında olup olmadığını belirlemek için kullanılır. Genellikle, bir veri kümesinin P değeri önceden belirlenmiş belli bir miktarın altındaysa (0,05 gibi) bilim insanları deneylerinin "sıfır hipotezini" reddeder. Başka bir deyişle, deney değişkenlerinin sonuçlar üzerinde hiç anlamlı etkisi olmadığı hipotezini reddedeceklerdir. Bugün, p değerleri genellikle önce bir ki kare değeri hesaplanarak referans tablosundan bulunur.

AdımlarDüzenleniyor

  1. 1
    Deneyinin beklenen sonuçlarını belirle. Genellikle, bilim adamları bir deney yapıp sonuçları gözlemlerken, "normal" veya "tipik" sonuçların nasıl görüneceği konusunda önceden bir fikirleri olur. Bu, geçmiş deneysel sonuçlara, güvenilir gözlemsel veri kümelerine, bilimsel yayınlara ve/veya diğer kaynaklara dayandırılabilir. Deneyin için, beklenen sonuçlarını belirle ve bunları bir sayı olarak ifade et.
    • Örnek: Diyelim ki daha önce yapılan çalışmalar, ülke genelinde hız cezalarının mavi arabalardan daha çok kırmızı arabalara kesildiğini gösteriyor. Diyelim ki ülke genelinde ortalama sonuçlar kırmızı arabalar için 2:1 oranında bir üstünlük gösteriyor. Biz de, ilçemiz polislerinin de bu ön yargıya sahip olup olmadığını belirlemek için ilçe emniyet müdürlüğü tarafından kesilen hız cezalarını analiz ederek bulmak istiyoruz. İlçemizde kırmızı ya da mavi arabalara verilen 150 hız cezasından oluşan rastgele bir havuz alırsak, eğer ilçe emniyet teşkilatı da ülke genelindeki ön yargıya göre ceza kesiyorsa bu havuzda 100 kırmızı araba ve 50 mavi araba olmasını bekleriz.
  2. 2
    Deneyinin gözlemlenen sonuçlarını belirle. Artık beklenen değerlerini belirlediğine göre, deneyini yapabilir ve gerçek (veya "gözlenen") değerlerini bulabilirsin. Yine, bu sonuçları sayı olarak ifade et. Bazı deney koşullarını değiştirirsek ve gözlemlenen sonuçlar bu beklenen sonuçlardan farklı çıkarsa, iki olasılık mümkündür: bu ya şans eseri oldu ya da deneysel değişkenleri değiştirmemiz farklılığa neden oldu. Bir p değerini bulmanın amacı, gözlemlenen sonuçların beklenen sonuçlardan "sıfır hipotezini" (deneysel değişken(ler) ile gözlemlenen sonuçlar arasında bir ilişki bulunmadığı hipotezi) reddetmek için yeterli olmayacak kadar farklılık gösterip göstermediğini belirlemektir.
    • Örnek: İlçemizde kırmızı veya mavi arabalara kesilen 150 hız cezasını rastgele seçtik diyelim. 90 cezanın kırmızı arabalara, 60 cezanın mavi arabalara kesildiğini bulduk. Bunlar sırasıyla 100 ve 50 şeklindeki beklenen sonuçlarımızdan farklıdır. Sonuçlardaki bu değişime deneysel değişikliğimiz mi neden oldu (bu durumda, verilerimizin kaynağını ülke düzeyinden yerel düzeye değiştirmek), yoksa ilçe polisimiz de ülke ortalamasında olduğu gibi ön yargılı ve sadece rastgele bir değişiklik mi gözlemliyoruz? Bir p değeri, bunu belirlememize yardımcı olacak.
  3. 3
    Deneyinin serbestlik derecelerini belirle. Serbestlik dereceleri, araştırmaya dâhil olan, incelediğin kategori sayısına göre belirlenen değişkenlik miktarının bir ölçüsüdür. Serbestlik derecesi denklemi, Serbestlik derecesi = n-1’dir. Burada "n", deneyinde analiz edilen kategori veya değişkenlerin sayısıdır.
    • Örnek: Deneyimizin iki sonuç kategorisi var: biri kırmızı araçlar, diğeri mavi araçlar. Dolayısıyla deneyimizde, 2-1 = 1 serbestlik derecemiz var. Kırmızı, mavi ve yeşil arabaları karşılaştırmış olsaydık, 2 serbestlik derecesine sahip olurduk vb.
  4. 4
    Beklenen sonuçlarla gözlenen sonuçları ki kare ile karşılaştır. Ki kare ("x2"), bir deneyin beklenen ve gözlenen değerleri arasındaki farkı ölçen sayısal bir değerdir. Ki kare denklemi: x2 = Σ((o-e)2/e). Burada "o" gözlemlenen değer, "e" beklenen değerdir.[1] Tüm olası sonuçlar için bu denklemin sonuçlarını topla (aşağıya bak).
    • Bu denklemde bir Σ (sigma) operatörü bulunduğunu unutma. Başka bir deyişle, her olası sonuç için ((|o-e|-.05)2/e) hesabını yapman, ardından ki kare değerini elde etmek için sonuçları toplaman gerekecek. Örneğimizde iki sonucumuz var; ceza kesilen araba ya kırmızıdır ya da mavi. Böylece, ((o-e)2/e) hesabını iki kez yapacağız; kırmızı arabalar için bir kez ve mavi arabalar için bir kez.
    • Örnek: Beklenen ve gözlenen değerleri x2 = Σ((o-e)2/e) denkleminde yerine koyalım. Sigma operatörü nedeniyle, iki kez ((o-e)2/e) işlemini yapmak gerekeceğini unutma; bir kez kırmızı arabalar için ve bir kez mavi arabalar için. İşlemlerimiz şöyle olacak:
      • x2 = ((90-100)2/100) + (60-50)2/50)
      • x2 = ((-10)2/100) + (10)2/50)
      • x2 = (100/100) + (100/50) = 1 + 2 = 3.
  5. 5
    Bir anlamlılık düzeyi seç. Artık deneyimizin serbestlik derecesini ve ki kare değerimizi bildiğimize göre, p değerimizi bulmadan önce yapmamız gereken son bir şey var; anlamlılık düzeyine karar vermek. Anlamlılık düzeyi, sonuçlarımız hakkında ne kadar kesin olmak istediğimizin bir ölçüsüdür; düşük anlamlılık düzeyleri düşük bir olasılığa karşılık gelir, yani deneysel sonuçlar tesadüfen meydana gelmiştir veya tam tersi. Anlamlılık düzeyi ondalık sayı olarak yazılır (0,01 gibi) ve bu da, kitlelerde temel bir fark olmaması durumunda rastgele örneklemenin gözlemlediğin kadar büyük bir fark üreteceği şans yüzdesine karşılık gelir.
    • p=0,01 olmasının, sonuçların bilim insanının deney değişkenlerini değiştirilmesinden kaynaklanma ihtimalinin %99 olduğu anlamına geldiği de yaygın bir yanılgıdır.[2] Durum bu DEĞİL. Şanslı pantolonunu yedi farklı günde giydiysen ve borsa o günlerin her birinde yükseldiyse p<0,01 olur ama sonucun piyasa ve pantolonun arasındaki bağlantıdan ziyade tesadüfen elde edildiğine inanmakta haklısın.
    • Genel kabul olarak, bilim insanları genellikle deneyleri için anlamlılık düzeyini 0,05 ya da %5 olarak belirlerler.[3] Yani, bu anlamlılık düzeyini karşılayan deneysel sonuçların, rastgele bir örnekleme işlemiyle yinelenme şansı en fazla %5’tir. Çoğu deney için, rastgele örnekleme işlemiyle üretilmesi muhtemel olmayan sonuçların üretilmesi "başarılı" olarak görülür ve deney değişkenindeki değişiklik ile gözlemlenen etki arasındaki korelasyonu gösterir.
    • Örnek: Kırmızı ve mavi araba örneğimiz için bilimsel metodu izleyelim ve anlamlılık düzeyimizi 0,05 olarak belirleyelim.
  6. 6
    P değerini yaklaşık olarak belirlemek için ki kare dağılım tablosu kullan. Bilim adamları ve istatistikçiler, deneyleri için p değerini hesaplarken büyük değer tabloları kullanırlar. Bu tablolar genellikle soldaki serbestlik derecelerine karşılık gelen dikey eksen ve p değerine karşılık gelen üstteki yatay eksen ile kurulur. Önce serbestlik dereceni bularak bu tabloları kullan, ardından ilk değerini ki kare değerinden daha büyük bulana kadar o satırı soldan sağa doğru oku. Sütunun üstündeki karşılık gelen p değerine bak; p değerin bu değer ile bir sonraki en büyük değer arasındadır (hemen solundaki değer).
    • Ki kare dağılım tabloları çeşitli kaynaklarda mevcut; internet üzerinden veya fen ve istatistik ders kitaplarında kolayca bulunabilirler. Elinin altında yoksa, yukarıdaki fotoğraf üzerindekini ya da medcalc.org tarafından sağlanan ve buradan ulaşabileceğin tablo gibi, internetteki ücretsiz bir tabloyu kullan.
    • Örnek: Ki karemiz 3 idi. Öyleyse, yaklaşık p değerini bulmak için yukarıdaki fotoğrafta yer alan ki kare dağılım tablosunu kullanalım. Deneyimizin yalnızca 1 serbestlik derecesine sahip olduğunu bildiğimizden, en üst sıradan başlayacağız. 3’ten (ki kare değerimiz) daha yüksek bir değer bulana dek bu satır boyunca soldan sağa gideceğiz. İlk karşılaştığımız değer 3,84. Bu sütunun en üstüne baktığımızda, karşılık gelen p değerinin 0,05 olduğunu görürüz. Bu, p değerimizin 0,05 ile 0,1 arasında olduğu anlamına gelir (tablodaki bir sonraki en büyük p değeri).
  7. 7
    Sıfır hipotezini reddetme veya koruma konusunda karar ver. Deneyin için yaklaşık bir p değeri bulduğundan, deneyinin sıfır hipotezini reddedip reddetmemeye karar verebilirsin (bir hatırlatma olarak bu, değiştirdiğin deneysel değişkenlerin gözlemlediğin sonuçları etkilemediği hipotezdir). Eğer p değerin anlamlılık değerinden düşükse, tebrikler; değiştirdiğin değişkenler ile gözlemlediğin etki arasında gerçek bir bağlantı yoksa deneysel sonuçlarının ortaya çıkmama ihtimalinin yüksek olduğunu gösterdin. P değerin anlamlılık değerinden yüksek ise emin bir şekilde bu iddiada bulunamazsın.
    • Örnek: p değerimiz 0,05 ile 0,1 arasındadır. 0,05'ten küçük değil, bu yüzden ne yazık ki sıfır hipotezimizi reddedemeyiz. Bu, ilçe polisinin ülke ortalamasından çok farklı bir oranda kırmızı ve mavi arabalara ceza kestiğini söyleyebilmemiz için karar verdiğimiz kritere ulaşmadığımız anlamına geliyor.
    • Başka bir deyişle, ulusal verilerden rastgele örnekleme yapıldığında %5-10 oranında ulusal ortalamadan 10 ceza daha farklı sonuç verecektir. Bu oranın %5'ten az olmasını aradığımız için, ilçe polisinin kırmızı arabalara karşı daha az ön yargılı olduğundan emin olduğumuzu söyleyemeyiz.
    Advertisement

İpuçlarıDüzenleniyor

  • Bilimsel bir hesap makinesi, hesaplamayı çok daha kolay hale getirecektir. Ayrıca internette de hesap makineleri bulabilirsin.
  • P değerini, yaygın olarak kullanılan elektronik tablo ve daha özel istatistiksel yazılımlarla hesaplayabilirsin.

Bu makale işine yaradı mı?

Evet
Hayır
Advertisement