24 Mayıs 2015 Pazar

HDP'yi %10,5 veya %9,5 gösteren anketler bize ne söylüyor?

İçinde yaşadığımız çağın "okur-yazarı" olma şartlarından biri, temel istatistik bilgisine sahip olmak. İşte, 7 Haziran seçimlerine doğru, bir sürü anket yayınlanıyor ve anketlere bakılarak HDP'nin barajı geçip geçemeyeceği üzerinde ahkam kesiliyor.

Öncelikle, anketlerdeki sonuçların birbirinden farklı mahiyetleri olan "hata"larla malül olduğunu hatırlamamız lazım. Bunların en başında, "istatistiksel örnekleme" hatası geliyor. Anket firması, anketörler, sorulan sorular vs hepsi aynı olsa bile, kaçınılmaz şekilde ortaya çıkan bir hatadan, veya sapmadan söz ediyoruz.

Anket yaptığımızda, milyonlarca seçmenin nasıl oy kullanacağını, bu seçmen kümesinin çok küçük bir bölümünün verdiği cevaplarla kestirmeye çalışıyoruz. Seçimden söz edecek olursak, YSK verilerine göre yurtiçinde 53.741.838 kayıtlı seçmen var. Anketler bu seçmenlerin davranışını, 1500, 2000, 3000, hadi diyelim 5000 denekle ölçmeye çalışıyorlar. En iyi ihtimalle, 1000de 1lik bir örneklemeyle çalışıyorlar.

İstatistiksel hata, işte şu demek. Bir anket firması, bütün parametreler aynı olaraktan yaptığı bir anketi tekrarlasa, partilerin oy oranlarını tam tamına aynı şekilde bulmayacaktır. Diyelim SONAR, 3000 denekle bir anket yaptı ve Ak Parti'nin oy oranını %43 buldu. SONAR, başka 3000 kişiye aynı anketi uygulasaydı, Ak Parti'nin oy oranını belki %45 bulacaktı. Aynı anketi bir üçüncü kez tekrarlasa, Ak Parti'nin oy oranını belki %41 bulacaktı.

İşte istatistik, bu noktada devreye giriyor. Bir anket firması partilerin oy oranlarını bulmak için N kişiyle anket yapıyor olsun ve Y partisinin oylarını %y buluyor olsun. Bu anket firması bu anketi 100 kere tekrarlasaydı, 95'inde bu %x'ten en fazla ne kadar sapma olacağını veren formül şu:

Sapma = 1,96 * karekök (y * (1-y) /N)

Veya, Sapma'yı S ile gösterecek olursam:


Yukarıdaki örneğe dönecek olursam, eğer SONAR'ın 3000 denekle Ak Parti'yi %43 bulmasından söz ediyorsak, bu sonuca eşlik eden istatistiksel sapma şudur:


Hesabı yaptığımızda, sapmayı %1,77 buluruz. Bunun anlamı şudur. SONAR'ın anketinde Ak Parti'nin oyu, %95 ihtimalle, %43'ün 1,77 puan altında veya üstünde kalan aralık içindedir, yani %95 ihtimalle %41,23 ila %44,77 arasındadır. Eğer yarın seçimde Ak Parti %44,5 oy alacak olursa SONAR pekala, "Ak Parti'nin oyu bizim anketimizin istatistiksel hata payı içinde çıkmıştır" diyebilir ve haklıdır.

Burada, elimizdeki denklemin parametreleri üstünde tek tek konuşalım.
1. İstatistiksel hata payını azaltmanın en kolay yolu, denek sayısını arttırmaktan geçiyor. Denek sayısı 3000 değil de 5000 olsaydı, hata payı %1,37ye inecekti.

2. Hata payında, ölçtüğümüz yüzde oranın büyüklüğünün de etkisi var. Aşağıda, Ak Parti, CHP ve HDP'nin muhtemel oy oranı olarak verilen üç değer için hata paylarının denek sayısına göre nasıl değiştiğini görelim.

Oy oranı
43,00%
Oy oranı
25,00%
Oy oranı
9,50%
Denek sayısı
Hata payı
Denek sayısı
Hata payı
Denek sayısı
Hata payı
1.000
3,07%
1.000
2,68%
1.000
1,82%
3.000
1,77%
3.000
1,55%
3.000
1,05%
5.000
1,37%
5.000
1,20%
5.000
0,81%
10.000
0,97%
10.000
0,85%
10.000
0,57%


3000 denekli bir ankette, %43 olarak ölçülen Ak Parti oy oranı için hata payı %1,77 iken, %9,50 olarak ölçülen HDP oy oranı için hata payı %1,05.

3. Denek sayısını arttırmak bir noktadan sonra pek bir işe yaramıyor. Ama denek sayısını arttırmanın ciddi bir maliyet yükü var. 3000 denekli bir anket 10 bin liraya mal oluyorsa, 10000 denekli bir anket daha pahalıya, diyelim 20 bin liraya  mal olacaktır. Yine de hata payı elimine olmayacak. Bu nedenle, 3 ila 5 bin arası bir denek büyüklüğü makul görünüyor.

4. Son olarak, "%95 ihtimalle" diye ifade ettiğim bir kavram var, istatistikte buna "confidence interval" deniyor. Bunu %99 ihtimale çıkarabiliriz, ama o zaman da hata payı büyüyecektir. Genelde %95 kullanılıyor. Yine de, %5 ihtimalle de olsa, bu hesapladığımız istatistiksel hatadan daha fazla sapma olması ihtimali var.

Bütün bunları derleyip toplayacak olursak, 3000 denekli bir ankette HDP'nin oyunun %9,5 veya %10,5 çıkması durumlarında, hata payını %1 kabul edecek olursak, bu sonuçlar şu anlama geliyor:

- 3000 denekli bir ankette HDP'nin oyu %9,5 bulunduysa: Anket firması bu anketi 100 kere tekrarlayacak olsaydı, bunların 95'inde HDP'nin oyu, %8,5 ila %10,5 arasında çıkacaktı.

- 3000 denekli bir ankette HDP'nin oyu %10,5 bulunduysa: Anket firması bu anketi 100 kere tekrarlayacak olsaydı, bunların 95'inde HDP'nin oyu, %9,5 ila %11,5 arasında çıkacaktı.

Dolayısıyla, sırf bu anket sonuçlarına bakarak, "HDP barajı geçiyor" veya "HDP barajı geçemiyor" diyemeyiz.

Son olarak, istatistiksel hatanın dışında, sistematik hataların da olabileceğini, bunların dışında anket sonuçlarının kasten değiştirilmesi, saptırılması veya anket falan yapılmayıp masabaşında sonuç uydurulması gibi durumların da yaşanabileceğini hatırlatayım.

1 yorum:

Adsız dedi ki...

Ben sahsen turkiyedeki anket firmalarinin orneklem belirlerken uluslarasi kabul gormus bilimsel standartlarda calismadigini dusunuyorum, hicbir sirket orneklem belirleme yontemini paylasmiyor, ya da bunu denetleyen bir kurum (turkstat gibi) yok. Batili ulkelerde bu tip kamuyoyu arastirma sirketleri audit edilirler ve eger sistematik yanlislari varsa lisanslari ellerinden alinir, kasti hatalardan soz etmiyorum bile.
Ayrica her anket sirketi bir kararsiz orani buluyor ve bunu dagitarak sonuc acikliyor, cogu zaman kararsiz oranini goremiyoruz, kararsizlar bagimsiz bir degisken degil aslinda, eger kararsizlar uzerine de paralel bir calisma yapilabilse (ornegin neye gore oy verdikleri sorulup ekonomik istikrar cevabi gelirse iktidar partisine, etnik kimlik gelirse hdp ye dagitmak gibi) ve bunlarin neye gore davrandigi saptanabilse bence daha tutarli olur.