24 Mayıs 2015 Pazar

HDP'yi %10,5 veya %9,5 gösteren anketler bize ne söylüyor?

İçinde yaşadığımız çağın "okur-yazarı" olma şartlarından biri, temel istatistik bilgisine sahip olmak. İşte, 7 Haziran seçimlerine doğru, bir sürü anket yayınlanıyor ve anketlere bakılarak HDP'nin barajı geçip geçemeyeceği üzerinde ahkam kesiliyor.

Öncelikle, anketlerdeki sonuçların birbirinden farklı mahiyetleri olan "hata"larla malül olduğunu hatırlamamız lazım. Bunların en başında, "istatistiksel örnekleme" hatası geliyor. Anket firması, anketörler, sorulan sorular vs hepsi aynı olsa bile, kaçınılmaz şekilde ortaya çıkan bir hatadan, veya sapmadan söz ediyoruz.

Anket yaptığımızda, milyonlarca seçmenin nasıl oy kullanacağını, bu seçmen kümesinin çok küçük bir bölümünün verdiği cevaplarla kestirmeye çalışıyoruz. Seçimden söz edecek olursak, YSK verilerine göre yurtiçinde 53.741.838 kayıtlı seçmen var. Anketler bu seçmenlerin davranışını, 1500, 2000, 3000, hadi diyelim 5000 denekle ölçmeye çalışıyorlar. En iyi ihtimalle, 1000de 1lik bir örneklemeyle çalışıyorlar.

İstatistiksel hata, işte şu demek. Bir anket firması, bütün parametreler aynı olaraktan yaptığı bir anketi tekrarlasa, partilerin oy oranlarını tam tamına aynı şekilde bulmayacaktır. Diyelim SONAR, 3000 denekle bir anket yaptı ve Ak Parti'nin oy oranını %43 buldu. SONAR, başka 3000 kişiye aynı anketi uygulasaydı, Ak Parti'nin oy oranını belki %45 bulacaktı. Aynı anketi bir üçüncü kez tekrarlasa, Ak Parti'nin oy oranını belki %41 bulacaktı.

İşte istatistik, bu noktada devreye giriyor. Bir anket firması partilerin oy oranlarını bulmak için N kişiyle anket yapıyor olsun ve Y partisinin oylarını %y buluyor olsun. Bu anket firması bu anketi 100 kere tekrarlasaydı, 95'inde bu %x'ten en fazla ne kadar sapma olacağını veren formül şu:

Sapma = 1,96 * karekök (y * (1-y) /N)

Veya, Sapma'yı S ile gösterecek olursam:


Yukarıdaki örneğe dönecek olursam, eğer SONAR'ın 3000 denekle Ak Parti'yi %43 bulmasından söz ediyorsak, bu sonuca eşlik eden istatistiksel sapma şudur:


Hesabı yaptığımızda, sapmayı %1,77 buluruz. Bunun anlamı şudur. SONAR'ın anketinde Ak Parti'nin oyu, %95 ihtimalle, %43'ün 1,77 puan altında veya üstünde kalan aralık içindedir, yani %95 ihtimalle %41,23 ila %44,77 arasındadır. Eğer yarın seçimde Ak Parti %44,5 oy alacak olursa SONAR pekala, "Ak Parti'nin oyu bizim anketimizin istatistiksel hata payı içinde çıkmıştır" diyebilir ve haklıdır.

Burada, elimizdeki denklemin parametreleri üstünde tek tek konuşalım.
1. İstatistiksel hata payını azaltmanın en kolay yolu, denek sayısını arttırmaktan geçiyor. Denek sayısı 3000 değil de 5000 olsaydı, hata payı %1,37ye inecekti.

2. Hata payında, ölçtüğümüz yüzde oranın büyüklüğünün de etkisi var. Aşağıda, Ak Parti, CHP ve HDP'nin muhtemel oy oranı olarak verilen üç değer için hata paylarının denek sayısına göre nasıl değiştiğini görelim.

Oy oranı
43,00%
Oy oranı
25,00%
Oy oranı
9,50%
Denek sayısı
Hata payı
Denek sayısı
Hata payı
Denek sayısı
Hata payı
1.000
3,07%
1.000
2,68%
1.000
1,82%
3.000
1,77%
3.000
1,55%
3.000
1,05%
5.000
1,37%
5.000
1,20%
5.000
0,81%
10.000
0,97%
10.000
0,85%
10.000
0,57%


3000 denekli bir ankette, %43 olarak ölçülen Ak Parti oy oranı için hata payı %1,77 iken, %9,50 olarak ölçülen HDP oy oranı için hata payı %1,05.

3. Denek sayısını arttırmak bir noktadan sonra pek bir işe yaramıyor. Ama denek sayısını arttırmanın ciddi bir maliyet yükü var. 3000 denekli bir anket 10 bin liraya mal oluyorsa, 10000 denekli bir anket daha pahalıya, diyelim 20 bin liraya  mal olacaktır. Yine de hata payı elimine olmayacak. Bu nedenle, 3 ila 5 bin arası bir denek büyüklüğü makul görünüyor.

4. Son olarak, "%95 ihtimalle" diye ifade ettiğim bir kavram var, istatistikte buna "confidence interval" deniyor. Bunu %99 ihtimale çıkarabiliriz, ama o zaman da hata payı büyüyecektir. Genelde %95 kullanılıyor. Yine de, %5 ihtimalle de olsa, bu hesapladığımız istatistiksel hatadan daha fazla sapma olması ihtimali var.

Bütün bunları derleyip toplayacak olursak, 3000 denekli bir ankette HDP'nin oyunun %9,5 veya %10,5 çıkması durumlarında, hata payını %1 kabul edecek olursak, bu sonuçlar şu anlama geliyor:

- 3000 denekli bir ankette HDP'nin oyu %9,5 bulunduysa: Anket firması bu anketi 100 kere tekrarlayacak olsaydı, bunların 95'inde HDP'nin oyu, %8,5 ila %10,5 arasında çıkacaktı.

- 3000 denekli bir ankette HDP'nin oyu %10,5 bulunduysa: Anket firması bu anketi 100 kere tekrarlayacak olsaydı, bunların 95'inde HDP'nin oyu, %9,5 ila %11,5 arasında çıkacaktı.

Dolayısıyla, sırf bu anket sonuçlarına bakarak, "HDP barajı geçiyor" veya "HDP barajı geçemiyor" diyemeyiz.

Son olarak, istatistiksel hatanın dışında, sistematik hataların da olabileceğini, bunların dışında anket sonuçlarının kasten değiştirilmesi, saptırılması veya anket falan yapılmayıp masabaşında sonuç uydurulması gibi durumların da yaşanabileceğini hatırlatayım.

15 Mayıs 2015 Cuma

Anket firmaları hakkında Ezgi Başaran'ın sözünü ettiği araştırmayla ilgili notlar

Dün Radikal'de Ezgi Başaran, Sabancı Üniversitesi Endüstri Mühendisliği Bölümü öğretim üyesi Kemal Kılıç'ın 7 anket firmasının 2011'den bu yana yapıp yayınladığı 61 anket üstündeki bir araştırmasından söz etti.

Ezgi Başaran'ın yazısına bakınca, bu araştırmanın epey sorunlu olduğu görülüyor. İlk gözüme çarpan noktaları yazıyorum:

1. İncelemede 2011 genel ve 2014 yerel seçimlerinin temel alındığı anlaşılıyor. Cumhurbaşkanı seçimi dahil edilmemiş gibi. İncelemeye konu olan anketlerin zaman aralığı için Ezgi Başaran "2011'den itibaren" demiş, ama Gezici firması 2011 seçimlerinden *sonra* kuruldu. Yani analize temel olan 2 seçimden birinde Gezici firması yoktu. Yine MAK da 2011 seçiminden sonra kurulmuş bir firma. Sonuçta anketler seçim için yapılır. 2011'in 1 Haziranında yapılan anketle 15 Haziranında yapılan anket arasında bir fark olmalı.

2. "2014 yerel seçimi" ile "anket" ifadelerini aynı cümlede kullanan kişiye soracağımız ilk soru "İl Genel Meclisi?" olmalıdır. 2014 yerel seçiminde büyükşehirlerde il genel meclisleri olmadığı için, partilerin ülke çapındaki oylarının nasıl hesaplanacağı belli değil. Bu soruna seçim öncesinde GENAR dikkat çekmişti. Büyükşehirlerde büyükşehir belediye başkanlığı seçimini esas alınca Ak Parti'nin oyu %45 çıkıyor, ilçe belediye meclisi seçimini esas alınca %43. Hangisini alacaksın? Eminim Kemal Kılıç Ak Parti'nin %43 aldığı hesaplamayı kullanmıştır, ama pekala diğeri de olabilirdi. Anket firmalarıyla ilgili iddiaları ise bu farktan daha küçük bir fark. Sadece bu bile, vardığı sonuçları çürütmeye yeter.

3. Kemal Kılıç, endüstri mühendisi imiş ama şöyle bir cümle sarfedebilmiş: "Araştırma şirketlerinin künyesinde de yer alan bilgiye göre anketlerin yüzde artı/eksi yüzde 2 sapma toleransı vardır." Tamam güzel, ama buradaki sapma istatistiksel örnekleme sapması. 40 milyon seçmenin davranışını 4 bin denekle ölçmeye çalışıyorsun. Denekleri "tamamen rastgele" seçme şansın olsaydı (ki yok), ikinci bir denek kümesi üstünde anket yaptığında bulacağın sonuç %95 ihtimalle ilk sonuçtan en fazla ne kadar sapmış olabilir? Artı eksi yüzde 2 sapma bu işte. "95% confidence interval" diye bir kavram var. Bunun haricinde, anketçinin farkında olmadan yaptığı sistematik sapmalar olabilir ve onun da haricinde, anketçinin farkında olarak, taammüden yaptığı çarpıtmalar olabilir. Sistematik sapmalar hakkında ayrıca yazacağım ama şu aşamada, bu konuda sıkça verilen bir örneği zikretmekle yetineyim. Anket firması deneklerle yüzyüze görüşmek yerine telefonla görüşürse, sonuçlarına sistematik bir hata eklenir. Çünkü telefon olan evler, nüfusun tamamını yansıtmıyor. Maddi durumu daha iyi olan ailelerde telefon var. Kemal Kılıç istatistiğin bu temel kavramlarına uzak görünüyor.

4. Aynı şekilde Kemal Kılıç'ın şu cümlesi de problemli: “Soruşturmaların ardından yapılan araştırmalara bakıldığında Ak Parti’de görülen düşüş eğiliminin, 2014 sonrasında hemen hemen hiç değişmediği görülüyor. Öte yandan CHP ve MHP açısından da kayda değer bir değişim yok. Yani Ak Parti çeşitli araştırma kurumlarının belirlemiş olduğu ve soruşturmaların başladığı süreç içerisinde kaybettiği gözlenen oyları, kısa zaman sonra tekrar kazanmıştır." "Düşüş eğilimi" hiç değişmiyorsa, düşmeye devam ediyor demektir. Oysa Kılıç, sözlerinin devamında Ak Parti oylarının arttığını söylüyor. O zaman, "düşüş eğiliminin tersine döndüğü" demeliydi. Ya da, "düşüş eğilimi" ile, sadece sabit bir düşüşten söz ediyorsa, bu düşüşün durması, Ak Parti'nin oy kazandığı anlamına değil, düştüğü yerde kaldığı anlamına gelir. Kemal Kılıç acaba lisede fizik derslerinde hız (yoldaki değişim) ve ivme (hızdaki değişim) arasındaki farkın anlatıldığı dersi dinlememiş mi? :)

14 Mayıs 2015 Perşembe

%10 barajı kaç oy eder?

Bir önceki yazımda, 2009 yerel seçimlerinden itibaren yurtiçi ve yurtdışı seçmen sayısı ve seçimlere katılım oranlarını ele almıştım. O yazıdaki tabloyu, 2015 seçimi için elimizdeki yurtiçi ve yurtdışı seçmen sayılarını ekleyerek tekrarlayayım.

2009 yerel
2010 referandum
2011 genel
2014 yerel
2014 CB
7 Haziran 2015
Yurt içi kayıtlı seçmen
48.049.446
49.495.493
50.237.343
52.695.832
52.894.115
53.741.838
Yurt dışı kayıtlı seçmen
-
2.556.335
2.568.979
-
2.798.726
2.867.658
Toplam seçmen
-
52.051.828
52.806.322
-
55.692.841
56.609.496
Yurt içi oy kullanan
40.932.260
38.172.800
43.785.665
46.993.181
40.753.492
?
Yurt içi katılım oranı
85,19%
77,12%
87,16%
89,18%
77,05%
?
Yurt dışı oy kullanan
-
196.299
129.283
-
530135
?
Yurt dışı katılım oranı
-
7,68%
5,03%
-
18,94%
?
Toplam oy kullanan
-
38.369.099
43.914.948
-
41.283.627
?
Genel katılım oranı
-
73,71%
83,16
-
74,13%
?
Yurtiçi Geçerli Oy toplamı
39.988.763
37.449.300
42.813.896
45.088.742
40.019.352
?
Yurtiçi Geçerli/katılım
97,69%
98,10%
97,78%
95,95%
98,20%
?
Yurtdışı Geçerli oy
-
194.737
127.867
-
526559
?
Toplam geçerli oy
-
37.644.037
42.941.763
-
40.545.911
?
Toplam geçerli/katılım
-
98,11%
97,78%
-
98,21%
?


Siyasi partilerin seçimde milletvekili çıkarabilmeleri için, %10 barajını geçmeleri lazım, ama neyin %10u? Seçim Kanunu barajı "geçerli oyların %10u" olarak tanımlamış. O zaman, barajın kaç oya karşılık geldiğini hesaplamak için ihtiyacımız olan veri, toplam geçerli oy sayısı. Baraj açısından, oyun yurtiçinde mi yurtdışında mı kullanıldığının önemi yok. Önemli olan toplamı.

Geçerli oylar da, seçimlerde oy kullanan seçmen sayısıyla ilgili. Oy kullananların oylarının yaklaşık %2si geçersiz sayılıyor, %98'i ise geçerli sayılıyor. 2014 yerel seçimlerinde geçersiz oy oranının %5e kadar çıktığını görüyoruz, ama 7 Haziran'da tek birleşik oy pusulası kullanılacağını düşünürsek, geçersiz oy oranının %2 seviyesinde kalacağını varsayabiliriz.

O zaman, barajı hesaplamak için, yurtiçinde ve yurtdışındaki katılım oranlarını bilmemiz lazım.

Yurtiçinde katılım oranı, %80 ila %90 arasında bir yerde olabilir.
Yurtdışında katılım oranı ise %20 ila %40 arasında bir yerde olabilir.

Bu durumda, %10 barajının kaç oya tekabül ettiğini, yurtdışı oyları için %20, %30 ve %40 katılım oranları şeklinde üç senaryo üstünden hesaplayayım.

Yurtdışı Katılım Oranı %20:
Yurtiçi Katılım Oranı
80%
82%
84%
86%
88%
90%
Yurt içi oy kullanan
42.993.470
44.068.307
45.143.144
46.217.981
47.292.817
48.367.654
Yurt dışı oy kullanan
573.532
573.532
573.532
573.532
573.532
573.532
Toplam oy kullanan
43.567.002
44.641.839
45.716.676
46.791.512
47.866.349
48.941.186
Genel katılım oranı
76,96%
78,86%
80,76%
82,66%
84,56%
86,45%
Yurtiçi Geçerli Oy toplamı
42.133.601
43.186.941
44.240.281
45.293.621
46.346.961
47.400.301
Yurtdışı Geçerli oy
562.061
562.061
562.061
562.061
562.061
562.061
Toplam geçerli oy
42.695.662
43.749.002
44.802.342
45.855.682
46.909.022
47.962.362
BARAJ
4.269.566
4.374.900
4.480.234
4.585.568
4.690.902
4.796.236

Yurtdışı Katılım Oranı %30
Yurtiçi Katılım Oranı
80%
82%
84%
86%
88%
90%
Yurt içi oy kullanan
42.993.470
44.068.307
45.143.144
46.217.981
47.292.817
48.367.654
Yurt dışı oy kullanan
860.297
860.297
860.297
860.297
860.297
860.297
Toplam oy kullanan
43.853.768
44.928.605
46.003.441
47.078.278
48.153.115
49.227.952
Genel katılım oranı
77,47%
79,37%
81,26%
83,16%
85,06%
86,96%
Yurtiçi Geçerli Oy toplamı
42.133.601
43.186.941
44.240.281
45.293.621
46.346.961
47.400.301
Yurtdışı Geçerli oy
843.091
843.091
843.091
843.091
843.091
843.091
Toplam geçerli oy
42.976.692
44.030.032
45.083.372
46.136.713
47.190.053
48.243.393
BARAJ
4.297.669
4.403.003
4.508.337
4.613.671
4.719.005
4.824.339


Yurtdışı Katılım Oranı %40
Yurtiçi Katılım Oranı
80%
82%
84%
86%
88%
90%
Yurt içi oy kullanan
42.993.470
44.068.307
45.143.144
46.217.981
47.292.817
48.367.654
Yurt dışı oy kullanan
1.147.063
1.147.063
1.147.063
1.147.063
1.147.063
1.147.063
Toplam oy kullanan
44.140.534
45.215.370
46.290.207
47.365.044
48.439.881
49.514.717
Genel katılım oranı
77,97%
79,87%
81,77%
83,67%
85,57%
87,47%
Yurtiçi Geçerli Oy toplamı
42.133.601
43.186.941
44.240.281
45.293.621
46.346.961
47.400.301
Yurtdışı Geçerli oy
1.124.122
1.124.122
1.124.122
1.124.122
1.124.122
1.124.122
Toplam geçerli oy
43.257.723
44.311.063
45.364.403
46.417.743
47.471.083
48.524.423
BARAJ
4.325.772
4.431.106
4.536.440
4.641.774
4.747.108
4.852.442

Görüldüğü üzere, %10 barajı yurtdışı %20 yurtiçi %80 katılım oranı halinde 4,3 milyon oydan başlıyor, yurtdışı %40 yurtiçi %90 katılım oranı halinde 4,8 milyon oya kadar çıkıyor.

%10 barajının bu aralıklarda kaç oya karşılık geldiğini şöyle özetleyeyim:

Yurtiçi Katılım
80%
82%
84%
86%
88%
90%
Yurtdışı Katılım %20
4.269.566
4.374.900
4.480.234
4.585.568
4.690.902
4.796.236
Yurtdışı Katılım %30
4.297.669
4.403.003
4.508.337
4.613.671
4.719.005
4.824.339
Yurtdışı Katılım %40
4.325.772
4.431.106
4.536.440
4.641.774
4.747.108
4.852.442
Grafikte görelim.Bir tahmin yapmam gerekirse, yurtiçi katılımın %88 ve yurtdışı katılımın %35 olabileceğini düşünüyorum. Bu durumda %10 barajı 4.733.057 olacaktır.