Mindenki tudja, hogy az Orbán-rendszerben a választások esélyese a miniszterelnök. De most aligha szórná ránk a pénzesőt ilyen ütemben, ha nem hinne a meglepetések lehetőségében. Tehát akkor mégse az a legvalószínűbb eredmény, amit eddig annak hittünk? Túl- vagy alulárazott Márki-Zay miniszterelnöksége azokon a tengerentúli fogadási piacokon, ahol nagyjából harminc százalékos esélyt adtak neki januárban? Tényleg ki lehet zárni egy ellenzéki kétharmad lehetőségét? Milyen odds-szal fogadjunk arra, hogy a Mi Hazánk lesz a királycsináló az országgyűlésben? Milyen árfolyamon kössünk április 4-i határidős ügyleteket a Mészáros Lőrinc-féle Opus részvényekre? Olyanon, amin akkor kaszálunk nagyot, ha összeomlik az árfolyama a választás után, vagy olyanon, amin akkor kaszálnánk, ha új erőre kapva szárnyalna a felszabadulás egykori ünnepén?
Ebben a kétrészes posztban számszerű választ keresek ezekre a kérdésekre. Ma a közvélemény-kutatások bizonytalanságairól lesz szó úgy, ahogy még nem volt, a második részben meg a választási földrajzot vesézem ki kicsit máshogy, mint ahogy a sajtóban eddig foglalkoztak ezzel. És igen, lesz a végén befektetési tanácsadó is.
A közvélemény-kutatások vastag ködje
Zsargonmentesen itt, a legfrissebb adatok alapján és minden technikai részlettel meg itt foglaltam össze, ami szerintem fontos lehet a közvélemény-kutatásokból. Röviden: három százalék táján áll a Kutyapárt és a Mi Hazánk, a Fidesz meg a számítgatás pontos módjától függően két és fél, három, hat, vagy hét százalékponttal vezet az ellenzék előtt. Tehát Orbán Viktor kényelmes, de a kétharmadtól azért jócskán elmaradó győzelme a jelenleg legvalószínűbb kimenetel.
Ez a kétrészes poszt azt teszi ehhez hozzá, hogy azért nem egészen nulla a kutyapártos vagy mihazánkos miniszterelnökhöz vezető izgalmak esélye. Egy ellenzéki győzelemé, akár kétharmaddal is, pedig meglehetősen magas. Ennek négy fő oka van, amiből az utolsót a második részre hagyom.
1. A közvélemény-kutatások hibahatára sokkal nagyobb, mint hinné
Mindenki ismeri a szokásos mantrát a ±3,1 százalékos hibahatárról. Csak az a baj, hogy csöppet sem igaz.
Az persze tény, hogy a szolgáltatásaik eladásából élő cégek azt hajtogatják, hogy teljesen véletlen mintavétel esetén 100 darab egyenként ezer fős minta közül 95-ben maximum plusz-mínusz 3,1 százalékos eltérést találnánk az igazságtól (feltéve, hogy a megkérdezettek nem titkolóznak, nem változtatják meg a véleményük holnapig, stb.) A tankönyvekben ez igaz is.
De a választási közvélemény-kutatások azt firtatják, hogy a választásokon várhatólag résztvevők között mi várható. A Republikon Intézet például azt nézi, hogy mi az egyes pártok támogatóinak aránya mindazok közt, akik hajlandók elárulni valamit a pártpreferenciájukról („összes pártválasztók”). A Nézőpont meg újabban csak azt, hogy a magukat biztos szavazónak mondó válaszolók között (akiknek egy részéről csak közvetve becsülik meg, hogy miként szavaznának) mi a százalékos megoszlás. A legtöbb kormányfüggetlen intézet mind a két bázison bemutatja az adatait, de a lényeg az, hogy mindkettő lényegesen kisebb csoport, mint az összesen megkérdezett (általában ezer) fő. Ennek megfelelően a statisztikai hiba is nagyobb itt.
De van ennél nagyobb gond is. Véletlen mintavétel már csak a tankönyvekben létezik. 2022-ben megfizethetetlenül drága lenne addig ostromolni egy tényleg véletlen (mondjuk a népességnyilvántartótól vásárolt) célpont-lista minden tagját, amíg végre elegendőn sokan válaszolnak közülük ahhoz, hogy felsóhajthassunk, na Sajókám, ez most már tényleg egy véletlen minta.
Ezért a mai kutatók állandóan barkácsolnak, hogy legalább abban az arányban tartalmazzon a minta kevésbé iskolázott falusi fiatalokat meg középkorú, sokszereplős háztartásban élő városi nőket, Facebook fogyasztókat, politika iránt érdeklődőket és még tetszés szerint kiválasztott megannyi más statisztikai csoportot, mint amennyit a legutóbbi (persze már elavult és amúgy is tökéletlen) „valós” (KSH, Facebook, stb.) adat mutatott. Megannyi többé-kevésbé titkolt segédeszközt vetnek be, amiről rétegzett mintavétel, kvóták, súlyozás, kevert mód, és hasonlóan bűvös szavak (angol fordítására) keresve tájékozódhatunk. Viszont kevés pénzből ügyeskednek, és ez meg is látszik az eredményeken.
A szegényes barkácsolás első eredménye az, hogy a tényleges hibahatár másfél-kétszer olyan tágas, mint egy valódi véletlen mintavétel esetén lenne (tudományosan ld. pl. itt meg itt). Ha még hozzávesszük azt is, hogy a pártarányok eleve nem az ezer megkérdezettre, hanem a párszázzal kevesebb „összes pártválasztóra” meg „aktív szavazóra” értelmezendők, akkor máris ott tartunk, hogy a szimpla mintavételi hiba is plusz-mínusz hat-hét százalék.[i] A Fidesz és az ellenzék támogatottsága közti különbség mintavételi hibája pedig még ennek is a duplája, azaz 12-14 százalék! Az ugyanis két, külön-külön hat-hét százalékos hibájú, és egymást szinte tükörképként követő (ha Te fel mész, akkor én le) szám különbsége.
Ha tehát a legfrissebb kutatásban azt látjuk, hogy három százalékkal vezet a Fidesz a várható belföldi szavazatokban, akkor egy tizenöt-tizenhét százalékos (szinte biztosan kétharmadot érő) Fidesz-előnytől egy kilenc-tizenegy százalékos (több, mint megnyugtató mandátumtöbbséget hozó) ellenzéki vezetésig minden hibahatáron belül van.
Ám még ez is csak egy szemérmes kezdet a bizonytalanságok valódi mértékének felismerésében.
2. A közvélemény-kutatások átlagának hibahatára is sokkal tágabb, mint valaha is gondolta volna
Azért jó a sok kutatás, hogy csökkenjen a bizonytalanság. Gondolná az ember. Ám a különféle intézetek más és más módokon barkácsolnak. És a minőségi munka kívánalmaihoz képest nagyon kis pénzből. Ennek eredményeként pedig mást és mást talál az, aki vad kalandvágyból a személyes kérdezéssel próbálkozó, idegenek ajtaján kopogtató kérdezők munkájába veti bizalmát, mint az, aki Facebook hirdetésekkel halászta össze válaszolóit, vagy aki valamelyik telefonálgató call center bizonytalan eredetű telefonszám-gyűjteményének véletlenszerűségére tette fel szakmai becsületét. Rövid betanulás után ki-ki megállapodott a legolcsóbb, esetleg a leghihetőbb (vagy neki legjobban tetsző) eredményeket szolgáltató szerszámosláda mellett, és onnantól azt használja. A politikai megrendelőknek ez elég is, mert ők úgyse tudják, hogy miről ismerszik meg a bóvli, meg aztán a pénz is elég könnyen jött nekik, amit elszórnak a legértelmetlenebb kutatásokra is.
Az eredmény az, hogy még az amúgy pártoktól tényleg független intézetek eredményei között is jelentős különbségek keletkeznek. Elég egybevetni a Medián és a Závecz idősorait, és máris elsírja magát, aki eddig valami mást hitt. Extrém példaként 2021 első felében a Závecz mindig enyhe ellenzéki előnyt mért a Fidesszel szemben, a Medián viszont 6-13%-os Fidesz előnyöket mért ugyanakkor. De a Kutyapárt és a Mi Hazánk támogatottságai adatai tekintetében is gyakorta ellentmondanak egymásnak.
Senki nem tudja, hogy melyik eredmény áll közelebb a valósághoz, hiszen még azt se nagyon tudják egymásról a konkurens cégek, hogy ki miként barkácsol.[ii]
Hiábavaló azt kérdezni, hogy melyiknek higgyünk, mert ha valaki mondjuk a Mediánba veti minden hitét, akkor sokszor hónapokig várhat az új adatra, a világ meg közben változhat. Hogy melyik intézet tartja kezében a bölcsek kövét, az meg legalább annyira múlik azon, hogy kinek kedvez a szegényes barkácsolás során a vakszerencse, mint azon, hogy ki próbál a valóságot felderítő kutatóintézetként megélni, és ki az, akinek inkább csak, hogy is mondjam, a politikai kommunikációs szolgáltatások egyike az, hogy közvélemény-kutatást is csinál.
Egy szó, mint száz, nagy ködöt teremtenek maguk körül a közvélemény-kutatások. Nem is lehet mást várni ott, ahol a független média nem tud érdemi megrendelőként színre lépni, mert elzárja a hirdetési bevételektől a kormányzat, a Facebook, meg a Google. De ne dobjuk még sutba az adatokat, mert arra is nagyon rá lehet fizetni, ha valaki csak a saját megérzései alapján dönti el, hogy mennyi Opus vagy Toroczkai részvényt vásárol idén márciusban.
Nézzük meg inkább az átlagát azoknak a „figyelmet érdemlő” intézeteknek, amelyek már az előző egy-két választás idején is rendszeresen posztoltak becsléseket, és azóta is viszonylag rendszeresen posztolnak valamit, ami mellé legalább odaírják a nevüket, meg egy dátumot, tehát vásárra viszik a szavahihetőségüket azzal, hogy mit posztolnak hónapról hónapra.
Ezeket az adatokat gyűjti a Vox Populi közvélemény-kutatási összefoglalója, amit egy leegyszerűsített változatban most már a 444.hu-n is folyamatosan láthat. A leegyszerűsített változatban kicselezzük azokat az intézeteket, akik egy-egy kutatásról is sokféle számot tesznek ki, tehát átlagoljuk az „összes pártválasztóra”, illetve az „aktív/biztos szavazókra” vonatkozó százalékokat, meg a közös, illetve külön-külön ellenzéki listákat feltételező kérdésekkel kapott válaszokat, és így jön ki az a kép, amit az alábbi ábrán is láthat.
Ami engem is nagyon meglep, hogy a vonalakkal berajzolt mozgóátlagok – ezek itt egy-egy 41 napos időszak, tehát egy adott nap és a megelőző és azt követő 20 nap összes releváns közvélemény-kutatási adatát átlagolják – mennyire közel kerültek a tényleges választási eredményekhez a 2018-19-es évek három országos szavazásán. A Fidesz, az összellenzék, a Kutyapárt és a Mi Hazánk országos szavazataránya tekintetében is majdnem telitalálatokról beszélhetünk (lásd a tényleges választási eredményeket jelző csillagok közelségét a mozgóátlagok vonalaihoz a fenti ábrában).
Ez arra utal, hogy ha az egyes intézetek mellé is lődöznek (némelyek talán egymást is igyekeznek ellensúlyozni a számaikkal két választás közt), azért az iparág egésze mégiscsak igyekszik megelőzni azt, hogy teljesen nevetségessé váljék (a propagandistának is bukta, ha senki nem hisz már neki). Ez pedig elég ahhoz, hogy megfelelő zajszűrőkkel valamiféle közhasznú információt is találhassunk az amúgy tényleg rémes és manipulatív közleményekkel terhelt hangzavarban.
Igen ám, de a hatalmas mintavételi hibák és intézetközi különbségek ettől még nem tűnnek el. Hanem mind-mind hozzájárulnak az intézetközi mozgóátlag saját, és igencsak vaskos hibahatárához. Számításaim szerint ez majdnem kétszer akkora, mint egy-egy közvélemény-kutatás (a fentieknek megfelelően számolt) reális hibahatára.[iii] Óriási hát a hibalehetőség, de ez van: a tisztánlátás ára egy csomó olyan probléma figyelembevétele, aminek ismeretében bizony sokkal bizonytalanabbnak látszik a jövő, mintha buta strucc módjára csak a legutóbbi egy kutatását néznénk a saját kedvenc kutatónknak, és még a hibahatárról szóló megszokott, ám igencsak elavult bölcsességet is készpénznek tekintenénk. Márpedig aki nem akarja elveszteni a család megtakarításait Mészáros Lőrinc cégeinek részvényeivel való spekuláción, az ne ringassa magát megalapozatlan bizonyosságokba, hanem stresszeljen, amikor van miért.
3. A közvélemény-kutatásoknak egész biztosan félrehord a puskája, csak nem tudjuk, hogy merre
Még mindig nem tartunk a feketeleves végén. Ugyanis semmi garancia nincs arra, hogy 2022-ben is pont olyan jó előrejelzést ad a „figyelmet érdemlő” közvélemény-kutatások átlaga, mint a 2018-19-es választásokon. Átfogó amerikai és világkörüli elemzések sora jutott arra, hogy egy-egy évben a 40-50%-os támogatottságú pártok és jelöltek esetén arra számíthatunk, hogy a választás előtti utolsó hetekben készülő kutatások átlaga nagyjából két (±1) százalékot téved majd a párt tényleges szavazatarányával kapcsolatban.[iv] Szerintem nincs okunk ennél kisebb hibára számítani a mai Magyarországon.
Ha ezt a bizonytalanságot hozzácsapjuk még a korábbiakhoz, akkor a Fideszes meg az ellenzéki lista szavazataránya közti különbségekre vonatkozó mozgóátlag valódi hibahatára nagyságrendileg úgy ±21 százalékpont.
Ha Mészáros Lőrinc ezt tudná, félő, hogy szívrohamot kapna. Ez a huszonegy ugyanis nem nyerő lap, hanem azt jelenti, hogy ha a legutóbbi három hétre nézve megjelent közvélemény-kutatások átlagában mondjuk hét százalékkal vezet a Fidesz az ellenzék előtt, akkor ugyan bőven van esély egy 13 százalékos vagy nagyobb kormánypárti tarolásra a valóságban, de arra is, hogy több, mint öt százalékkal vezet az ellenzék a belföldi szavazatokban. Mandátumszámban az előbbi eredmény valszeg kétharmadot jelentene a Fidesznek, az utóbbi viszont szinte egész biztosan parlamenti többséget hozna az ellenzéknek. És ha hét százalék a Fidesz előnye az aktuális közvélemény-kutatások átlagában, akkor a fentiek szerint 28 százaléknyi valódi esély van az előbbire, és 12 százaléknyi az utóbbira.
Nézzük meg ezt az összefüggést egy ábra segítségével is. A vízszintes tengelyen látjuk azt, hogy mekkora Fidesz előnyt mutat az aktuális közvélemény-kutatások átlaga. Minden hipotetikus közvélemény-kutatási eredmény felett nyolc színes oszlop magassága jelzi, hogy az milyen valószínűséggel hoz ilyen vagy olyan tényleges választási eredményt, ha egyszer a közvélemény-kutatások átlaga a legjobb becslésünk arra, hogy mi lesz a valóságban, de arra számíthatunk, hogy ±21 százalékpont a statisztikai hibahatára.
Döntetlent (tehát nulla százalékos Fidesz előnyt) jelző közvélemény-kutatások mellett bármelyik oldal szerény (0-5%-os) előnye egyformán 19%-os valószínűséggel bír. Bár ezek a legvalószínűbb eredmények, azért még egyik vagy másik oldal 13%-nál nagyobb arányú vezetése is tíz-tíz százalékos eshetőséggel bír amiatt, hogy a közvélemény-kutatási eredmények csak nagyon tág statisztikai hibahatárral jelzik, hogy mi várható.
Ugyanilyen nagy bizonytalanságot látunk az ábra bal és jobb szélén látható extrém közvélemény-kutatási eredmények mellett is. Ha akár az ellenzék, akár a Fidesz tíz százalékpontnál többel vezet a közvélemény-kutatásokban, akkor magától értetődőleg ötven százalék feletti az esélye, hogy 10-13%-kal, vagy még annál is nagyobb arányban vezet majd a választáson. Ám még ilyen egyértelműnek tűnő közvélemény-kutatási eredmények mellett is egyhetednyi esély marad, hogy az ellentábor nulla-tíz százalék előnyben van, sőt van még egy-egy százaléknyi esély arra is, hogy valójában a másik oldal fog nagy arányú (10-13%-os, vagy annál is nagyobb) vezetést szerezni a választáson.
Azt láthatjuk tehát, hogy a közvélemény-kutatási eredményeknek egy ilyen tágas statisztikai hibahatár mellett is van információ-értéke, csak hát nem olyan nagy, mint ha Amerikában lennénk, ahol tévedni ugyan szoktak a közvélemény-kutatások, de sokkal több van belőlük, és talán az eredményeik sem szóródnak annyira, mint Magyarországon.
Honnan jön ez a hatalmas bizonytalanság, és mi az, ami még tovább fokozza?
A fentiekben nem arról volt szó, hogy mostantól április 3-ig mennyit változhatnak még a közvélemény-kutatási eredmények. Annak megbecslésére ugyanis nem vállalkoztam. Csak azt mutatják a fenti számok, hogy az adott pillanatban rendelkezésre álló közvélemény-kutatások alapján mennyire magabiztos kijelentéseket tehet valaki ma Magyarországon a pillanatnyi esélyekről, ha nem a gyerekmesékből, hanem a tényekből indul ki.
Nincs a közvélemény-kutatásoknál jobb eszközünk a választási eredmények előrejelzésére. Viszont nagyon durva, pontatlan mérőeszközök ezek. Ugyanis nagyon kevés van belőlük (a legutóbbi lengyel elnökválasztás előtti egy hónapban tízszer annyi „figyelemre méltó” kutatás jelent meg, mint nálunk a december közepe óta eltelt két hónapban), nagyon kis mintákból főznek olcsó levet, és egymásnak nagyon ellentmondó eredményekkel szolgálnak. A közvélemény-kutatások pedig még a legjobb esetben is csak elég tágas hibahatárokkal becsülnék meg a várható eredményeket. Szóval lehet drukkolni, a 2022-es választáson még bármi megtörténhet, tekintetben véve, hogy ennyire keveset tudunk az esélyekről.
A poszt második részében majd azt veszem szemügyre, hogy a választási rendszer, mindenekelőtt az egyéni választókerületi rendszer, mennyivel fokozza a fenti bizonytalanságot, ami valószínűleg már egy teljesen igazságos és arányos választási rendszer mellett is túl sok lenne a stressz kezelésére amúgy is elég rossz megoldásokat alkalmazó nemzetünk potrohos hasának és gyenge szívének. A tanulság egyértelmű lesz: arányos választási rendszert kíván mindannyiunk lelki egészsége!
LÁBJEGYZETEK
[i] Ti. az olyan ötven százalékhoz közeli dolgok esetén, mint a Fidesz vagy az ellenzéki szavazók aránya (a nulla százalékhoz közelebb eső arányoknál persze ennél sokkal kisebb).
[ii] Nemrégiben a Századvég igazgatója pl. azzal magyarázta az intézetek becslései közötti különbségeket egy tévéadásban, hogy csak nekik jut eszükbe súlyozással helyre tenni az iskolázottság szerinti arányokat a mintáikban, miközben ezt történetesen mindenki megteszi.
[iii] A Vox Populi itteninél bonyolultabb elemzései azt az optikai csalódást is korrigálták, amit az okoz, hogy egy-egy időszakban esetleg csak olyan „figyelmet érdemlő” intézetek posztoltak aktuális adatot, akiknek mind egyfelé hordott félre a barkácspuskájuk. Ez a korrekció már ±10 százalék feletti szintre – két párt különbsége esetén pedig ennek duplájára - növeli a korrigált intézetközi mozgóátlagok p<.05 hibahatárát még akkor is, ha a nem-véletlenszerű mintavétel okozta problémákat nem veszem figyelembe.
[iv] A forrásokra ld. itt. Az teljesen esetleges, hogy egy adott választáson balra vagy jobbra tévednek a kutatások.