Február 25-én közölt választási felmérése után csalással vádolták meg a Medián Közvélemény-kutatási Intézetet. A vád azon alapult, hogy egy kiszivárgott dokumentumban szereplő nyers számok eltértek a publikált eredménytől. Valójában azonban semmi rendkívüli nincs abban, hogy egy kutatás súlyozatlan és súlyozott adatai különböznek egymástól – éppen ellenkezőleg, ez minden reprezentatív közvélemény-kutatás alapvető szakmai követelménye.
A közvélemény-kutatások célja, hogy egy kisebb mintán keresztül leképezzék az egész társadalom véleményét. Ehhez véletlenszerűen választják ki a megkérdezetteket. Csakhogy hiába keresik fel véletlenszerűen az embereket, az már nem teljesen véletlen, hogy kik válaszolnak nekik. A fiatalok például sokkal kevésbé veszik fel a telefont, mint az idősebbek. A magas és alacsony jövedelmű emberek egyaránt bizalmatlanabbak a telefonos kutatásokkal szemben, mint a középosztálybeliek. Ezeket a torzulásokat súlyozással egyenlítik ki a kutatók. Tóka Gábor politológus magyarázata szerint a súlyozás nem manipuláció, hanem kiegyenlítő mechanizmus, ami szakmai követelmény.
A súlyozás alapját a Központi Statisztikai Hivatal 2022-es népszámlálási adatai jelentik. Egy véletlenszerűen előállított minta összetétele szinte mindig kicsit eltér ettől az etalontól. Hann Endre, a Medián vezetője példája szerint előfordulhat, hogy kicsivel több a nő, kicsivel több az idős válaszadó. Ezeket az eltéréseket kiegyenlítendő képeznek súlyokat, vagyis olyan szorzót, amivel az elvártnál kisebb arányban meglévő csoportok válaszait nagyobb arányban veszik figyelembe. Négy jellemzőt vesznek általában alapul: a nemet, életkort, iskolai végzettséget és település típusát. Ezeket egyszerre kell arányosítani egy komplex, számítógépes programmal végzett művelettel.
Miért nem lehet természetes módon kiküszöbölni ezeket a torzulásokat? A válasz az idő. A kutatások általában 3-5 nap alatt készülnek. Ahhoz, hogy természetes módon érjék el a népességbeli arányokat, hetekig kellene telefonálgatni. Előfordulhat, hogy az első napokban összejön az 50 év felettiek szükséges aránya, de a 18-39 évesek eléréséhez hetekig tartana az interjúzás. Amit természetes számokból nem tud felépülni, azt súlyozással építik fel – magyarázza Tóka Gábor.
A nők példáján a legegyszerűbb megérteni a súlyozást. A népszámlálási adatok szerint a magyar népességben 52 százalék a nők aránya, 48 százalék a férfiaké. Ha egy mintában 57,2 százalék nőt sikerül elérni, akkor súlyozással kell kiigazítani. A nőket nem egy emberként számolják, hanem 0,9 emberként. Ezt a szorzót úgy kapják, hogy a valódi népességbeli arányt elosztják a mintabeli aránnyal: 52-t osztanak 57,2-vel. Ha egy csoport alulreprezentált, mint a 42,8 százalékkal szereplő férfiak, őket 1-nél nagyobb szorzóval számolják.
A vitatott Medián-kutatásnál a nyers mintában 21 százalék volt a 18-39 évesek aránya, 62,5 százalék az 50 év felettieké. A népszámlálási adatok szerint azonban a felnőtt népességnek az 50 év felettiek 48,5 százalékát, a 18-39 évesek 32 százalékát teszik ki. Az időseket ezért 0,78-as szorzóval kellett számolni, a fiatalokat 1,5-ös súllyal. Így alakult a nyers 37-36 százalékos Tisza-előnyből a súlyozott 40-33 százalékos eredmény. Tóka Gábor a Minerva Intézet adatain végzett számításai szerint hasonló nagyságú változások teljesen természetesek súlyozás során.
A súlyozás tehát nem manipuláció, hanem éppen a reprezentativitást biztosítja. Attól függetlenül lehetnek strukturális torzítások: például az, hogy a Tisza támogatói most szívesebben beszélnek politikáról kutatókkal, mint a Fidesz hívei. Erre viszont nem lehet súlyozni, mert nincs hivatalos adat arról, ki mennyire közlékeny. A közvélemény-kutatások eredményeit ezért szakmai szkepticizmussal, de a módszertan megértésével érdemes fogadni.