Lidé mají poměrně často nedůvěru k průzkumům veřejného mínění. Jednak mají dojem, že zrovna jich se nikdo za celý jejich život na nic nezeptal, jednak se jim publikované výsledky nezdají. U volebních preferencí a odhadů je to ještě citlivější, protože si pak výsledky porovnají s volbami a nesedí jim to. Jak to tedy je?
Pozornost vzbudil třeba poslední volební odhad agentury Kantar pro Českou televizi. Strana Andreje Babiše ANO se tam propadla na druhé místo. Kdyby byla pořád na prvním a měla by (dejme tomu) 25 procent místo 27 a stejně o pět procent vedla, tak by to takové vášně nevzbuzovalo. Co je tedy při posuzování takových výsledků zkoumání vědět?
Nejdřív obecně. Jak se vyberou respondenti pro telefonické tázání. Na svých stránkách to popisuje Sdružení agentur pro výzkum trhu a veřejného mínění SIMAR: „Výzkumná agentura vybere respondenty náhodným výběrem ze seznamu telefonních čísel nebo e-mailových adres (pro CATI – telefonický výzkum, či nějaký online výzkum), nebo z náhodně vybraných adres či jmen vybraných například ze seznamu voličů. Takto vybraní respondenti jsou poté kontaktováni a jsou tazateli požádáni o účast na výzkumu.“
U seriózních výzkumů se v médiích máte dočíst mimo jiné, kolik lidí bylo dotazováno. Laika pak zarazí, že se závěry pro populaci několika milionů lidí dělají na vzorku kolem tisícovky lidí. Není to málo? Ač se bude někdo divit, není. Sdružení SIMAR v článku vysvětluje, jak se postupuje: „V podstatě stejným způsobem jako kuchař posuzuje velký hrnec polévky tím, že ochutná jednu lžíci. Za předpokladu, že polévka je dobře zamíchaná a lžíce této polévky je ‚reprezentativní‘, jedna lžíce bohatě stačí. Volební výzkumy fungují na stejném principu: dosažení reprezentativního vzorku populace je v zásadě podobné míchání polévky. Nevědecký průzkum je jako nehybný hrnec polévky. Kuchař může sníst velké množství z horní části a přesto získá zavádějící obraz, pokud některá z přísad klesla až na dno. Stejně jako u triku s dobře promíchanou polévkou je podstatou vědeckého průzkumu zajištění reprezentativního vzorku v cílové populaci, není pak potřeba obrovský vzorek.“
Není ale rozdíl mezi vzorkem dva tisíce a jeden tisíc lidí, pokud jde o přesnost? Je, ale není tak velký, jak by si někdo snad mohl myslet: „Míru rizika však statistická teorie umí odhadnout. Představte si zemi, kde existuje nějaký problém. 50 % lidí zastává jeden názor, zatímco druhých 50 % si myslí opak. Statistická teorie nám říká, že v náhodném průzkumu mezi 1 000 lidí se stoprocentní mírou odezvy v 19 případech z 20 bude chyba do 3 procentních bodů. Jinými slovy: zaznamenaný výsledek může být nejméně 47 % a nejvíce 53 % pro každý názor. Je tu ale šance jednu ku 20, že výsledek bude mimo tento rozsah. Se vzorkem 2 000 respondentů bude statistická chyba v rozmezí 2 procentních bodů, opět v 19 případech z 20.“
Pokud jde o konkrétní zmíněný výzkum Kantaru, agentura k tomu na svých stránkách uvádí, kdo byl základní soubor: „Oprávnění voliči v České republice starší 18 let, kteří splňují podmínky pro vstup do volebního modelu. Náhodným výběrem byl získán reprezentativní vzorek 1200 rozhovorů, z nichž do volebního modelu vstupuje zhruba 860 respondentů. Jedná se o respondenty, kteří nevylučují svou účast ve volbách a nepovažují za pravděpodobné, že volbu své preferované strany změní.“
Pak se tam popisuje, v jakém rozmezí se pohybuje statistická chyba. Zjednodušeně řečeno, u stran s velkým ziskem to může být plus/minus tři procenta a jedno procento u malých stran. V praxi to znamená, že skutečně nevíme s jistotou, jestli koalice Piráti-STAN přeskočila ANO, nebo ne. Můžeme ale během několika měsíců už vysledovat trend, že ANO za rok kleslo z 35 procent na 25 procent. To je dost na to, aby tam ta jednotlivá procenta nehrála takovou roli. U malé strany, která dosáhla pěti procent, to ale může – a nemusí – znamenat že se dostane/nedostane do sněmovny.
Je také dobré vědět, jaká čísla čteme. Není to věštba výsledku voleb, které budou až na podzim. Je to odpověď na otázku, jak by lidé volili, pokud „by se volby konaly příští týden“.
Někdy se čtenář novin dozví, že data byla takzvaně „vážena“. Co to znamená? To, že je třeba ze vzorku, který přesně neodpovídá rozložení obyvatel ohledně pohlaví, věku a tak dále (mohlo třeba náhodou odpovědět více starších mužů) udělat výběr, který toto rozložení respektuje. (Tyto údaje známe ze sčítání lidu a průběžných statistik.) Agentura může také podle svých zkušeností s chováním lidí vzít v úvahu, že část lidí své preference tají, a některé strany tak mohou být nadhodnocené a naopak. To už je taková kvalitativní alchymie a v některých případech to nemusí přesně vyjít.
Je dobré si ještě jednou uvědomit, co nám průzkumy říkají. Prostě to, že konkrétní agentura sesbírala, co jí lidé řekli. Lidé jsou živí, takže mohou lhát, mohou se splést, mohou se jinak chovat, když si stranu mají vybavit z hlavy, nebo když dostanou před sebe seznam. Mohou také dva týdny před volbami změnit názor. Proto skutečný zájemce sleduje několik průzkumů a dělá si raději obrázek o trendech, než že by se nechal fascinovat jedním procentem nahoru nebo dolů.
Na závěr: Je dobře, že ČT používá jednu agenturu? Tady se dají uvést důvody pro i proti. V každém případě by se výsledky neměly prezentovat jako zjevená pravda, JAK TO JE, ale jako jeden výsledek jednoho tázání od jedné společnosti. Bylo by fér zmínit i ostatní. Pokud jde o sledování trendů, tak spolupráce s jednou společností může mít smysl. Je dobré vzít v úvahu i to, že takový průzkum něco stojí, takže dělat jich několik nezávisle na sobě by se poněkud prodražilo a někteří radní v Radě ČT by mohli utrpět zvýšením svého krevního tlaku a v důsledku této bolestné újmy žádat padání hlav.