Hem de preguntar a molta gent?

Veiem moltes enquestes i sondeigs als mitjans de comunicació. Fins a quin punt ens podem creure el que diuen? Cóm és que hi ha vegades que encerten i altres vegades que no?

Pensem en el cas més senzill de preguntes amb només dues opcions de resposta. Algú fa un sondeig per determinar quanta gent votarà una certa opció política. Al final, el que surt als diaris és que hi ha un 46,3% de futurs votants que pensen votar-la, per exemple. Cóm podem saber el percentatge de gent que vol votar una determinada opció, si no hem preguntat a tothom?

La resposta és que aquesta xifra del 46,3% és només una aproximació. De fet i com sabeu, no estic dient res de nou perquè tots sabem que les estadístiques donen aproximacions: no poden donar valors exactes. En tot cas, el que és menys conegut és que per entendre bé qualsevol resultat d’una enquesta o sondeig hem de saber el valor de l’error i l’interval de confiança. A l’exemple anterior, el correcte seria dir: “amb un error del 1% i un interval de confiança del 95%, podem dir que el 46,3% de futurs votants pensen votar aquesta opció”. Ningú explica tot això per no enfosquir i complicar el missatge comunicatiu, però aquests dos valors, l’error i l’interval de confiança, segur que són ben coneguts pels estadístics que han analitzat les dades de l’enquesta. La idea és senzilla. Ens cal fixar un error  perquè mai podem tenir una certesa absoluta en estimacions que són resultat de sondeigs. Així, quan acceptem un error del 1%, el que estem dient i que podrem afirmar és que el percentatge de futurs votants es trobarà entre el 45,3 i el 47,3%, amb un 1% d’incertesa en els dos sentits. Ara bé, és clar que encara no n’hi ha prou perquè el fet de preguntar a un conjunt de persones mai ens donarà informació precisa sobre el que vol fer la resta, ni tan sols acceptant aquest error del 1%. Però aquí és on arriba l’estadística per ajudar-nos amb els intervals de confiança. Què volem dir quan parlem de què l’interval de confiança és del 95%? Volem dir que si algú ve i ens diu que el percentatge de futurs votants es trobarà entre el 45,3 i el 47,3%, tindrà raó el 95% dels casos.

Aquesta màgica barreja d’error i interval de confiança és el que permet que l’estadística mesuri el que és parcialment desconegut i el que només és probable. No sabem què opina tothom, però podem afirmar que si diem que el percentatge de vots estarà entre el 45,3 i el 47,3%, encertarem el 95% de les vegades.

Mireu la taula manuscrita que he preparat a sota. Ens diu, en el cas més desfavorable i amb un interval de confiança del 95%, si hem de preguntar a molta o poca gent. Aquest nombre de gent als qui haurem de preguntar és el que s’anomena mida mostral. Hi ha formules per calcular-la (si esteu interessats podeu mirar aquesta web o bé aquesta altra) però la taula de sota ens pot donar ja una bona orientació. He inclòs el cas d’un error del 1% (força habitual) però també una segona columna amb el cas que l’error sigui del 4%. El que a mi em sobta és el poc que creix en el cas de la primera columna (en el cas del 4% encara creix menys, tot movent-se entre 536 i 601). Si acceptem un error del 1% i volem saber la intenció de vot en un poble amb 5000 votants potencials, hem de preguntar a 3289 persones, més de la meitat del total. Però si la població total és de 2 milions de persones o més, la mida mostral s’estabilitza i no arriba mai a les deu mil persones. No és una mica sorprenent? La mida mostral necessària en grans poblacions és relativament petita. No cal preguntar massa gent.

Només resta algun petit detall. Un cop sabem la mida mostral, cal triar les persones aleatòriament (amb el cens de població o el cens de votants, segons el que vulguem), i no es pot canviar res. Si li ha “tocat” a una persona, cal preguntar-li a ella i només a ella; si no vol contestar, simplement s’ha d’apuntar aquest fet però no la podem substituir per cap altre. I evidentment, el resultat del sondeig mostra el que la gent ens ha volgut dir, no el que pensen que faran…

Quan veieu els resultats d’un sondeig, penseu que probablement s’ha fet amb un interval de confiança del 95%, i esbrineu el valor de l’error que han considerat. No és el mateix un error de l’1% que un del 4%.

Per cert, en Jorge Wagensberg ens explica que la probabilitat és el grau de versemblança d’un succés abans que aquest es produeixi, mentre que la informació és el canvi d’estat mental que deixa un succés després de produir-se. Diu també que la informació, quan viatja, es vesteix de redundància per a poder resistir el soroll, i que observar és més que mirar perquè inclou la voluntat explícita de separar el soroll de la informació. No es pot parlar de probabilitat de successos que ja s’han produït ni d’informació de successos del futur.

2 comentaris

  • Jordi Domènech

    02/09/2015 9:49

    Sempre he pensat que unes eleccions no són res essencialment diferent a un sondeig; en lloc de partir d’una mostra de l’1‰, per dir alguna cosa, del cens, es parteix del 70%, però ull, que la mostra en aquest cas no ha estat triada aleatòriament en el sentit clàssic, aquí qui no vota pot ser per voluntat o per factors imponderables —salut, distància— que en principi no són neutres.
    També, i és una observació subjectiva que he fet en recontes electorals, hi ha errors en els vots, per exemple, alguna candidatura totalment desconeguda que treu més vots dels raonables; o aquells candidats al senat que treuen vots deguts a estar al costat d’un candidat més popular; o també paperetes barrejades; persones que marquen els candidats perquè no han comprès el mecanisme de votació… Per diferents raonaments estimo en més de l’1% el vot erroni: que la papereta no correspon al que volia l’elector.
    També hi ha factors aleatoris totalment legítims, com l’elector que dubta i si anéssim repetint la votació aniria variant el vot sense cap preferència clar.
    Aleshores em pregunto, Si unes eleccions són un sondeig amb un marge d’error tècnic, no es podria fer un altre sondeig molt més barat amb les mateixes garanties?
    Crec que sí, però el problema aquí és que un percentatge important de la població no s’ho creuria, durant massa temps s’ha identificat democràcia amb un sistema particular de fer eleccions. I la mateixa gent que seria molt crítica amb qualsevol variació, generalment no és gens crítica amb el sistema establert.
    Potser el que seria interessant, és obrir el debat de com s≈han de prendre democràticament decisions que impliquen conceptes que estan fora de l’abast de la majoria de la població. El que no crec que sigui una bona solució és la postura paternalista de: com que —pobrets— no ho entendran, deixem-ho igual per no tenir problemes.

  • Xavier

    30/08/2015 23:43

    M’ha agradat molt el teu article, i crec que s’hauria d’explicar molt més, i més ara que sortiran enquestes a pleret (tot i que m’estranya molt que quasi no n’hagi sortit cap des de fa dos mesos). Hi ha, però, un error, en el text o en els càlculs. Dius que “la mida mostral s’estabilitza i no arriba mai a les dues mil persones.” i crec que vols dir deu mil persones.

Comenta

*

(*) Camps obligatoris

L'enviament de comentaris implica l'acceptació de les normes d'ús