Entrades amb l'etiqueta ‘mida mostral’

La inclusió entre col·lectius, i els drets

dimecres, 27/09/2017

Ara fa un mes, molta gent a Barcelona va sortir al carrer dient que no tenia por després dels atemptats. Els esdeveniments dels darrers dies quasi que ens ho han fet oblidar.

Simplificant una mica, podríem dir que a la manifestació del 26 d’agost hi havia com a mínim tres col·lectius. Els que anomenaré (A), creien que calia rebutjar els atemptats terroristes. Els del col·lectiu (B) feien seu el lema “no tinc por” perquè pensaven que era la manera de no fer el joc als terroristes. A més, opinaven que la por, que ens fa demanar més seguretat, és l’excusa per incrementar la securització i la militarització, per retallar els drets humans i per posar fi al sistema de controls i contrapesos dels Estats de Dret. Finalment, els del col·lectiu (C) protestaven contra el comerç d’armes que fomenta aquesta militarització. Incloc en el grup (A) totes les persones que no veien clares les dues característiques definitòries del col·lectiu (B), i en el (B) tots els qui no creien que fos el moment de protestar contra el comerç d’armes.

En ciències socials, les regles no són exactes i la lògica es torna una mica difusa. Però crec que estareu d’acord amb mi en que hi ha una gradació de motivacions. En general, els del col·lectiu (B) segurament estaven d’acord amb els plantejaments de la gent del grup (A), i els del (C) acceptaven a més els arguments de les persones tant de (A) com de (B). Podríem dir que, a banda d’alguna excepció individual, el grup (C) estava inclòs en el (B) i que el (B) ho estava en l'(A) (vegeu la nota al final). Al final, cal dir que tot va sortir bé i que es va respectar el dret d’expressió i manifestació.

Ara, al cap d’un mes, la situació està esdevenint difícil i amb evidents vulneracions dels drets humans, bàsicament per part de qui té el poder, que és l’estat espanyol. Però és fàcil, simplificant un cop més, definir tres col·lectius amb unes regles semblants d’inclusió. El grup (A) d’ara vol votar i voldria un referèndum pactat. Els (B), volen que el referèndum sigui el 1-O, i els (C) volen la independència de Catalunya. Els grups són diferents, però tornem a tenir el mateix: el grup (C) està bàsicament inclòs en el (B) i el (B) ho és en l'(A).

Quina és la diferència? Doncs que ara, l’estat espanyol nega els arguments de tots ells i s’oposa als tres col·lectius. Permeteu-me que només faci un comentari, perquè el voldria fer des d’una perspectiva de ciència i de les dades concretes. Hi ha una dada que m’agradaria explicar. És de fa pocs dies, i d’una font gens sospitosa de sobiranisme: segons una enquesta de Metroscopia, el 82% dels catalans creu que la millor manera de resoldre l’actual conflicte és convocar un referèndum pactat sobre la independència de Catalunya. O sigui, que el col·lectiu (A) inclou el 82% de tots els ciutadans catalans. Els resultats són rigorosos perquè es deriven d’un formulari que es va passar la setmana passada a un total de 2.200 famílies (vegeu la nota al final). Són fins i tot sorprenents, perquè també expliquen que aquest 82% inclou, per exemple, un 57% dels votants de Ciutadans i un 40% dels votants del PP.

Davant el que pensa i vol el 82% de la població catalana i davant les seves reivindicacions per via totalment pacífica, crec que ningú, cap persona ni cap govern, té dret a aplicar mesures policials i repressives contra aquest col·lectiu, mesures que vulneren els drets dels més de 4 milions i mig de ciutadans i ciutadanes que tenen dret a votar (el 82% del cens de les eleccions del 27-9-2015, que era de 5.510.798 persones, són 4.519.000 persones). Quan el 82% dels ciutadans catalans ho demanen, cal seure i negociar un referèndum pactat. I si resulta que no és legal, segurament cal canviar la llei, com deia un dels meus mestres.

El senyor fiscal general de l’Estat, José Manuel Maza, reprovat pel parlament espanyol, va dir, en canvi, que “nosaltres estem esforçant-nos cada dia per no anar més enllà del que la llei ens permet”. Frase interessant, que els juristes haurien d’analitzar si és delicte.

Per cert, la Federació d’ONGs LaFede.cat diu, en el seu comunicat, que les mesures adoptades per l’Estat espanyol com a resposta a la convocatòria del referèndum de l’1 d’octubre són innecessàries i clarament desproporcionades, i que suposen la vulneració de quatre drets humans fonamentals: el dret a un judici just i a la tutela judicial efectiva, el dret a la intimitat, a la inviolabilitat del domicili i a la privacitat de les comunicacions, el dret a la llibertat d’expressió i d’informació, i el dret a la llibertat de reunió i manifestació.

————

NOTA: Segons la teoria de conjunts, (B) està inclòs dins de (A) si (B) és idèntic a la intersecció de (B) amb (A). De la mateixa manera, (C) està inclòs dins de (B) si (C) és idèntic a la intersecció de (B) amb (C). En d’altres paraules, si les tres definicions de (A), (B) i (C) fossin preguntes d’una enquesta, totes les persones de (A) haurien contestat afirmativament només la seva pregunta, mentre que la gent de (B) hauria contestat que “sí” les preguntes definitòries de (A) i de (B), i totes les persones de (C) haurien contestat afirmativament les tres preguntes.

La fiabilitat de l’enquesta de Metroscopia, amb una mostra de dues mil dues-centes enquestes, és ben alta. Com és fàcil veure, l’error que podem cometre amb una mostra com aquesta i amb un interval de confiança del 95%, és pot calcular com dues vegades l’arrel quadrada de (0,82 * 0,18)/2200, on 0,82 és el 82% en tant per 1, i 0,18=1-0,82. Fent aquest càlcul, trobem que l’error és del  1,6%. Per tant, amb un interval de confiança del 95%, podem afirmar que la mida del conjunt (A) és ara d’un 82% més menys un 1,6$ de la població. O sigui, entre el 80,4% i el 83,6%.

Hem de preguntar a molta gent?

dimecres, 26/08/2015

Veiem moltes enquestes i sondeigs als mitjans de comunicació. Fins a quin punt ens podem creure el que diuen? Cóm és que hi ha vegades que encerten i altres vegades que no?

Pensem en el cas més senzill de preguntes amb només dues opcions de resposta. Algú fa un sondeig per determinar quanta gent votarà una certa opció política. Al final, el que surt als diaris és que hi ha un 46,3% de futurs votants que pensen votar-la, per exemple. Cóm podem saber el percentatge de gent que vol votar una determinada opció, si no hem preguntat a tothom?

La resposta és que aquesta xifra del 46,3% és només una aproximació. De fet i com sabeu, no estic dient res de nou perquè tots sabem que les estadístiques donen aproximacions: no poden donar valors exactes. En tot cas, el que és menys conegut és que per entendre bé qualsevol resultat d’una enquesta o sondeig hem de saber el valor de l’error i l’interval de confiança. A l’exemple anterior, el correcte seria dir: “amb un error del 1% i un interval de confiança del 95%, podem dir que el 46,3% de futurs votants pensen votar aquesta opció”. Ningú explica tot això per no enfosquir i complicar el missatge comunicatiu, però aquests dos valors, l’error i l’interval de confiança, segur que són ben coneguts pels estadístics que han analitzat les dades de l’enquesta. La idea és senzilla. Ens cal fixar un error  perquè mai podem tenir una certesa absoluta en estimacions que són resultat de sondeigs. Així, quan acceptem un error del 1%, el que estem dient i que podrem afirmar és que el percentatge de futurs votants es trobarà entre el 45,3 i el 47,3%, amb un 1% d’incertesa en els dos sentits. Ara bé, és clar que encara no n’hi ha prou perquè el fet de preguntar a un conjunt de persones mai ens donarà informació precisa sobre el que vol fer la resta, ni tan sols acceptant aquest error del 1%. Però aquí és on arriba l’estadística per ajudar-nos amb els intervals de confiança. Què volem dir quan parlem de què l’interval de confiança és del 95%? Volem dir que si algú ve i ens diu que el percentatge de futurs votants es trobarà entre el 45,3 i el 47,3%, tindrà raó el 95% dels casos.

Aquesta màgica barreja d’error i interval de confiança és el que permet que l’estadística mesuri el que és parcialment desconegut i el que només és probable. No sabem què opina tothom, però podem afirmar que si diem que el percentatge de vots estarà entre el 45,3 i el 47,3%, encertarem el 95% de les vegades.

Mireu la taula manuscrita que he preparat a sota. Ens diu, en el cas més desfavorable i amb un interval de confiança del 95%, si hem de preguntar a molta o poca gent. Aquest nombre de gent als qui haurem de preguntar és el que s’anomena mida mostral. Hi ha formules per calcular-la (si esteu interessats podeu mirar aquesta web o bé aquesta altra) però la taula de sota ens pot donar ja una bona orientació. He inclòs el cas d’un error del 1% (força habitual) però també una segona columna amb el cas que l’error sigui del 4%. El que a mi em sobta és el poc que creix en el cas de la primera columna (en el cas del 4% encara creix menys, tot movent-se entre 536 i 601). Si acceptem un error del 1% i volem saber la intenció de vot en un poble amb 5000 votants potencials, hem de preguntar a 3289 persones, més de la meitat del total. Però si la població total és de 2 milions de persones o més, la mida mostral s’estabilitza i no arriba mai a les deu mil persones. No és una mica sorprenent? La mida mostral necessària en grans poblacions és relativament petita. No cal preguntar massa gent.

Només resta algun petit detall. Un cop sabem la mida mostral, cal triar les persones aleatòriament (amb el cens de població o el cens de votants, segons el que vulguem), i no es pot canviar res. Si li ha “tocat” a una persona, cal preguntar-li a ella i només a ella; si no vol contestar, simplement s’ha d’apuntar aquest fet però no la podem substituir per cap altre. I evidentment, el resultat del sondeig mostra el que la gent ens ha volgut dir, no el que pensen que faran…

Quan veieu els resultats d’un sondeig, penseu que probablement s’ha fet amb un interval de confiança del 95%, i esbrineu el valor de l’error que han considerat. No és el mateix un error de l’1% que un del 4%.

Per cert, en Jorge Wagensberg ens explica que la probabilitat és el grau de versemblança d’un succés abans que aquest es produeixi, mentre que la informació és el canvi d’estat mental que deixa un succés després de produir-se. Diu també que la informació, quan viatja, es vesteix de redundància per a poder resistir el soroll, i que observar és més que mirar perquè inclou la voluntat explícita de separar el soroll de la informació. No es pot parlar de probabilitat de successos que ja s’han produït ni d’informació de successos del futur.