Arxiu de la categoria ‘Informàtica’

Versatilitat, autonomia, morts i ètica

dijous, 18/01/2018

A mitjans del segle XX, no hi havia màquines versàtils. Les neveres servien per conservar aliments, les tisores per tallar i les bicicletes per anar amunt i avall. Però ben aviat, els ordinadors ens van canviar les coses. Treballaven amb informació, adaptant-se en cada moment a allò que ens calia i fent tot tipus de càlculs. La seva versatilitat era extraordinària. Van passar de ser eines de càlcul a ajudar-nos en l’escriptura, processament i gestió de textos, ben aviat es van convertir en màquines ideals per manipular imatge, vídeos i so, i ara són eines bàsiques per a la comunicació i cerca d’informació. Els ordinadors són essencialment màquines versàtils.

Pot semblar estrany aquesta afirmació que els ordinadors són màquines, perquè estem acostumats a pensar que una màquina és un giny mecànic que actua i fa alguna cosa, mentre que els ordinadors treballen amb això tan subtil que anomenem informació. Però el fet és que les màquines actuals inclouen en general ordinadors que, gràcies a determinats mecanismes actuadors, realitzen tasques en el món real. Un amic meu diu que els cotxes d’avui en dia són ordinadors que controlen un motor, tot plegat cobert amb allò que anomenem carrosseria. Podríem parlar dels robots-aspiradora i de molts altres invents per la llar. I és clar que els mòbils són ordinadors amb una bona càmera de fotos que, a més, serveixen per a telefonar. Estem voltats d’ordinadors que fan coses, des de sistemes que llegeixen la matrícula del cotxe en entrar al pàrquing, fins màquines que ens fan un TAC i ens creen imatges del que tenim dins del nostre cos. En tots aquests ginys sempre hi ha el mateix: un ordinador convenientment programat, que detecta el que passa en el seu entorn amb un conjunt adequat de sensors, i que controla determinats actuadors que acaben fent el que cal. Ordinadors amb sensors i actuadors.

Fa ben poc, alguns d’aquests invents han aprés a volar. Són els drons: ordinadors que volen, detecten i actuen. Tenen motors elèctrics, una bateria, un sistema de control de vol i estabilització (ordinador), sensors (d’alçada, GPS i altres) i alguns actuadors (per exemple, una càmera de fotos o de vídeo). Són força autònoms, però habitualment requereixen que algú els condueixi des de terra. Els més sofisticats es controlen des d’un ordinador que mostra, a la pantalla, allò que el dron està veient amb la seva càmera. Això facilita el guiatge i la decisió de quan cal fer les fotos. Això sí, els drons, ordinadors que volen, porten determinats dispositius específics en funció del seu ús. És habitual que incloguin una càmera de fotos, però poden portar, a més i per exemple, material específic d’ajut per a rescats a la muntanya o fins i tot desfibril·ladors.

Els drons, hereus dels ordinadors, són altament versàtils. Poden salvar vides, cartografiar cultius, o fotografiar objectius militars que després seran bombardejats. Fins i tot, poden portar explosius i matar, comandats remotament des d’un ordinador per un “soldat” que actua com si estigués en un joc inofensiu. Malauradament, però, hi ha molt poc debat ètic sobre les morts extra-judicials amb drons. És èticament acceptable que, en països que han abolit la pena de mort, els jutges no condemnin ningú a mort mentre hi ha qui pot matar, impunement, amb drons? No puc entendre que la resposta no sigui un NO rotund.

Doncs bé, les armes autònomes encara van un pas més enllà. Aquestes armes, habitualment drons, inclouen un sistema d’intel·ligència artificial que pot acabar decidint, sense intervenció humana, si cal matar una determinada persona o destruir un objectiu concret. Són autònomes, cert; però el problema és que, com nosaltres, es poden equivocar. Perquè els sistemes d’intel·ligència artificial estan sotmesos a errors i perquè les màquines no tenen el que s’anomena comprensió profunda. I el problema és que els seus errors són vides de persones concretes.

Actualment hi ha un gran debat sobre aquestes armes autònomes letals (LAWS, conegudes també com robots assassins; la imatge de dalt és d’aquesta web). L’Stuart Russell, de la Universitat de California a Berkeley, diu que són “la tercera revolució de l’art de la guerra, després de la pólvora i la bomba atòmica”. I hi ha debat perquè hi ha grans interessos. El Departament de Defensa nord-americà insta a un augment de la inversió en tecnologies d’armes autònomes, de manera tal que “Amèrica pugui mantenir la seva posició davant els adversaris, que també explotaran els seus beneficis operacionals”. La frase no pot ser més clara. És l’ètica del poder i del domini, la llei del més fort que ignora la gent.

Per sort, els científics pensen més en termes d’una ètica que posa les persones al centre i que defensa els quasi oblidats drets humans, un dels quals és l’indiscutible dret a la vida de tota persona humana. Per exemple, un total de 116 experts en els àmbits de la intel·ligència artificial i la robòtica han signat una carta en la que demanen a les Nacions Unides que prohibeixi aquestes armes autònomes letals.

Acabo citant un article recent d’en Michael Shermer, en el que diu que el que cal prohibir és la guerra, directament. El podeu llegir aquí. Diu (poca gent ho sap) que això no és res de nou i que, de fet, la guerra ja es va prohibir l’any 1928 amb el pacte de Kellogg–Briand a París. Les disposicions bàsiques del pacte, que continua vigent, fixaven la renuncia a l’ús de la guerra i la promoció de la solució pacífica dels conflictes i disputes. Ho expliquen l’Oona A. Hathaway i en Scott J. Shapiro, professors de Yale, en un llibre recent. En Michael Shermer recorda el que ja deia en Salmon Levinson l’any 1917: que no hauríem de tenir lleis sobre la guerra com tenim ara, sinó lleis contra la guerra, de la mateixa manera que no tenim lleis sobre l’assassinat o l’enverinament, sinó lleis contra l’assassinat i l’enverinament. Cent anys després, amb una segona guerra mundial i infinitat d’altres guerres que han generat morts innocents, no només continuem igual sino que ara volem que les màquines versàtils siguin les que s’encarreguin de la feina bruta. Qui són els responsables? On és la ètica?

———

Per cert, en Bru Rovira parla del cas de l’activista Helena Maleno, i constata que el govern espanyol pressiona un tercer país (el Marroc) perquè condemni una persona que les nostres lleis no condemnen. Recorda que la investigació va ser ja rebutjada i arxivada per la mateixa fiscalia de l’Audiència Nacional.

On és, la informació?

dissabte, 16/12/2017

Els informàtics som cuiners d’informació. La guardem i la processem. La treballem, la preparem i intentem fer-la més digerible. A mi personalment, m’agrada treballar la informació geomètrica que permet modelitzar i representar la forma de tot el que ens envolta, però hi ha companys que són especialistes en camps tant diversos com el de la informació relativa al color i aparença dels objectes, l’anàlisi de dades, l’estudi d’informació textual, la interpretació d’imatges, el tractament de dades de sensors, la interpretació de la informació que donen els escàners mèdics, l’anàlisi de tot el que hi ha a internet, i molts d’altres. La informació es pot obtenir, emmagatzemar, enviar, compactar, des-compactar, filtrar, comparar, transformar, sintetitzar, i fins i tot crear.

Però, com es guarda? Us heu preguntat alguna vegada com és que les targetes externes de memòria dels nostres telèfons, com la de la imatge, poden guardar fotos, vídeos i documents? On són, les fotos? Ens hem acostumat a aquest estrany món màgic en el que podem veure noticies de tot el món pràcticament en temps real ben asseguts al sofà de casa i en el que podem parlar i veure les persones que estimem mentre caminem pel carrer i mirem la pantalla del mòbil, i ja res ens sorprèn. Però, ben mirat, no deixa de ser meravellós. Hem après a fer uns petits objectes, prims i petits com una ungla, minerals i inerts com les pedres, però que, amb la seva sofisticada estructura interna, poden guardar milers de fotos i vídeos. Són plaques minerals que amaguen un immens volum d’informació. La targeta que veieu a la imatge, de 32 GB, té espai per uns 64.000 llibres com el que ara mateix estic llegint.

L’Emilio Lledó ens parla d’aquest invent màgic que va ser l’escriptura. Ens diu que l’escriptura va ser el primer artifici per subjectar el riu del temps, permetent que el “després” no es dissolgués per sempre i que les paraules pronunciades no s’esgotessin en l’oralitat. Només l’escriptura va poder allargar la vida de la memòria, consolidant una cultura que abans, únicament amb la tradició oral, era immensament fràgil. Perquè quan parlem, estem comunicant informacions a travès de vibracions de l’aire, vibracions efímeres que es perden per sempre més si ningú, en aquell lloc i moment, les escolta. En canvi, l’escriptura aconsegueix el miracle de permetre la comunicació entre dos instants diferents de temps, amb marques a tauletes d’argila o marques de tinta a pergamins que perduren anys i anys. Per això, l’Emilio Lledó diu que el llibre és, abans que res, un recipient on reposa el temps, una presència que, paradoxalment, és carregada d’absències de manera que la lectura conjuga dues temporalitats, la de qui el va escriure i la de qui el llegeix. Jo només afegiria un detall: els llibres són recipients on reposa el temps, però també són regals d’informació. Fins el descobriment de la fotografia i el cine, els llibres van ser pràcticament els únics recipients (o contenidors) d’informació que va tenir la humanitat.

La informació és allò que ens permet conèixer, entendre, tenir arguments, decidir amb coneixement de causa. Però no existeix per sí sola. Li cal un substrat, basat en la matèria o en l’energia. I si no el té, desapareix. La matèria ens serveix per guardar-la, l’energia per enviar-la. Les lletres de tinta a les pàgines dels llibres codifiquen la informació del text en base a unes determinades pautes de forma i ordre. Quan llegim, aquest ordre material ens arriba a la retina gràcies a l’energia d’aquests fotons efímers que surten de la pàgina i que justament existeixen gràcies a uns altres fotons, els de la làmpada de casa. Tot és ben subtil. No podem llegir sense fotons, i els fotons, sense ulls que mirin, es perden junt amb la seva informació. Però la conjunció de pàgines escrites, fotons i mirada fa que la informació arribi al nostre cervell i que quedi emmagatzemada a les connexions entre neurones. És la informació dels llibres, cartells, imatges i vídeos, que ens arriba gràcies a la llum i que acaba guardant-se en petites modificacions de la matèria que conforma el nostre cervell.

Guardem informació visual, auditiva i en general sensorial al cervell, i el nostre cos guarda, a la seqüència de nucleòtids de l’ADN, tota la informació genètica que permetria fins i tot clonar-nos. Creem informació amb tots els correus electrònics i missatges que enviem, informació que al menys durant un temps ens queda guardada als nostres mòbils i portàtils. El vent que s’emporta les espores i llavors, ajuda a disseminar informació de les plantes, a la vegada que informa les abelles de les flors que requereixen pol·linització. Fins i tot rebem informació dels estels, codificada en l’espectre dels fotons de la seva llum. Perquè la informació no és cosa nostra. Fa milions d’anys que va repetint aquest cicle de la informació inherent a la matèria, que s’envia, es rep, es torna a guardar segurament una mica modificada, i així successivament.

Quan veig una targeta Micro-SD com la de la imatge no deixo d’admirar-me. Penso en els primers ordinadors de memòria de nuclis de ferrita, amb els que vaig tenir el privilegi de poder treballar. A la imatge de sota teniu una foto d’un tros d’una d’aquestes memòries, amb 2.500 nuclis. Compareu la mida (el meu dit pot servir de referència) amb la de la targeta de la imatge de dalt, on hi caben 32 mil milions de Bytes. En canvi, com que cada nucli podia guardar un bit, el tros de memòria de la foto podia emmagatzemar uns 312 Bytes. En aquesta web podeu veure el seu funcionament.

Però les memòries de ferrita van desaparèixer amb l’aparició dels circuits integrats i la miniaturització. Vam passar pels grans discs durs, pels disquets, pels CD i pels DVD. Els CD són com camps llaurats, amb solcs que marquen els bits individuals d’informació. Ho podeu veure, per exemple, a les imatges d’aquesta web. I, tornant al principi, on és la informació que guardem en un llapis de memòria o en una targeta Micro-SD? Les memòries flash no tenen nuclis de ferrita ni solcs, sino pous. La targeta de la imatge conté un total de 256 mil milions de pous microscòpics de potencial, ben aïllats, cada un dels quals pot atrapar i guardar electrons sense deixar-los sortir. La informació es guarda en pous plens i pous buits, que codifiquen els bits de tot allò que hi posem. Podem deixar la targeta en un calaix i al cap d’uns anys connectar-la via USB a l’ordinador. Comprovarem que la informació és allà, ben guardada. A les targetes flash no hi ha lletres ni píxels; només pous d’electrons.

La informació és etèria, però sabem que necessita una base material on reposar. És la gran paradoxa, que fa que sigui limitada, en temps, en espai i en volum. Pot durar centenars de milions d’anys, en trossos d’ADN que trobem en restes fossilitzades d’antics animals i plantes. O pot ser efímera, quan per error esborrem allò que acabem d’escriure. Aquest límit temporal és dramàtic. Hem perdut la majoria de manuscrits de l’antiguitat i ens hem de conformar amb el poc que ens està arribant. El temps és inexorable, i acabarà escombrant, moltes vegades de manera aleatòria, gran part del que ara ens sembla important. I també és evident que la immensa majoria de les fotos que es fan els joves d’avui en dia no arribaran pas als seus néts. Però a més és limitada en espai perquè és molt rar que no romangui a la Terra. I ho és en quantitat i volum perquè necessita un determinat substrat material que la emmagatzemi. Per tant, el nombre màxim de bits d’informació té un límit, que és de l’ordre del nombre d’àtoms (o partícules) a l’Univers, i que a la seva vegada és de l’ordre de 10 elevat a la potència 82. Un 1 seguit de 82 zeros. És un valor absolutament gegantí, però és un límit. La informació, a cavall entre la matèria i l’energia, és allò tan estrany, eteri i limitat que ens regalen els llibres quan els llegim a l’ombra d’un arbre.
———

Per cert, Vicenç Villatoro cita un acudit dels temps de Franco, que deia: “En España no se persigue a nadie por sus ideas, siempre que se mantengan en su espacio natural, que es el cerebro”.

La personalitat de la Tay

divendres, 1/12/2017

La Tay va ser un robot dissenyat per conversar. Era un “ChatBot“, terme que no és més que una contracció de xerraire (chatter) i robot, i que va ser proposat l’any 1994 per en Michael Mauldin. Aquests robots són programes informàtics que simulen converses, participen en xats, i es comuniquen amb persones. Els més habituals i senzills analitzen paraules clau de la nostra pregunta i construeixen la seva resposta tot consultant una base de dades de paraules i expressions. Moltes vegades els hem de patir en els sistemes telefònics d’atenció al client i en alguns centres de trucades. Són robots de xat específics per a converses relacionades amb un propòsit determinat i no per a qualsevol tipus de comunicació humana.

La imatge, que podeu trobar a aquesta web, és la que van escollir els creadors de la Tay. Val a dir que els robots xerraires són ben peculiars. No són materials. Són conjunts de bits, programes informàtics que necessiten un ordinador per a poder reaccionar i actuar. Els anomenem robots perquè reaccionen als nostres estímuls, actuant i creant respostes. Pertanyen, en definitiva, al que ara anomenem “aplicacions”. En tot cas, la Tay era especial, perquè tenia això que diem “intel·ligència artificial”. Les seves reaccions no estaven programades, sino que eren conseqüència del que havia après. Contestava en base al que “sabia”, i cada nova pregunta li servia per aprendre una mica més. Va ser creat per Microsoft amb aquest nom, Tay, que no és més que un acrònim: “Thinking about you“. Tay va ser dissenyat per imitar la conducta d’una noia nord-americana de 19 anys. Tenia un sofisticat sistema d’aprenentatge profund que li permetia aprendre mentre anava interactuant amb usuaris humans. I el 23 de març de 2016 va iniciar la seva aventura com una usuària més de Twitter. Va ser, però, una aventura ben curta, de només dos dies. En només 16 hores, Tay va enviar més de 96.000 tuits mentre s’anava fent racista i mentre anava enviant missatges cada cop més xenòfobs i amb més càrrega sexual. El van haver de desconnectar i Microsoft es va disculpar públicament.

Tay havia estat dissenyada per a fer-se més intel·ligent a mesura que els usuaris (sobretot els joves) anessin interactuant amb ella i li anessin enviant tuits. Però es va trobar en un entorn on bàsicament només hi havia violència, intolerància i insults. I ràpidament s’hi va adaptar, difonent tot tipus de frases racistes i masclistes i un bon nombre d’invectives d’odi. Va aprendre ben ràpid de tot allò que els humans li van tuitejar. La primera reacció de l’empresa va ser dir que Tay era una “màquina d’aprenentatge” i que algunes de les seves respostes eren inadequades, també indicatives dels tipus d’interaccions que algunes persones tenen amb ella. Però desprès, l’empresa va haver d’admetre que l’experiment no havia anat bé. Tot i que una de les directores de l’empresa, Satya Nadella, creu que aquest tipus de robots de xat són el futur de les aplicacions pels mòbils i que aviat els acabarem tenint al correu electrònic i a la missatgeria, el cert és que cal trobar maneres de prevenir que els usuaris d’internet puguin influir de manera negativa en ells per tal de garantir el respecte als principis ètics.

El sistema d’aprenentatge profund de Tay i de moltes altres aplicacions actuals d’intel·ligència artificial, es basa en una xarxa neuronal de moltes capes, en general més de 10. Justament, el terme “aprenentatge profund” (Deep Learning) es deriva d’aquest fet que es treballa en múltiples capes, capes que treballen d’una manera que recorda el funcionament de les neurones del cervell amb les seves connexions. Cada cop que Tay rebia un tuit, els seus 140 caràcters s’enviaven a la primera capa de “neurones”. Les capes d’una xarxa neuronal són una munió de cel·les, cada una de les quals pot guardar un valor. En aquest cas, les cel·les de la primera capa acabaven guardant informacions diverses sobre el contingut, les paraules i l’extensió del tuit. Després, i a travès del gran entramat de connexions que hi ha entre totes les cel·les de la primera capa i les de la segona, es calculen els valors de les cel·les de la segona capa de manera tal que el valor que acaba guardant cada una d’aquestes cel·les és una barreja, amb coeficients i funcions específiques per cada connexió cel·la-cel·la, de tots els valors de les cel·les de la primera capa amb les que està connectada. Aquest procés es repeteix tantes vegades com capes té la xarxa neuronal, i el que surt de la combinació de valors de les cel·les de la darrera capa és el tuit de resposta. Tot i que l’estructura no és difícil d’entendre, una xarxa neuronal profunda només funcionarà de manera acceptable si els coeficients i funcions associats a totes i cada una de les connexions entre capes estan ben ajustats. I aquests són justament els valors que contenen “l’aprenentatge” que ha anat fent el sistema. Cada nou tuit que rebia Tay generava una resposta, però a més, ajustava una mica els coeficients i funcions associats a totes i cada una de les connexions entre les seves cel·les neuronals. Com a nosaltres, a Tay, l’experiència l’anava configurant i anava marcant la seva personalitat tuitera. L’únic problema és que Tay era massa innocent i s’ho creia tot.

Les aplicacions d’aprenentatge profund basada en xarxes neuronals de moltes capes estan revolucionant la intel·ligència artificial. Cada cop són més a la nostra vida quotidiana i cada cop hi seran més. Traducció automàtica, reconeixement de cares, publicitat personalitzada segons els interessos que se suposa que tenim, i una llista que no s’acaba. Però hem de tenir present que són una eina, i que les eines no serveixen per tot. Els martells van bé per clavar claus, però si tenim un cargol, millor que agafem un tornavís. En aplicacions d’aprenentatge profund, cal tenir en compte com a mínim tres eixos: el d’acceptació d’errors, el de la mida de les dades i el de la seva qualitat. El primer, el de l’acceptació d’errors, té relació amb l’ús que en vulguem fer, i amb un tret inherent a les aplicacions d’aprenentatge profund i a les xarxes neuronals: no sempre l’encerten, a vegades s’equivoquen, i a més és difícil saber el seu grau de fiabilitat. No ens ha d’estranyar. Nosaltres ens equivoquem, i les noves eines de la intel·ligència artificial, que ens volen emular, també. El que passa és que en alguns casos els errors són acceptables i en d’altres, no. Si estem traduint un text i la frase que ens dona el sistema de traducció no té sentit, la corregirem i no passa res. Però si un metge està planificant una operació quirúrgica i el sistema s’equivoca, el resultat pot ser fatal. Per això, en aquest eix d’acceptació d’errors, la traducció automàtica pot conviure amb moltes equivocacions i en canvi la planificació quirúrgica o el disseny de ponts no (per posar dos exemples). El segon eix, el de la mida de les dades, indica una cosa força lògica. Ens diu que l’aprenentatge automàtic millora a mesura que incrementem el nombre de dades que li subministrem per a que aprengui. I el tercer, el de la seva qualitat, ens fa veure que l’aprenentatge necessita dades fiables, ben contrastades i diverses. En aquest context, ara sabem que les aplicacions d’aprenentatge profund basades en xarxes neuronals són eines que només serveixen quan podem acceptar un cert nivell d’errors, quan podem fer que aprenguin amb moltíssimes dades (l’anomenat Big Data) i quan aquestes dades són de qualitat. És el que passa justament a la traducció automàtica: Google, per exemple, disposa de moltíssims exemples de traduccions de qualitat, fetes per traductors professionals, que utilitza per a que els seus sistemes aprenguin. I això és justament el que no va passar amb el robot Tay, que bevia d’informació esbiaixada i de baixa qualitat. I és el perill de moltes aplicacions i sistemes que ens poden arribar (una de les quals són les polèmiques i molt perilloses armes autònomes). Cal estar ben atents, perquè la intel·ligència artificial pot ser una bona eina en aquells casos en que ens trobem ben situats als tres eixos, però pot ser funesta si la volem fer servir per allò que no ens pot resoldre.

Si voleu tenir un sistema de resposta automàtica a consultes no crítiques i sabeu com preparar un bon mecanisme d’aprenentatge basat en moltíssimes dades fiables, les aplicacions d’intel·ligència artificial us poden aportar una bona solució. Però si el que voleu, per exemple, és dissenyar un rellotge de sol, no us hi penseu, i apunteu-vos als algorismes clàssics de la geometria i astronomia. I si no us podeu permetre que el sistema de resposta automàtica s’equivoqui, penseu en solucions alternatives, fiables i deterministes. Els martells, usem-los per clavar claus.

——

Per cert, en Ferran Sáez Mateu diu que les anomenades “xarxes socials” estan substituint o, com a mínim, començant a desplaçar la noció clàssica d’opinió pública. Pensa que el periodisme del segle XXI ha de ser capaç de perfilar una identitat pròpia en relació a la de les xarxes socials.

Les mostres aleatòries i el consens

dijous, 19/10/2017

La imatge mostra un petit tros del conjunt de punts que obtenim amb un sistema d’escaneig de tipus LIDAR quan estem capturant i reconstruint una zona urbana. El sistema detecta, genera i ens dona milions de punts a l’espai, cada un d’ells amb les seves coordenades (x,y,z) i el seu color. El que veiem aquí a l’esquerra no és més que una munió de punts 3D (una mena de núvol), que podem analitzar i visualitzar interactivament. Mireu, per exemple, aquest vídeo o bé aquest altre. Els punts d’aquests núvols, però, són aproximats, perquè els sistemes d’escaneig, com tots els sensors, malauradament introdueixen errors. Errors que es fan més grans a mesura que els edificis que volem capturar, com el de la imatge, són més lluny.

Pensem ara en el problema de detectar, de la manera més exacta possible, la façana dels edificis. Només sabem que habitualment, les façanes són planes i verticals. Com la podem reconèixer i detectar, si només tenim punts i tots ells són aproximats? Què hem de fer per eliminar i no considerar tots aquells punts “atípics” (anomenats outliers en anglès) que poden emmascarar el resultat, com per exemple els punts de les fulles dels arbres que són propers a les façanes?

Sortosament, tenim una solució. L’algorisme RANSAC, proposat l’any 1981 per Martin Fischler i Robert Bolles, ens pot resoldre el problema. És un algorisme que cerca el consens a partir de mostres aleatòries. Podem tenir milers o milions de punts, això no importa massa. N’escollim N (per exemple, 50) a l’atzar. Fem la hipòtesi que aquests N punts són de la façana que volem detectar, i calculem un pla vertical F que els aproximi. Això no ha de ser difícil, perquè podem utilitzar tècniques de regressió i perquè només estem utilitzant un conjunt reduït de N punts. I ara ve el pas important: analitzem quin consens té aquest pla F entre tots els altres punts. Això tampoc és complicat. Només necessitem una tolerància que anomenaré T (per exemple, un centímetre). Llavors, per cada un de tots els altres punts del núvol, mirem si la seva distància al pla F és o no més petita que T. Si és més petita, és que aquest punt “accepta” el pla F. A final, acabem tenint una mesura del grau de consens que genera aquest pla F, en base al percentatge de punts que l’accepten. La resta de punts, en canvi, són atípics (outliers) en relació a F. fet això, en aquest moment ja hem aconseguit tenir una primera estimació de la façana. Però ara, l’algorisme RANSAC repeteix tot el procés amb uns altres N punts a l’atzar, troba un nou pla F’, compara el grau de consens de F i F’, i es queda amb el que en té més. I això ho va repetint una i altra vegada, comparant cada vegada el consens del nou pla amb el millor consens de tots els anteriors, fins que decidim que l’aproximació de la solució ja és prou bona.

L’algorisme RANSAC és no determinista, perquè les mostres són aleatòries. A més, només és segur que ens trobarà la millor solució possible si no tenim pressa i el deixem que vagi provant anys i anys. Si, en canvi, l’aturem en un cert moment, només podem afirmar que la solució serà correcta amb una certa probabilitat. En tot cas, l’experiència demostra que en general acaba donant molt bons resultats i separant les dades útils (inliers) de les atípiques (outliers) en un temps raonable. Un cop separats, podem eliminar aquests punts atípics i quedar-nos amb els punts que ens determinen bé la façana, perquè RANSAC ens ha detectat tot allò que ens pertorbava la solució del problema.

Els humans, de fet, no som tan lluny d’aquest consens de mostres aleatòries. Si fem l’exercici de substituir núvols de punts per grups socials i rellegim els paràgrafs de dalt pensant en persones en lloc de punts, l’algorisme RANSAC segurament ens recordarà el nostre comportament quan escollim comissions, votem representants, o bé discutim projectes urbanístics o d’altre tipus que les administracions exposen públicament. En tots els casos, l’objectiu és obtenir el màxim de consens de la resta de la societat. La única diferència amb l’algorisme RANSAC és que nosaltres aviat ens cansem, mentre que ell no. No és fàcil, això de canviar la mostra. Costa canviar i fer refer projectes, costa renovar comissions i revocar representants per tal de millorar el consens. És així. És la condició humana. Per bé i per mal, no som màquines.

———
Per cert, en David Fernàndez diu que segurament, l’única contrarevolució en marxa avui és l’ofensiva autoritària, devastadora i neoliberal que recorre el planeta. Replegaments de la por i una estranya retrotopia, diu, quan en difícils temps de crisi l’extrema ambigüitat de la condició humana es dirimeix sempre, antagònicament, entre la brutalitat i la cooperació.

La paradoxa de la informació

divendres, 8/09/2017

La informació no té una definició única. La gran enciclopèdia catalana diu que informació és una “notícia o notícies que hom tracta de saber, que hom rep”, però que també és el “contingut d’una o més dades, tot fent abstracció de la representació concreta que adopta”. Coses que volem saber o que acabem sabent, i que podem extreure de les dades que rebem. La Wikipèdia, d’altra banda, la defineix com “tot allò que un ser humà és capaç de percebre, incloent-hi les comunicacions escrites i orals, les imatges, l’art o la música”, i com “el fet de processar, manipular i organitzar dades d’una forma que produeixin coneixement i esvaeixin el desordre”.

La informació és multifacètica. És el que percebem, el que incrementa el nostre coneixement. També, en paraules de Claude Shannon, informació és allò que redueix la incertesa. La frase “avui a la nit serà fosc” no és informativa perquè és quelcom que tots sabem. Però si dic “aquesta nit no vindré a sopar” estic concretant, disminueixo la incertesa, i per tant informo (vegeu la nota al final). Ara bé, a més d’aquest aspecte cultural i comunicatiu, la informació s’ha de transmetre, i aquí és on apareixen les dades, l’ordre i el substrat que la suporta. Les plantes informen amb les seves olors, les formigues amb els rastres i els ocells amb els seus cants. Els sons dels dofins o dels rossinyols, perfectament codificats, ordenats i seqüenciats, són útils als seus companys encara que nosaltres no els entenguem. Per això, podem dir que la informació requereix un determinat ordre en un cert substrat, a més d’un codi que li doni sentit i ens permeti llegir-ne el significat. Podem llegir un article a la pantalla de l’ordinador només quan el seu conjunt de més d’un milió de píxels s’ordena i ens mostra les lletres del text en negre sobre blanc, i tot seguit el podem recordar gràcies a l’ordre químic de les neurones del nostre cervell. Quan una persona parla en una llengua que desconeixem o escriu signes que no entenem, observem l’ordre sonor o gràfic del que fa, però no podem captar la semàntica dels seus missatges.

Què ens diu, la imatge de dalt? A primera vista, són 15 ametlles disposades en un ordre estrany damunt una pedra, formant set columnes amb 4, 3, 2, 1, 1, 2 i 2 fruits secs. Imagineu ara que tenim una quadrícula imaginària amb 4 files i 8 columnes, de manera que la primera columna és a l’esquerra i no té cap ametlla. L’ordre es fa més explícit, i ens presenta quatre files de 8 caselles, algunes plenes i altres buides. Ara ja veiem, en aquest substrat d’ametlles, una taula ordenada; però encara ens falta el descodificador. Però només cal que ens diguin que les hem disposat en files seguint el codi ASCII dels ordinadors, i ja podrem llegir el missatge: les quatre files codifiquen les quatre lletres de la paraula “Bits”.

En informàtica, tota la informació es codifica i representa amb seqüències de bits. Cada lletra dels texts que escrivim als missatges i correus electrònics i cada lletra dels articles i llibres que llegim i que trobem a la web, es guarda en un “byte“, que són 8 bits. Els sons, els missatges de veu, les fotos, la nostra agenda, els vídeos i tot el que tenim als ordinadors tenen el mateix aspecte: una llarga tirallonga de bits “1” i “0”. Els ordinadors funcionen gràcies a que apliquen el descodificador adequat a cada tipus d’informació, perquè si per exemple utilitzessin el codi ASCII per interpretar vídeos, no veuríem res. D’altra banda, els bits són també una eina de mesura: si codifiquem la informació de manera òptima i eliminant totes les possibles redundàncies, la quantitat d’informació es pot mesurar pel nombre de bits que ocupa. Però aquesta mesura acaba sent diferent pels humans i pels ordinadors, cosa que té conseqüències pràctiques molt concretes, per exemple quan l’ordinador o el mòbil ens demana que escollim i entrem una nova paraula clau (un nou “password“): tenim una falsa percepció d’allò que és indesxifrable (vegeu un cop més la nota al final).

Per bé o per mal, som al segle de la informació. En Gérard Berry comenta que el segle XIX va ser el segle de la matèria, de la química i de la síntesi dels metalls i altres elements. El segle XX, en canvi, va ser el segle de l’energia, a més de la matèria: l’electricitat, el petroli, l’energia nuclear i fins i tot l’inici de les renovables. El segle passat va veure el naixement de la informàtica, però no ha estat fins el segle XXI que hem vist un creixement quasi explosiu de la quantitat informació que corre pel món. Recordo que, l’any 1992, el disc dur del meu ordinador era de 20 MB (un “MegaByte” és un milió de bytes, equivalent a 8 milions de bits). Ara, qualsevol targeta “MicroSD” de mòbil té 16 o 32 GB, més de mil vegades més que el que jo podia guardar fa tan sols 25 anys. No parem de generar, guardar i “compartir” informació.

La paradoxa del moment actual, però, ens l’explica molt bé en Renee Morad. Internet fa que la informació sigui més accessible que mai. Però molts dubten (dubtem) de la veracitat del que hi troben. Aquesta desconfiança (sobretot en fonts “llunyanes”, tal vegada esbiaixades i poc contrastades) alimenta una demanda de nova informació que és cada vegada més gran. En altres paraules: hi ha massa informació; però, en no saber quina és certa i quina és falsa i del tot il·lusòria, nosaltres en generem més. Com que moltes persones fan el mateix, es manté el creixement continu de la quantitat d’informació. Cada cop hi ha més informació que és menys fiable en mitjana i cada cop es farà més difícil filtrar-la. Incrementem la quantitat mentre reduïm la qualitat. Llegir és fàcil, entendre i comprendre serà cada vegada més difícil.

Per cert, en David Foster Wallace deia que ensenyar a pensar és ensenyar a ser una mica menys arrogant i a contemplar-nos nosaltres mateixos i les nostres certeses amb consciència crítica, perquè un gran percentatge del que tendim a donar per segur s’acaba demostrant que és fals i del tot il·lusòri.

———

NOTA: L’entropia de Shannon és una mesura del desordre que conté un missatge. És clau per a quantificar la informació que conté. En concret, la informació que conté un missatge es pot mesurar com la inversa de seva probabilitat (aquí, per exemple, en podeu veure una explicació senzilla i basada en exemples de predicció meteorològica). Quan ens parlen d’un fenomen rar, la seva probabilitat és baixa i per tant, la mesura de la informació que aporta és alta. En canvi, quan ens diuen una obvietat d’absoluta certesa (com que “la sang és vermella”), la probabilitat és màxima i la informació, nul·la. En tot cas, la novetat d’una certa informació depèn del receptor: la frase “la capital de Finlàndia és Hèlsinki” segurament no aporta cap nova informació a moltes persones mentre que, per algunes altres, pot ser quelcom nou i informatiu.

Com podeu veure en aquesta auca, la dificultat de les paraules clau que utilitzem (i la informació que contenen) és molt diferent pels humans i per les màquines. L’auca compara les paraules clau “Tr0ub4dor&3” i “correcthorsebatterystaple“. La primera es basa en escollir una paraula poc usada (en aquest cas podria ser “troubador” en anglès), posar o no la primera lletra en majúscules, fer un parell de substitucions, i afegir al final un signe de puntuació (“&” en aquest cas) i un dígit numèric. La segona consisteix simplement en concatenar quatre paraules més o menys corrents, “correct horse battery staple“.

L’entropia de la primera opció és de l’ordre de 28 bits, si pensem que el diccionari de paraules poc usades que utilitzem té unes 65 mil paraules (2 a la 16); la resta de bits són deguts a decisions sobre com hem de modificar aquesta paraula i quins són els darrers dos caràcters de la paraula clau. Una màquina que faci mil tests per segon pot provar totes les possibilitats (2 a la 28) en uns tres dies i per tant acabarà descobrint el nostre password. Però als humans se’ns fa molt difícil recordar la paraula inicial i tots els canvis i substitucions. Segur que al cap d’un temps no recordem el que havíem posat.

En canvi, l’entropia de la segona opció és de l’ordre de 44 bits, si pensem que el diccionari de paraules que utilitzem té dues mil paraules (2 a la 11), perquè 11 per 4 és 44. A raó de 1000 tests per segon, una màquina necessitaria 550 anys per provar totes les possibilitats (2 a la 41 segons). En aquest cas tenim una paraula clau que ens és fàcil de recordar si pensem en alguna regla mnemotècnica o en alguna idea que ho lligui tot, però que en canvi les màquines i sistemes automàtics no la podran desxifrar.

Com diu l’auca, després de vint anys d’esforços, hem après a usar paraules clau que els humans no som capaços de recordar, però que les màquines poden desxifrar fàcilment. Un consell: si volem tenir paraules clau que siguin realment privades, millor que pensem en trucs que siguin complicats per les màquines i sistemes automàtics, encara que a nosaltres ens semblin fàcils…

Internet i els nivells de realitat

divendres, 18/08/2017

En aquests temps de la postveritat, no és fàcil entendre el que realment passa i destriar-ho d’allò que ens volen vendre. Molts són els qui volen influir en els altres, amb mètodes que sovint deixen aparcades les consideracions ètiques. La publicitat ens promet l’impossible, i els polítics utilitzen mètodes publicitaris per a fer que cada persona escolti el que vol sentir, amb programes electorals individualitzats a la carta que només pretenen guanyar vots.

En Chris Swain, en un article científic (i profètic) de fa deu anys, proposava un conjunt de directrius per dissenyar jocs d’ordinador que poguessin conduir a un canvi social. Entre d’altres regles, deia que calia integrar experts en la matèria, abordar problemes recargolats (que no tinguin regles clares), construir una comunitat sostenible, mesurar la transferència de coneixements i fer que siguin divertits. Pot semblar innocent, però el fet de voler influir, a travès de jocs suposadament innocus, fa saltar moltes alarmes. Qui decideix les característiques d’aquest pretès canvi social? Hi ha gent que té clar on vol que anem els demés? Darrera l’aparent caire democràtic d’internet, hi ha la tirania d’uns pocs?

De fet, he de confessar que he descobert en Chris Swain fa pocs dies, mentre llegia el darrer llibre de la Carme Torras: “Enxarxats”. El meu interès va anar creixent a mesura que llegia i anava entrant a l’estructura i al joc narratiu, fins que al cap de ben poc vaig quedar enganxat a la seva “xarxa” i ja no el vaig poder deixar. En acabar, tenia els pèls de punta. Només us en faig un tast. És de quan proposen un sistema, a una de les protagonistes, per donar a cadascú l’ample de banda que es mereix i així escollir sempre l’opció més beneficiosa per la col·lectivitat. Li diuen que només haurà d’assenyalar les veus a potenciar i a inhibir, valorant la gradació i la seva urgència. Després, “l’equip” ja s’encarregarà d’arbitrar els recursos en xarxa per a que cada identitat tingui el ressò que li correspon.

Tot plegat pot semblar ciència ficció, però hi ha molts indicis que diuen que una part de tot això ja és aquí amb nosaltres. Al món de la xarxa, hi ha qui pot veure més nivells de la realitat que altres. La Carme Torras, a més d’altres exemples, parla també dels jocs amb objectiu i concretament del joc ESP. En aquest article, que cita la Carme, en Luis von Ahn i la Laura Dabbish van proposar treure profit de la intel·ligència humana a través dels jocs d’ordinador. El recurs és vast i temptador, perquè, per exemple i segons von Ahn i Dabbish, els joves americans de 21 anys han destinat una mitjana de deu mil hores (poca broma) jugant a jocs d’ordinador. La idea darrera d’ESP és aprofitar, com a efecte secundari, part d’aquestes hores per etiquetar imatges i millorar després la cerca web d’imatges basada en noms. Per exemple, una imatge d’un home i un gos es podria etiquetar com “gos”, “home” i “mascota”. El joc és ràpid, agradable i competitiu. Les coincidències dels jugadors determinen les millors descripcions i també els rànquings. Ara bé, al final, uns juguen i altres s’aprofiten de la feina feta mentre els primers s’entretenien. Perquè el cert és que hi ha qui va guanyant diners amb el que fem, el que diem i el que pugem a la xarxa. En som prou conscients?

Crec que en Michael Shermer té tota la raó. La única manera de entendre les coses i de tenir un bon nivell de visió i comprensió de la realitat a tots nivells, és ser molt escèptic. No ens podem creure res del que ens ofereixen ni del que trobem a internet sense abans comprovar-ho. Cal cercar diverses fonts d’informació (com més, millor) i conèixer la seva autoria, perquè les autories sòlides són les que porten a “l’auctoritas“. I, en cas d’incertesa, sempre és millor i aconsellable continuar en el dubte abans que acceptar explicacions poc convincents. Diuen que els dubtes obren la ment, mentre que les certeses la tanquen…

————

Quan acabava d’escriure aquest article, els terribles atemptats de Barcelona i Cambrils ens han colpit en ple estiu. El que segueix, així com el comunicat del Centre Delàs i molts d’altres, ens confirma que no tenim por i que continuarem defensant els drets humans, la pau, la diversitat i la justícia global. La imatge de dalt és la foto de la normalitat, que he fet a les 24 hores de l’atemptat de les Rambles.

Per cert, el Centre Cultural Islàmic Català comunica que s’uneixen a tots els ciutadans de totes les creences i religions en contra de la barbàrie d’aquests dies, i que s’uneixen per la pau i la seguretat a la nostra diversa societat catalana. Perquè no es pot permetre que els racistes utilitzin la sang de les víctimes per acusar i criminalitzar cap col·lectiu de l’espectre ciutadà de Catalunya.

Escalfament, responsabilitat i poder

dimecres, 21/06/2017

Fa poc, l’Antoni Bassas comentava que el 69% dels barcelonins creuen que tindran cotxe d’aquí 10 anys i que el 81% creuen que el faran servir igual o més que ara. És curiós. L’aire de la ciutat és moltes vegades sota mínims pel que fa a contaminació, però nosaltres volem mantenir els nostres hàbits i seguir tenint cotxe. Espero i desitjo que, amb la nostra curtesa de vista, no ens passi com les granotes a l’olla d’aigua calenta.

La setmana passada vaig ser a un congrés de visualització. Aquest és un camp que estudia com presentar la informació i les dades, amb tècniques informàtiques, de manera que les persones puguin entendre-les, analitzar-les i treure’n el màxim de profit. Un dels conferenciants va mostrar, com a proposta interessant, un còmic-web d’en Randall Patrick Munroe sobre l’escalfament global del planeta. En Randall Patrick Munroe, nascut el 1984, és físic. Va treballar a la NASA, però ara fa 11 anys no va voler renovar el contracte i es va voler dedicar a temps complet a la creació de còmics sobre matemàtica, ciència i vida.

El còmic-web d’en Randall Patrick Munroe sobre l’escalfament global el podeu veure aquí (també el teniu en vídeo). És una imatge, llarga, que si voleu us podeu descarregar. Però el que us aconsello és que la mireu directament a la web, amb el vostre navegador, desplaçant-vos amunt i avall amb el ratolí o la pantalla tàctil. La imatge que veieu aquí al costat és un collage que inclou tot el còmic (estret i llarg) a l’esquerra i tres trossets, ampliats, a la dreta. Les dades provenen del comitè IPCC de la ONU i de diferents treballs científics de Shakun, Marcott, Annan, Hargreaves i altres (2012 i 2013). És una cronologia del nostre planeta des de fa 22 mil anys fins ara que mostra els principals esdeveniments històrics i la temperatura mitjana de la superfície del planeta, estimada amb els mitjans científics que tenim avui. Després de l’edat de gel, la temperatura es va estabilitzar en valors similars als dels segles XIX i XX ara fa uns onze mil anys (cap a l’any 9000 abans de Crist), poc després de l’inici de l’agricultura neolítica. Podem anar pujant i baixant i anirem veient l’evolució de la temperatura. Però la sorpresa ve quan som a baix de tot i veiem el que ha passat des de 1980: la única pujada anòmala dels darrers vint-i-dos mil anys ha tingut lloc durant les darreres quatre dècades. Qui pot defensar, veient això, que no és culpa nostra i que l’escalfament no és antropogènic? Però és que, a més, la corba dels darrers 40 anys té un aspecte clar, terrible i temible: exponencial. Com diuen molts científics, hem entrat a l’època de les conseqüències.

Tots en som responsables, però no ens hem d’enganyar. Uns ho són molt més que els altres. Hi ha qui està trencant el planeta amb l’únic objectiu d’enriquir-se. Veiem que es manté l’extracció de combustibles fòssils mentre es redueix el pressupost de recerca en renovables i no s’elabora cap pla de transició energètica (al menys, a Espanya). En Ben Hayes i en Nick Buxton, al darrer llibre que han editat, parlen de l’actual distòpia: els governs han deixat d’ocupar-se de les persones mentre que els qui manen són les grans corporacions que treballen per al seu benefici econòmic. No importa què diguin els científics: cal fer negoci com sigui, cal continuar explotant i escalfant el planeta, cal tenir més petroli, cal garantir la seguretat energètica del “castell” dels privilegiats. En un bon exemple, en Bru Rovira parla del Txad i explica que va viure un moment ple d’esperança l’any 2003. S’inaugurava l’oleoducte que havia de portar el petroli que es començava a explotar als pous de Doba fins a l’oceà Atlàntic. El petroli havia de portar prosperitat i riquesa. Però aquests 14 anys han demostrat el contrari. El Txad és ara un Estat corrupte, dictatorial, endeutat i militaritzat. I aquest model txadià de destrucció i empobriment d’un país ric en recursos que podrien haver servit per millorar la vida de la població, no és un fet estrany o aïllat, com ens fa notar en Bru Rovira, sinó que pertany al nou colonialisme global, amb el qual les grans empreses depreden els recursos amb la col·laboració necessària dels governs occidentals i dels militars. Seguim el dit que assenyala el terrorisme mentre se’ns escapa la mà criminal que amaga el petroli, diu. La ma que ignora el planeta i la immensa majoria de la població mundial.

Acabo amb el que explicava fa uns mesos la Rosa Montero, citant els professors Vitali, Glattfelder i Battiston, que van analitzar més de 43.000 empreses multinacionals. Amb el seu estudi, van descobrir que el 80% d’aquestes empreses estava controlat per només 737 persones. La Rosa Montero (també ho diu Oxfam Intermón) ens confirma que el món pertany a menys de mil persones. I diu que els polítics s’haurien de posar de la nostra part, de part de tota la resta de ciutadans, per intentar controlar els potentats. Perquè això és el que implica el binomi democràcia – sostenibilitat. No crec que es pugui dir més clar.

Per cert, en Rafael Vilasanjuan es pregunta on són ara els refugiats, i constata que Europa destina molts diners per pagar guardacostes libis per impedir-los que surtin del país, o per tornar-los si aconsegueixen sortir-ne.

Les nostres metadades

divendres, 12/05/2017

En Ferran Requejo diu que som cecs i sords però ebris de paraules; que som intrínsecament xerraires i que constantment inventem ficcions que ens acabem creient i que fins i tot defensem. El cert és que cada dia generem moltíssima informació que acaba circulant per la xarxa. Trucades telefòniques, missatges de text, missatges d’àudio, fotos i vídeos. No parem d’explicar-nos coses i de compartir informació. Segurament, podríem passar amb molt menys. És informació, són dades que moltes vegades considerem privades i que no voldríem que ningú en pogués fer ús sense el nostre permís.

Però a més de dades, generem una gran quantitat de metadades. El que ens diem per telèfon o quan ens enviem missatges són dades; en canvi, la informació que hem trucat a tal persona el dia X i que hi hem estat parlant durant 9 minuts és una metadada, de la mateixa manera que ho és el fet d’haver-li enviat un whattsapp. Les dades són el què, les metadades són el quan, el com i el on ho hem fet. Les cerques per internet, les compres amb targeta, els llocs per on anem amb el mòbil, el lloc on el deixem tota la nit, són metadades. L’ús d’aquestes metadades és encara molt poc regulat, i, com sempre, hi ha empreses que les utilitzen per a fer negoci.

En Paul Wood comenta, en aquest article, un exemple ben recent del que es pot arribar a fer amb tota aquesta informació. Es tracta de la passada campanya electoral als Estats Units. Parla de la doble personalitat de Donald Trump i del que anava fent a l’ombra dels seus comentaris destralers i dels seus tuits. Concretament, al juny del 2016, en Trump va negociar amb l’empresa anglesa Cambridge Analytica un contracte milionari per esbrinar, en base a l’anàlisi de metadades, què era el més probable que acabés votant cada ciutadà dels EEUU a les eleccions presidencials. L’estratègia es va basar en connectar dos estudis independents, el primer dels quals va analitzar la personalitat de més d’un milió de ciutadans. Això es va fer en base a les seves respostes a petites enquestes telefòniques, per internet, o al que contestaven qüestionaris d’enquestadors que els aturaven durant les seves compres en grans superfícies comercials dels Estats Units. Amb algorismes d’aprenentatge similars a altres que actualment s’estan estudiant, van poder fer una valoració de la personalitat de tots i cada un d’ells en cinc eixos diferents: el de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Al final, Cambridge Analytica va acabar tenint una estimació dels trets de personalitat de més d’un milió de persones, quantificats en base al valor d’aquests 5 eixos ja mencionats.

Però això no és tot. Cambridge Analytica també va acabar disposant d’informació sobre tots i cada un dels 230 milions de potencials electors als Estats Units. De cada un d’ells, va poder aconseguir un total d’entre 4.000 i 5.000 dades: edat, gènere, on viu, on treballa, on va els caps de setmana, si surt o no a les nits, què menja, quins diaris i revistes compra, quins programes de tele mira, quin cotxe condueix, i moltes més coses. Dades i metadades que, un cop recollides dia a dia, ens defineixen i classifiquen fins convertir-nos en un punt dins un immens espai de maneres de ser i fer. Hi ha empreses que ens tenen fitxats. En Paul Wood reconeix que tot plegat és impressionant i fa por: Cambridge Analytica les té a la venda, en una operació comercial que, en paraules seves, converteix dades en or.

A partir d’aquests dos estudis, el repte era aconseguir fer una estimació de la tendència política de cada ciutadà. Cambridge Analytica es va basar en dues hipòtesis que van resultar certes: que hi havia correlació entre el que comprem i fem cada dia i els trets de la nostra personalitat, i que també hi havia correlació entre aquests trets de personalitat i la nostra tendència electoral. En altres paraules, els que fan coses similars i tenen hàbits semblants (i es troben representats per punts propers), tenen personalitats similars; a més, els trets de la personalitat ajuden a predir el comportament i a saber si ens agrada més el vi o la cervesa i si pensem votar el candidat A o el B. Amb l’ajut d’aquestes dues correlacions, els de Cambridge Analytica van poder fer una estimació del valor dels 5 eixos de personalitat per tots els 230 milions de potencials votants, i, en un segon pas, deduir quin candidat era el preferit de cada un d’ells.

La conseqüència de tot l’anterior és que es va poder actuar amb propaganda electoral “micro-dirigida” a cada petit grup i a cada persona concreta. El missatge, enviat a través de correus electrònics o amb voluntaris que feien el porta-porta, era sobretot dirigit a les persones indecises, i a cada una d’elles se li explicava justament el que ella desitjava escoltar. No hi havia un únic programa polític, només publicitat per convèncer la gent. Tot era “a gust del consumidor”. Qui estava preocupat pels llocs de treball rebia missatges que deien que tota la situació laboral milloraria, qui era partidari de les armes de foc es trobava amb cartes que parlaven de la necessitat de preservar-les, qui tenia por del terrorisme rebia informacions sobre la importància de fer fora els musulmans i estrangers.

Només va caldre treballar amb les dues correlacions ja mencionades. La de les dades de cada persona amb el seu perfil de personalitat, i la d’aquest perfil amb el comportament electoral. Evidentment el resultat no és exacte, i el sistema es pot equivocar, enviant cartes inadequades a molta gent. Però estadísticament funciona, perquè la doble correlació fa que la probabilitat d’encertar sigui molt més elevada que la d’enviar cartes que no serveixen. La conclusió, molt preocupant, és que una empresa ha sabut com fer-s’ho per enviar missatges individualitzats de publicitat electoral, i que hem acabat veient que ha aconseguit el que volia.

En Paul Wood cita en Jill Lepore, especialista en historia dels processos electorals a la Universitat de Harvard, que reconeix que els sistemes tradicionals de votació poden ser poc fiables, però que la ciència de les dades pot ser encara molt més perjudicial. No només els missatges actuals dels polítics acaben sent dictats pels seus consultors amb l’únic objectiu de guanyar vots, sino que ara, a més, a cada votant se li diu el que vol escoltar. És el que diu la imatge de dalt, que he tret d’aquesta pàgina web. Moltes vegades no és que ens venguin alguna cosa: el que passa és que ens estan venent a nosaltres mateixos. Nosaltres som el producte…

Per cert, l’Adrià Rocha Cutiller diu que Facebook, Google i Amazon ho saben tot de nosaltres i que fan “el negoci de la nostra vida”. Saben amb qui parlem, on som, cap on anem, qui som i qui ens agradaria ser. I que ho saben perquè els ho diem. Diu que Facebook acumula, juntament amb Google, el 50% de tota la inversió publicitària mundial.

Els ordinadors visuals

dijous, 27/04/2017

Fa poc, en una conversa amb en Gérard Berry, va sorgir el tema dels telèfons mòbils. En Gérard opina que les coses s’estan capgirant. Vam passar del telèfon fix d’ara fa vint anys a uns mòbils que bàsicament servien per trucar i enviar missatges de text, amb poques capacitats de càlcul i emmagatzemament. Després, hem passat lentament a tenir petites màquines amb altes capacitats de computació i tractament de dades, que continuem anomenant telèfons però que de fet són potents ordinadors que poden telefonar, ajudar-nos a cercar informació o mostrar-nos mapes. Els mòbils s’han convertit en ordinadors que capten fotos i vídeos i que fan moltes més coses. I de fet, ben aviat estarem envoltats d’ordinadors que “ens ajuden” a fer-ho tot, controlant les nostres cases, cotxes i electrodomèstics.

La fotografia ha sofert dues revolucions en menys de vint anys. La primera, que va començar els darrers anys del segle XX, va significar el pas, dràstic, de la fotografia analògica a la digital. Algunes empreses com Kodak es van enfonsar, i la gent va deixar de revelar rodets de fotos. Ja no calia mirar-s’hi molt, a l’hora de fer fotos, perquè en podíem fer moltes i escollir després la que més ens agradava sense cap cost addicional. En eliminar el cost de cada foto individual, va començar a canviar l’essència mateixa de la fotografia. Lentament, vam anar entrant a l’època de la massificació de la imatge, perquè tot era fàcil i a l’abast de tothom.

Després va venir la segona revolució, més invisible, que ens han portat els telèfons mòbils. Us heu preguntat alguna vegada com és que, amb un objectiu tan petit i amb una distància focal tan minsa, els telèfons actuals poden fer fotos tan bones? És clar que els objectius de les càmeres convencionals i els de les més bones (com les rèflex) recullen molta més llum i poden obtenir fotos de molt bona qualitat, però el que a mi sempre m’ha sorprès és que els telèfons puguin fer les fotos que fan amb uns objectius tan petits, de pocs mil·límetres. La resposta, que ens explica en Frédéric Guichard en aquest vídeo, es troba en els algorismes de tractament d’imatge dels nostres mòbils, que són veritables ordinadors visuals. Abans, les lents dels sistemes òptics de les càmeres es fabricaven amb un procés delicat i d’alta precisió. Ara no cal, perquè durant el control de qualitat final, cada càmera individual s’ajusta per tal d’aconseguir el màxim de prestacions. Com que ja no es pot tocar la lent òptica, el que es fa és ajustar els algorismes que tracten la imatge capturada de manera que compensin els errors i distorsions de la lent. Cada telèfon adapta, de manera quasi òptima, el tractament de les imatges als defectes del seu sistema òptic, de manera que acaba tenint un conjunt lent-algorismes únic i que no té cap altre telèfon. Aquesta segona revolució de la fotografia ha canviat totalment els sistemes de fabricació de les lents dels objectius de les càmeres fotogràfiques, com bé explica en Frédéric Guichard: enlloc de fabricar lents d’alta precisió i conjunts òptics que compensin les aberracions, fem lents de baix cost més imperfectes i després corregim intel·ligentment els errors que apareixen a la imatge capturada.

Hi ha tota una nova àrea de recerca, anomenada fotografia computacional, que estudia els algorismes que, a qualsevol telèfon mòbil, “cuinen” la imatge crua que capta el sensor de la càmera fins deixar-la preparada per a que la puguem veure. La imatge de dalt, que he compost a partir del vídeo d’aquesta conferència d’en Gérard Berry, mostra dues d’aquestes transformacions. Dalt a la esquerra veiem la imatge “crua” tal com surt del xip de sensors de la càmera, i a la dreta tenim com queda un cop s’han ajustat automàticament els colors. La fila de baix mostra com es corregeix l’anomenada aberració esfèrica: les imatges d’esquerra i dreta mostren la imatge, primer crua i després d’haver estat tractada pels algorismes (personalitzats per a cada telèfon) de correcció de distorsions.  Com bé diu en Frédo Durand, els mòbils han passat a ser les càmeres de fotos per antonomàsia, i en ells, el component central de la creació de les imatges és la computació (i els algorismes). El que fa qualsevol mòbil en el breu període de temps que hi ha des que premem el botó de l’obturador fins que ens mostra la foto en el visor és increïble, com explica en Gérard Berry a la seva conferència. Cuina i millora els colors, corregeix distorsions, compensa zones molt fosques o molt clares, elimina sorolls i altres tipus d’errors, detecta cares i analitza si algú ha tancat els ulls… És la nova informàtica, dels colors, de la forma i de la imatge.

Un darrer detall. En Frédéric Guichard explica que moltes vegades, la foto que obtenim no és de l’instant que premem el disparador, sino que és d’uns moments abans. Això és possible perquè les actuals càmeres dels mòbils no capturen una única imatge, sino que, mentre estem ajustant l’enquadrament, es guarden temporalment tota la ràfega de fotos dels fotogrames que veiem en el visor de la càmera quan som a punt de fer la foto. Part del processat de la imatge que fa l’ordinador-càmera consisteix en analitzar les fotos anteriors a la darrera, identificar cares de la gent, i substituir aquelles cares de persones que han quedat amb els ulls tancats, pels trossos corresponents d’imatge a altres fotogrames on han quedat millor. La foto final no és més que un collage de trossos de fotogrames amb distorsió i colors adequadament corregits.

Els ordinadors, les aplicacions i tots els ginys intel·ligents que van entrant a les nostres vides ben segur que ens ajudaran a viure millor, però impliquen una responsabilitat per part nostra: la de saber marcar els límits. No parem de fer i enviar-nos fotos i vídeos. Però, on les tenim? Qui controla aquesta informació tan etèria que va i ve per la xarxa? Podem estar segurs que ningú farà servir fotos nostres sense el nostre permís? Podem trobar una foto determinada que vam fer fa set anys? Fem còpies de seguretat (en dispositius privats nostres) o còpies en paper de tot el que deixem al “núvol”? Tenim una immensa capacitat de compartir informació visual, però sembla que només ens importi el present. I el més probable és que, d’aquí a 20 anys, quasi totes les fotos i vídeos actuals hagin desaparegut. No sé què feu vosaltres, però a mi m’agrada regirar capses i trobar fotos i cartes dels meus avis. Podran fer el mateix, els nostres néts i besnéts? La informació que ens enviem i compartim és volàtil com els núvols. Si limitem el temps que dediquem a la immediatesa de la comunicació i no estem sempre connectats, si trobem temps per gaudir de les fotos que hem fet i de les que ens han enviat, si podem veure-les amb la mirada de l’assossec, segurament descobrirem que algunes d’elles han de ser mimades, recordades i conservades, perquè són part del que ens queda d’aquells que estimem o hem estimat. Aturem-nos, limitem el nostre constant neguit, escollim, evoquem, gaudim, i conservem.

Per cert, la Marxa per la Ciència és una iniciativa que va començar als Estats Units però que ara ja aplega més de 500 ciutats de tot el planeta i compta, a més, amb el suport de més de 220 organitzacions científiques oficials. El comunicat diu textualment que són molts el que veuen que cal fer un pas més i exigir que les polítiques públiques no estiguin en mans d’indocumentats que menyspreen el coneixement i es guien per prejudicis, interessos espuris o dogmes religiosos.

Evolució i robustesa

divendres, 21/04/2017

Robustesa, en informàtica, és sinònim de tolerància als problemes i als errors. Un sistema  o algorisme robust ha de poder seguir treballant en condicions satisfactòries en presència d’errades. No importa que aquestes siguin degudes a un mal-funcionament del hardware o a que la persona que està entrant les dades s’hagi equivocat. El sistema, si no pot seguir endavant, ha d’avisar i demanar, per exemple, que hem de tornar a entrar part de les dades; però no es pot col·lapsar. Algun dia, quan els nostres ordinadors arribin de veritat a l’edat adulta de la robustesa, ja no farem els ben coneguts acudits informàtics que parlen d’apagar i tornar a engegar.

Però no cal fixar-nos en els algorismes, perquè la gran mestra en robustesa és la natura. Ho han vist, per exemple, un grup d’investigadors d’Alemanya, Mèxic, Anglaterra i la Xina, que han investigat els peixos de tipus poecílid a les aigües sulfuroses del riu El Azufre, a Tapijulapa (Mèxic). Aquest riu, que podeu veure a la imatge de dalt (imatge que he obtingut d’aquesta pàgina web) és d’aigua tòxica, amb una concentració de sulfur d’hidrogen (també anomenat àcid sulfhídric) que fa impossible la vida de quasi tots els vertebrats. Aquest grup de científics ha publicat un treball que podeu trobar aquí, on analitzen l’evolució d’aquesta família de peixos. Rüdiger Riesch i Martin Plath, que també en parlen a un article a la revista Scientific American, expliquen que van trobar diversos tipus de peixos de la mateixa família, tots ells descendents d’antics poecílids que vivien en aigües clares i netes. Aquests diferents grups de peixos han anat evolucionant de manera independent a partir d’un avantpassat comú que va existir fa uns 600 mil anys, perquè s’han hagut d’anat adaptant a viure en entorns tòxics incomunicats i separats bastants quilòmetres l’un de l’altre. En total, han estat analitzant vuit grups diferents de peixos poecílids, tots ells lleugerament diferents i que viuen en diferents paratges. D’aquests vuit grups, quatre viuen en aigües clares i quatre es troben en entorns molt tòxics amb àcid sulfhídric. Aquests darrers, encara que han hagut d’evolucionar de manera independent, tenen unes característiques anatòmiques i metabòliques molt similars, amb boques i caps més grans, que els ajuden a viure en condicions inhòspites. Ara bé, el sorprenent és que, tot i que són prou semblants (ho podeu veure en aquesta foto, que també és del Scientífic American), tenen genomes molt i molt diferents: els canvis genòmics en un determinat grup, molt importants i distribuïts per tot l’ADN, tendeixen a ser únics per aquest grup i a no ser compartits pels altres grups. En canvi, el resultat, en termes de camins metabòlics (el conjunt de reaccions químiques que fan possible la vida), és el mateix en tots ells. En altres paraules: els camins evolutius, independents, han estat diferents, però el resultat és molt semblant perquè és el que acaba possibilitant l’adaptació a entorns agressius. Calia adaptar-se, i ho van fer, d’una o altra manera. És la robustesa de l’evolució: encara que hi ha molts camins, veiem resultats similars perquè els que no es van adaptar, ja no hi són. Els autors diuen a més que els seus resultats corroboren les hipòtesis de Jay Gould en el sentit que l’evolució és sovint el resultat irrepetible d’esdeveniments estocàstics que tenen efectes altament contingents, però que acaben adaptant-se a l’entorn gràcies a la selecció natural.

I no només els peixos. Els diferents grups d’humans, com explica en D.T. Max en un recent article a la revista National Geographic, hem anat evolucionant de manera independent per adaptar-nos al medi, amb solucions ben satisfactòries en tots els casos. Els inuit tenen gens que els permeten metabolitzar el greix de les balenes, i els japonesos, uns altres per digerir les algues marines. Les civilitzacions ramaderes són més tolerants a la lactosa, mentre que la pell dels africans els protegeix de les radiacions ultraviolades. Solucions ben diferents, totes robustes, que ens adapten a tots els indrets de la Terra. Som molt iguals i ben diferents…

De fet, la ciència mateixa, amb el rigor en els experiments i amb els seus mecanismes de revisió anònima dels resultats abans de publicar-se, treballa de manera semblant i intenta maximitzar la seva robustesa. Molts dirigents, però, la ignoren. Prefereixen crear mons paral·lels i realitats alternatives, objectivament falses però que són útils per als seus interessos. Per això, molts científics han dit que ja n’hi ha prou i organitzen, demà, la marxa per la ciència. Els convocants diuen que la ciència, els científics i la política basada en l’evidència científica estan sent atacades, i que les retallades, la censura, la desaparició de les dades i les amenaces de desmantellar les agències governamentals ens amenacen a tots i posen en risc la salut, el menjar, l’aire, l’aigua, el clima i fins i tot el treball. No som en un moment fàcil, però som coherents amb l’actitud de tolerància als problemes, i pensem que ens en sortirem.

———

Per cert, en John Carlin diu que en castellà no existeix cap traducció de la paraula anglesa “compromise”, concepte que vol dir que tots dos costats cedeixen en una negociació per tal que tots surtin guanyant. Parla també de Jonathan Powell, que comenta que a més, hi ha una paraula nostra que tampoc té traducció a l’anglès: “crispació”. Perquè l’esport espanyol preferit, diu Carlin, és la indignació, que concedeix una rica sensació de superioritat moral sobre l’altre.