Entrades amb l'etiqueta ‘Christophe Galfard’

Els algorismes que aprenen

dijous, 9/02/2017

Hi ha paraules boniques que també ens fan una mica de por. Poca gent sap que la seva vida és plena d’algorismes. Alguns, quan se’n adonen, no saben si ho han d’acceptar o s’han de posar nerviosos. I el cert és que, tot i que no els reconeguem i que pensem que no ens afecten, els portem sempre al nostre costat.

Un algorisme no és més que un conjunt ordenat, finit i no ambigu de regles i operacions que permeten resoldre un problema o realitzar una determinada activitat. Els algorismes són descripcions precises de processos que fem o que fan els altres. Les instruccions per muntar un moble a partir d’un kit de peces o el full on expliquem com posar en marxa la calefacció quan marxem de casa i han de venir uns amics, són algorismes. Les receptes de cuina i les partitures musicals són algorismes per preparar menjars i interpretar melodies. I ho són les instruccions de qualsevol joc, els manuals d’usuari i els protocols que segueixen els metges als hospitals. Algunes vegades, els algorismes els podem escriure per a nosaltres mateixos, quan acabem de descobrir alguna cosa complexa que ens ha estat útil (per exemple en el nostre mòbil), i volem no oblidar-la. En altres ocasions, les escrivim per a que algú altre pugui fer més endavant quelcom que nosaltres ja sabem fer. És per això que el conjunt de regles d’un algorisme ha de ser no ambigu: si no l’escrivim bé, la persona que vingui a casa no entendrà com engegar el rentaplats o com posar en marxa la calefacció.

Espero no guanyar-me el mot de “friqui” si confesso que m’agrada la paraula “algorisme”. Tal vegada perquè ha estat al meu costat durant quasi cinquanta anys, i perquè ve de molt lluny. Concretament d’ara fa 1.150 anys, quan al-Khwarazmí treballava a l’observatori de Bagdad. Durant els segles de l’edat mitjana, al-Khwarazmí va ser la principal font de transmissió de coneixements matemàtics de l’Orient a l’Occident, en part en base a les traduccions de textos en grec, llatí i sànscrit que es feien a la Casa de la Saviesa. En el seu tractat d’àlgebra, “Hissab al-jabr wa-l-muqàbala“, explicava regles i receptes (o sigui, algorismes) per repartir herències, cosa que en aquell temps i en el món àrab era molt complicada i requeria fer molts càlculs. En un altre llibre, “Sobre el càlcul amb nombres indis”, llibre del que només se’n conserva una traducció del segle XII, al-Khwarazmí va explicar, sembla que per primera vegada, el sistema de numeració posicional en base 10 (incloent el zero) que va aprendre de l’Índia i que és el que ara utilitzem. Fa més de 11 segles, al-Khwarazmí ens va deixar llibres meravellosos, tots plens d’algorismes. És per això que els algorismes porten el seu nom.

Quan sumem nombres portant-ne, estem aplicant l’algorisme que vam aprendre a l’escola; i, quan multipliquem, també. Euclides ens va deixar un algorisme molt elegant per calcular el màxim comú denominador de dos nombres, i Pitàgores ens va explicar l’algorisme per calcular hipotenuses i distàncies entre punts. Després, amb els ordinadors, hem acabat tenint algorismes per tot. Perquè els ordinadors i els telèfons mòbils només funcionen en base als algorismes que alguns programadors els han preparat. Totes les aplicacions que ens hem baixat als nostres mòbils són algorismes. Tenim algorismes per millorar fotos, per cercar informació a internet, per saber la posició dels astres i per preveure el temps que farà demà. Tenim algorismes que ens troben el nom de les músiques que escoltem, i algorismes que saben traduir textos d’un idioma a un altre.

I ara, el que hem començat a veure fa pocs anys són algorismes que es van refinant amb les dades. Són algorismes que aprenen, algorismes que conformen els mecanismes d’aprenentatge automàtic que es troben en el nucli de l’anomenat “big data“. Hi ha moltíssims exemples, un dels quals, molt il·lustratiu, el teniu en aquest document (que és un pòster científic presentat ara fa uns mesos; com podeu observar, la imatge de dalt és d’aquest mateix document). Es tracta d’un algorisme que, a partir d’una gravació de vídeo de 15 segons en la que s’ens demana que expliquem qui som, fa una valoració de la nostra personalitat en cinc eixos diferents, i ens ho mostra amb 5 bandes verdes (les que veieu a la dreta de la imatge) al cap de menys de tres segons. Aquests cinc eixos són els de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Com ho fa? Doncs amb un algorisme que conté dues xarxes neuronals de 17 nivells, una per la senyal de vídeo i l’altra per la d’àudio, amb un darrer nivell de fusió de les dues, com bé podeu veure a la figure 3 del document. Cada un dels 17 nivells d’una i altra xarxa combina adequadament els resultats del nivell anterior i genera una sortida que transmet a algun o alguns dels nivells següents. Cada nivell és com una taula de mescles de so, però digital. Barreja les entrades per tal de produir el senyal de sortida. En resum, fem 17+17+1 mescles, i acabem trobant els trets de personalitat de la persona que ha estat parlant durant 15 segons al vídeo. Però, com fem aquestes mescles? Com ajustem la importància que donarem a cada un dels valors d’entrada a cada una de les mescles? Com ajustem el valor de cada un dels “potenciòmetres” de la nostra xarxa neuronal?. En el cas de l’article que comento, això es va fer amb un sistema d’aprenentatge dirigit. Amb anterioritat als experiments, els autors, amb l’ajut de molts voluntaris, van analitzar deu mil vídeos de 15 segons de YouTube. Cada voluntari, a cada prova, presenciava una parella de vídeos (corresponents a dues persones) i després havia de dir quina de les dues persones creia que era la més curiosa, quina la més extravertida, .. i així fins analitzar el cinquè eix de neuroticisme. Cal observar que no es demanava cap valoració, únicament havien de comparar la parella de persones que estaven veient. Això es va fer així perquè és ben conegut que les comparacions les fem molt millor que les valoracions. Doncs bé, la informació d’aquests experiments amb 10.000 vídeos és la que va permetre ensinistrar els  mescladors dels 17+17+1 nivells de l’algorisme i ajustar els seus valors. Però això no va acabar aquí. L’interessant és que l’algorisme va continuar i continua aprenent, perquè quan el sistema ja estava ajustat i “trained” (mireu la imatge de dalt), l’anàlisi del vídeo de cada nova persona que vol experimentar aquesta aplicació i que dona la corresponent autorització per usar les seves dades, serveix per acabar d’ajustar una mica més els paràmetres de tots els nivells de la xarxa neuronal. El sistema va aprenent cada dia, i cada persona que l’utilitza l’ajuda a fer-ho. Només cal que digui si creu que el resultat que li mostra la màquina reflexa la seva personalitat o no, perquè això és l’únic que necessita la xarxa neuronal per auto-refinar-se.

Per bé o per mal (esperem que per bé), els algorismes que aprenen han arribat, i han vingut per quedar-se amb nosaltres. Ens poden ser molt útils, però no hem de perdre mai de vista la necessitat de la seva regulació ni els aspectes ètics. Els algorismes són aquí, però la responsabilitat sempre serà de les persones que els utilitzen.

Per cert, en Christophe Galfard diu que sense una visió científica, la democràcia es torna més complicada. També diu que la humanitat no és conscient del seu lloc a l’Univers, que només ara ho estem començant a entreveure.

Trencar relats

dijous, 6/10/2016

Moltes vegades, les coses s’entenen millor quan ens fixem en els racons amagats. Diuen que, per copsar bé la qualitat de vida d’un país, cal visitar les seves presons. I segons Karl Popper, el més important en una democràcia no és el fet de votar per elegir representants, sinó que els ciutadans puguin fer fora els polítics indignes (Popper parla de “removing bad leaders“). Surt algú, per la porta del darrera? Quantes vegades s’ha fet fora algú, en un determinat país?

En ciència passa una mica el mateix. A més de construir i verificar teories, la ciència serveix per a foragitar relats i mites que acabem veient que són falsos. L’actitud científica comporta trencar relats, històries i ficcions que ens hem anat creient al llarg dels segles. Perquè la ciència, que ens acaba donant més preguntes que respostes, ens va descobrint que moltes de les coses que ens expliquen són falses. I quan el mètode científic conclou que un determinat relat és fals, ho fa en base a verificacions experimentals que difícilment poden ser discutides. La ciència de les noves teories sovint és feble, però la ciència del NO a certs relats és terra ferma.

Els relats són bonics i necessaris. Tots en vivim, quan som petits i quan ens fem grans. Però hem de ser conscients que són relats i evitar la temptació de convertir-los en creences i veritats. Els antics habitants de l’Índia imaginaven que la Terra era damunt de pilars aguantats per quatre elefants drets sobre una tortuga gegant que nedava en un gran oceà i els grecs pensaven que el nostre planeta era un gran disc circular amb Grècia òbviament al centre i mar a tot el voltant, mentre que la cultura judeo-cristiana considerava que, fets a la imatge i semblança de Déu, érem al bell mig de l’Univers. Cap problema, si tots acceptem que estem parlant de relats. El problema ve quan la ciència va començar a mostrar, amb dades experimentals i gràcies a gent valenta com Nicolau Copèrnic i Galileu Galilei, que tot això no eren més que relats. Galileu ho va passar malament, i al seu amic Giordano Bruno li va costar la vida.

Als Estats Units, a Kentucky, hi ha el museu de la creació. Una de les coses que explica el museu és que l’home antic va conviure amb els dinosaures, perquè tant els dinosaures com tots els animals terrestres i l’home van ser creats el sisè dia de la creació. A Europa ens pot semblar impensable que hi hagi gent que pugui dir això i fins i tot fer-ne un museu, però als Estats Units hi ha un percentatge molt important de la població que així ho creu. De fet, la revista National Geographic va publicar fa poc un article sobre aquesta guerra que tot un sector de la població nord-americana està emprenent contra la ciència i les seves conclusions. Que una revista com el National Geographic decideixi publicar un article com aquest, no deixa de ser un indicador sociològic i antropològic. Però el que a mi em va deixar del tot glaçat van ser els atacs posteriors a la revista, des de posicions de defensa literal de la Bíblia i la creació. Només cal que entreu a internet i que cerqueu “National Geographic war on science“.

De fet, els relats són per tot arreu, i la política n’està impregnada. Un amic, parlant del referèndum a Colòmbia, deia que el resultat no l’havia sorprès perquè el sí ha guanyat als llocs on els moviments socials són forts, mentre que el relat del no s’ha escampat per les regions on el paramilitarisme campa al seu gust i per les capitals allunyades del conflicte. El cert és que Uribe ha aconseguit tirar endavant el seu relat del conflicte tot atacant la impunitat aconseguida per les FARC, però també és cert, per exemple, que el govern hi ha ajudat amagant la responsabilitat de l’Estat i de l’oligarquia en la mort d’un 80% de les víctimes. Mentre que les situacions socials i polítiques són molt complexes, les explicacions que ens arribem, senzilles i plenes de titulars, simplifiquen la realitat tot eliminant facetes essencials. Però en tot, inclosa la política, l’actitud científica és essencialment crítica amb els relats perquè no es creu res. És una actitud que implica analitzar evidències, comprovar, verificar i experimentar. Jo, moltes vegades, quan intento aplicar un mètode científic a les notícies de l’actualitat, acabo descobrint que un dels factors amagats que mou les grans actuacions és la cobdícia, l’afany de poder i la voluntat d’enriquiment d’uns pocs a costa de molts altres (jo entre ells). Ben senzill. M’estan aixecant la camisa. Això sí, amb molt bones paraules…

En Christophe Galfard diu que a la investigació científica hi ha honestedat perquè la comunitat científica es basa en sistemes de verificació. Diu que és agradable pensar que hi ha una part de la població mundial que dóna un servei a la humanitat amb alegria pels descobriments i sense objectius de poder, tot sabent les actuals veritats poden evolucionar, però que ara són aquí. D’altra banda, en Carl Sagan insistia en que la ciència és sobretot una manera de pensar. Deia que ens ha tocat viure en una societat que és exquisidament depenent de la ciència i de la tecnologia, però amb la paradoxa que quasi ningú en sap res, de ciència i tecnologia. És l’escenari ideal per a que apareguin tot tipus de relats interessats.

Per cert, en Christophe Galfard també diu que sense coneixements científics, la democràcia es torna més complicada. Davant les bestieses que diuen els polítics, diu, la ciència ens aporta reflexió i sistemes de verificació.