Entrades amb l'etiqueta ‘big data’

Els algorismes que aprenen

dijous, 9/02/2017

Hi ha paraules boniques que també ens fan una mica de por. Poca gent sap que la seva vida és plena d’algorismes. Alguns, quan se’n adonen, no saben si ho han d’acceptar o s’han de posar nerviosos. I el cert és que, tot i que no els reconeguem i que pensem que no ens afecten, els portem sempre al nostre costat.

Un algorisme no és més que un conjunt ordenat, finit i no ambigu de regles i operacions que permeten resoldre un problema o realitzar una determinada activitat. Els algorismes són descripcions precises de processos que fem o que fan els altres. Les instruccions per muntar un moble a partir d’un kit de peces o el full on expliquem com posar en marxa la calefacció quan marxem de casa i han de venir uns amics, són algorismes. Les receptes de cuina i les partitures musicals són algorismes per preparar menjars i interpretar melodies. I ho són les instruccions de qualsevol joc, els manuals d’usuari i els protocols que segueixen els metges als hospitals. Algunes vegades, els algorismes els podem escriure per a nosaltres mateixos, quan acabem de descobrir alguna cosa complexa que ens ha estat útil (per exemple en el nostre mòbil), i volem no oblidar-la. En altres ocasions, les escrivim per a que algú altre pugui fer més endavant quelcom que nosaltres ja sabem fer. És per això que el conjunt de regles d’un algorisme ha de ser no ambigu: si no l’escrivim bé, la persona que vingui a casa no entendrà com engegar el rentaplats o com posar en marxa la calefacció.

Espero no guanyar-me el mot de “friqui” si confesso que m’agrada la paraula “algorisme”. Tal vegada perquè ha estat al meu costat durant quasi cinquanta anys, i perquè ve de molt lluny. Concretament d’ara fa 1.150 anys, quan al-Khwarazmí treballava a l’observatori de Bagdad. Durant els segles de l’edat mitjana, al-Khwarazmí va ser la principal font de transmissió de coneixements matemàtics de l’Orient a l’Occident, en part en base a les traduccions de textos en grec, llatí i sànscrit que es feien a la Casa de la Saviesa. En el seu tractat d’àlgebra, “Hissab al-jabr wa-l-muqàbala“, explicava regles i receptes (o sigui, algorismes) per repartir herències, cosa que en aquell temps i en el món àrab era molt complicada i requeria fer molts càlculs. En un altre llibre, “Sobre el càlcul amb nombres indis”, llibre del que només se’n conserva una traducció del segle XII, al-Khwarazmí va explicar, sembla que per primera vegada, el sistema de numeració posicional en base 10 (incloent el zero) que va aprendre de l’Índia i que és el que ara utilitzem. Fa més de 11 segles, al-Khwarazmí ens va deixar llibres meravellosos, tots plens d’algorismes. És per això que els algorismes porten el seu nom.

Quan sumem nombres portant-ne, estem aplicant l’algorisme que vam aprendre a l’escola; i, quan multipliquem, també. Euclides ens va deixar un algorisme molt elegant per calcular el màxim comú denominador de dos nombres, i Pitàgores ens va explicar l’algorisme per calcular hipotenuses i distàncies entre punts. Després, amb els ordinadors, hem acabat tenint algorismes per tot. Perquè els ordinadors i els telèfons mòbils només funcionen en base als algorismes que alguns programadors els han preparat. Totes les aplicacions que ens hem baixat als nostres mòbils són algorismes. Tenim algorismes per millorar fotos, per cercar informació a internet, per saber la posició dels astres i per preveure el temps que farà demà. Tenim algorismes que ens troben el nom de les músiques que escoltem, i algorismes que saben traduir textos d’un idioma a un altre.

I ara, el que hem començat a veure fa pocs anys són algorismes que es van refinant amb les dades. Són algorismes que aprenen, algorismes que conformen els mecanismes d’aprenentatge automàtic que es troben en el nucli de l’anomenat “big data“. Hi ha moltíssims exemples, un dels quals, molt il·lustratiu, el teniu en aquest document (que és un pòster científic presentat ara fa uns mesos; com podeu observar, la imatge de dalt és d’aquest mateix document). Es tracta d’un algorisme que, a partir d’una gravació de vídeo de 15 segons en la que s’ens demana que expliquem qui som, fa una valoració de la nostra personalitat en cinc eixos diferents, i ens ho mostra amb 5 bandes verdes (les que veieu a la dreta de la imatge) al cap de menys de tres segons. Aquests cinc eixos són els de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Com ho fa? Doncs amb un algorisme que conté dues xarxes neuronals de 17 nivells, una per la senyal de vídeo i l’altra per la d’àudio, amb un darrer nivell de fusió de les dues, com bé podeu veure a la figure 3 del document. Cada un dels 17 nivells d’una i altra xarxa combina adequadament els resultats del nivell anterior i genera una sortida que transmet a algun o alguns dels nivells següents. Cada nivell és com una taula de mescles de so, però digital. Barreja les entrades per tal de produir el senyal de sortida. En resum, fem 17+17+1 mescles, i acabem trobant els trets de personalitat de la persona que ha estat parlant durant 15 segons al vídeo. Però, com fem aquestes mescles? Com ajustem la importància que donarem a cada un dels valors d’entrada a cada una de les mescles? Com ajustem el valor de cada un dels “potenciòmetres” de la nostra xarxa neuronal?. En el cas de l’article que comento, això es va fer amb un sistema d’aprenentatge dirigit. Amb anterioritat als experiments, els autors, amb l’ajut de molts voluntaris, van analitzar deu mil vídeos de 15 segons de YouTube. Cada voluntari, a cada prova, presenciava una parella de vídeos (corresponents a dues persones) i després havia de dir quina de les dues persones creia que era la més curiosa, quina la més extravertida, .. i així fins analitzar el cinquè eix de neuroticisme. Cal observar que no es demanava cap valoració, únicament havien de comparar la parella de persones que estaven veient. Això es va fer així perquè és ben conegut que les comparacions les fem molt millor que les valoracions. Doncs bé, la informació d’aquests experiments amb 10.000 vídeos és la que va permetre ensinistrar els  mescladors dels 17+17+1 nivells de l’algorisme i ajustar els seus valors. Però això no va acabar aquí. L’interessant és que l’algorisme va continuar i continua aprenent, perquè quan el sistema ja estava ajustat i “trained” (mireu la imatge de dalt), l’anàlisi del vídeo de cada nova persona que vol experimentar aquesta aplicació i que dona la corresponent autorització per usar les seves dades, serveix per acabar d’ajustar una mica més els paràmetres de tots els nivells de la xarxa neuronal. El sistema va aprenent cada dia, i cada persona que l’utilitza l’ajuda a fer-ho. Només cal que digui si creu que el resultat que li mostra la màquina reflexa la seva personalitat o no, perquè això és l’únic que necessita la xarxa neuronal per auto-refinar-se.

Per bé o per mal (esperem que per bé), els algorismes que aprenen han arribat, i han vingut per quedar-se amb nosaltres. Ens poden ser molt útils, però no hem de perdre mai de vista la necessitat de la seva regulació ni els aspectes ètics. Els algorismes són aquí, però la responsabilitat sempre serà de les persones que els utilitzen.

Per cert, en Christophe Galfard diu que sense una visió científica, la democràcia es torna més complicada. També diu que la humanitat no és conscient del seu lloc a l’Univers, que només ara ho estem començant a entreveure.

Les perspectives dels núvols

dijous, 31/12/2015

Els núvols canvien com els paisatges. Quan ens movem, la perspectiva els renova. Sota el núvol de la foto només veiem la seva grisor i la manca de llum del Sol. Però si ens allunyem fins veure’l de perfil com a la imatge d’aquí al costat, podem apreciar la seva forma prima i allargada, que va seguint el pendent de la muntanya i els corrents d’aire ascendents. En aquesta web de les Getty Images podeu veure una imatge semblant. Hi ha núvols de tota mena, de prims i de gruixuts. Els prims ens donen informació sobre els corrents i les capes d’aire, però els hem de saber mirar. Els hem de mirar de perfil perquè si no, ni tan sols ens adonarem que són prims.

Hi ha molts tipus de núvols. Tenim els nimbus que porten aigua i tempestes, d’altres com els cirrus que són fets de petits cristalls de gel, els núvols de contaminació que alguns cops s’instal·len a les nostres ciutats gràcies a nosaltres, els ciclons i els pacífics cúmuls. Però també tenim els núvols de dades. Mireu aquest vídeo didàctic fet al KVL, a Dinamarca. Hi veiem algunes dades de cinc persones, de cognom Smith, Johnson, Williams, Jones i Davis: la seva càrrega de treball, la distància entre casa seva i el lloc de treball i el seu salari. Les dades han estat transformades i escalades per a que els valors siguin similars, vegeu la nota al final. El que el vídeo ens mostra és que cada persona es pot representar com un punt tridimensional de manera que les seves coordenades són justament els tres valors de les seves dades, tot mostrant-nos a més que la configuració dels cinc punts és molt diferent segons la perspectiva. En general veurem punts dispersos a l’espai però, com mostra el vídeo, si encertem bé el punt de vista ens adonarem que el conjunt de punts és ben prim, quasi pla.

Imaginem ara que volem estudiar aquestes mateixes tres dades, però de tota la gent d’un país. Comencem a representar cada persona amb un punt igual que en el vídeo, i al final tindrem milions de punts. És el que s’anomena un núvol de dades: un núvol de molts i molts punts que acaben perdent la seva individualitat a la vegada que ens mostren algunes característiques del grup social. En aquesta web, per exemple, podeu veure l’aspecte que té un núvol de dades musicals, on els punts ara són cançons i melodies.

Si de cada persona (o cançó) tenim dues dades, podem pintar punts en un gràfic 2D, pla, i tindrem un núvol bidimensional, senzill i fàcil d’interpretar. En canvi, si per cada persona tenim tres dades, podrem formar un núvol 3D com en el vídeo, però el seu anàlisi ja serà molt més complex perquè haurem d’encertar la perspectiva (el punt de vista) correcta. És com fer una foto. Podem fer moltes fotos d’un núvol, però algunes seran millors que altres. Les que el capten de perfil deixen veure la seva part esvelta i acaben donant molta més informació, perquè els núvols prims mostren determinades correlacions entre les dades. No deixa de ser curiós: els humans, que vivim en un Univers clarament tridimensional, no podem percebre directament la semàntica dels núvols 3D i els hem de projectar (una foto és una projecció) en un paper bidimensional per poder captar bé el seu significat. Hem d’anar girant, trobar la direcció correcta, fer la foto, i llavors ho podem veure clar. Doncs bé, la cosa és encara més complicada perquè si volem analitzar comportaments socials, necessitem analitzar moltes variables de cada persona (N per exemple) i no només tres. Els núvols de dades tenen moltíssims punts, i a més cada un d’ells té informació de moltes dades, amb N valors diferents. En llenguatge matemàtic, són núvols de punts en un espai de dimensió N. Això sona a molt complicat, oi? Doncs no ho és, i aquesta és una de les meravelles de les matemàtiques: l’eina que troba la direcció òptima per a fer la foto, que és la que calcula els valors i vectors propis d’una matriu, és la mateixa tant si som a l’espai 3-D com en un espai N-D de moltes més dimensions.

L’anàlisi de components principals (conegut per les seves sigles PCA, en anglès), és una de les tècniques actuals més potents per interpretar grans quantitats de dades, els anomenats “Big Data“. És una eina essencial per a les ciències socials. L’algorisme PCA ens ajuda a entendre aquestes dades i a descobrir correlacions de les que després podrem inferir determinades relacions causals, perquè calcula les anomenades direccions principals del núvol. De fet, calcula el gir que cal fer per arribar a aquestes direccions i poder tenir unes bones perspectives del núvol. Cal tenir en compte que les direccions principals inclouen la direcció des de la qual el núvol es veu en la seva màxima extensió i la direcció en la que es veu el màxim de prim, vegeu la nota al final (aquesta és la direcció en que el pla del vídeo es veu de costat). El seu ús és ben senzill: calculem la matriu de les nostres dades N-dimensionals, calculem els valors i vectors propis d’aquesta matriu amb algorismes coneguts i fàcils d’usar, projectem les dades, i ja les podem analitzar en 2D o en un espai adient de dimensió molt més reduïda que l’original N. L’algorisme PCA projecta per reduir la complexitat, però ho fa de la millor manera, preservant allò que ha trobat significatiu a les dades i suprimint el superflu.

La forma dels núvols de dades és fonamental per entendre els comportaments socials, les causalitats i fins i tot les relacions de poder i les injustícies. I tenim eines, com el PCA, que automàticament ens dóna la perspectiva òptima per observar-los. Però els punts dels núvols no tenen identitat. L’estadística treballa amb les dades, pot treballar amb grans volums d’aquestes dades, però aquestes han de ser sempre anònimes per tal de preservar el dret de les persones individuals a la seva intimitat i al control de les seves dades. El problema de certes pràctiques actuals i de determinats encreuaments que es fan entre molts núvols de dades complementaris és que poden arribar a identificar i “marcar” persones concretes. Si l’únic que saben de mí és la meva edat, el meu salari i si he estat hospitalitzat o no, ben poca cosa podran esbrinar. Però si a més saben on visc (és un dels llocs on més temps tinc el meu telèfon mòbil, per exemple) i tenen accés al cens de població, llavors tot esdevé més fosc, relliscós i perillós. El que es èticament incorrecte és convertir núvols anònims de dades en núvols etiquetats amb noms de persones, perquè utilitzar les dades personals sense permís és (o hauria de ser) un delicte. Podem mirar i gaudir de les infinites formes dels núvols, però no podem trencar, amb una lupa, la intimitat de les seves gotes d’aigua.

Per cert, l’Emilio Lledó diu que una de les més grans indecències actuals a Espanya és la corrupció de la gent. Diu que és una desvergonya i un engany, i que no només és la indecència de corrompre béns, sinó també la de la de la corrupció de la ment de la gent.

———

NOTA: Veureu que a la taula de valors del vídeo, hi ha valors negatius. Això és degut, en el cas de la càrrega de treball i del salari, a que s’ha restat el seu valor mitjà. Posem-nos en el cas de la càrrega de treball i suposem que els valors reals, respectivament per Smith, Johnson, Williams, Jones i Davis, són 0,8 , 1 , 0,4 , 0,2 i 0,6 (estem fent la hipòtesi que la màxima càrrega de treball és la unitat). La suma dels cinc valors és 3, i per tant el valor mitjà és 0,6. Si restem aquesta mitjana a tots els valors obtenim 0,2 , 0,4 , -0,2, -0,4, 0. Un escalat de tots els valors multiplicant per 5 dóna finalment els resultats que veiem a la taula del vídeo: 1, 2, -1, -2, 0. En el cas del salari el procediment és idèntic, mentre que en el cas de la distància a la feina, la diferència és que al final s’han arrodonit els resultats.

L’algorisme PCA treballa calculant els valors i vectors propis d’una matriu de dimensió N x N que habitualment és la matriu d’autocorrelació de les dades. Si la calculem, per exemple, amb les coordenades de tots els ocells d’un estol d’estornells, els vectors propis que obtindrem ens donaran en general la direcció d’avanç, la direcció (quasi vertical) perpendicular al pla que conté la majoria dels ocells i una tercera direcció transversal que és la que ens permet d’observar l’estol de perfil i veure la seva primesa.

Músiques, dibuixos i Pitàgores

dijous, 13/08/2015

Després de l’article sobre els cercadors de melodies i l’espai de les músiques, em vaig quedar amb ganes de parlar una mica més de les tècniques d’aprenentatge automàtic. El comentari de Jordi Domènech que podeu llegir en aquesta mateixa pàgina i un treball que acabo de llegir sobre dibuix automàtic amb imatges predissenyades, m’han acabat de decidir. El que segueix és una estranya barreja de Pitàgores, música i dibuixos.

Els dos dibuixos d’aquí al costat són composicions fetes a partir d’imatges o icones predissenyades. És el que els anglesos anomenen “clip art”. Quin us agrada més, dels dos? Jo trobo millor el de la dreta. Doncs bé, el de l’esquerra l’ha fet una persona mentre que el de la dreta l’ha generat un ordinador que havia estat prèviament entrenat i que havia anat aprenent.

Tot plegat és un tema de semblances. Són semblants, l’arbre de l’esquerra i el de la dreta? I les flors de dreta i esquerra? I els gossos, els núvols i els dos Sols? Deixant de banda els arbres, probablement estareu d’acord amb mi en què els dibuixos de l’esquerra i la dreta no són gaire semblants. Però podem anar més enllà i parlar de semblança d’estils. Si ens agrada més la composició de la dreta és probablement perquè els estils de les imatges que la componen (gos, flors, núvol, etc.) són més semblants que en el cas de la composició de l’esquerra. Doncs bé, l’ordinador que ha creat aquest dibuix automàtic ho ha pogut fer perquè sap mesurar semblances, amb el que ha pogut escollir les imatges individuals amb criteri de similitud i harmonia d’estil. Aquest algorisme d’aprenentatge automàtic (que podeu consultar en aquesta web, d’on també he extret la imatge de dalt, on trobareu el text de l’article complet, bastant tècnic) treballa en un seguit de passos ben definits i coneguts. El primer que hem de fer és aconseguir molts dibuixos i definir un conjunt de característiques o descriptors que els identifiquin, per codificar-los un a un. Això és fonamental, perquè els ordinadors no entenen de dibuixos ni de música. El conjunt de descriptors d’un dibuix és com el seu nom, és un conjunt de símbols que el representen i l’identifiquen; La única diferència amb el nostre llenguatge és que els descriptors són numèrics. Em el cas de l’algorisme automàtic de generació de composicions de dibuixos que estem comentant, cada dibuix individual, sigui un arbre, un núvol, una representació del Sol o un gos, es representa amb un conjunt de 169 descriptors numèrics. En aquest primer pas, es van escollir dos-cents mil dibuixos individuals a partir d’aquesta biblioteca de dibuixos, i es van calcular els 169 descriptors per a cada un d’ells. Per què tants dibuixos? Per què tants descriptors per a cada dibuix? Doncs perquè sempre és millor pecar per massa que per massa poc, diuen, i perquè si ho volguéssim fer amb pocs descriptors incrementaríem la probabilitat d’oblidar-nos d’alguna característica important. Només a caire d’exemple, en aquest cas alguns dels descriptors són el nombre de colors, el gruix dels contorns del dibuix i el grau de gradació de color, que mesura si els colors acaben de cop o bé es van difuminant.

Un cop hem fet aquesta feina d’identificar amb 169 descriptors tots els dibuixos de la nostra ben nodrida col·lecció, podem demanar ajut a Pitàgores i mesurar la semblança entre una parella qualsevol de dibuixos A i B simplement calculant la distància entre els punts corresponents als nostres dos dibuixos en l’espai dels dibuixos, un espai que, quasi res, té una dimensió igual a 169!. Les semblances es calculen mesurant distàncies, que no són més que longitud d’hipotenuses. Tot plegat és fàcil d’imaginar si pensem en aquest espai dels dibuixos, en el que cada dibuix queda representat com un punt (si només tinguéssim tres descriptors, podríem pintar aquests punts a l’espai 3D). Si dos dibuixos són semblants, els seus descriptors també seran similars i quedaran representats per punts propers a poca distància l’un de l’altre. Per això, els ordinadors mesuren semblances calculant distàncies i calculen distàncies amb el teorema de Pitàgores. Si (miraculosament) haguéssim encertat i tots els nostres descriptors fossin igual de rellevants, podríem mesurar semblances amb les corresponents distàncies Euclidianes (vegeu la nota al final) i dir que el quadrat de la mesura de la semblança entre dos dibuixos en l’espai dels dibuixos individuals és el resultat de restar els valors de cada una de les parelles homòlogues de descriptors a un i altre dibuix, elevar totes aquestes 169 diferències al quadrat, i sumar-les. Però això no és cert, perquè segur que alguns dels descriptors que hem pensat seran més significatius que d’altres, i tot plegat només funcionarà bé si donem més pes als més importants. Un dels algorismes més senzills (vegeu un cop més la nota al final; i observeu que en aquest cas la distància ja no serà Euclidiana) d’aprenentatge automàtic consisteix en donar un pes a cada descriptor. Tindrem 169 paràmetres o pesos. I ara, el quadrat de la mesura de la semblança entre dos dibuixos en l’espai dels dibuixos individuals serà el resultat de restar els valors de cada una de les parelles homòlogues de descriptors a un i altre dibuix, multiplicar cada una d’aquestes 169 diferències pel seu pes, elevar els resultats al quadrat, i sumar-los tots. Estarem aplicant el teorema de Pitàgores tot donant més importància a uns catets que als altres.

Sembla que ja ho tenim quasi tot. Cada dibuix es representa amb els valors dels seus 169 descriptors, i la generalització del teorema de Pitàgores a n dimensions ens permet calcular semblances entre dibuixos. La única cosa que ha de fer l’ordinador per a generar una composició de dibuixos com la que tenim a dalt és trobar, en l’espai dels dibuixos, un arbre, unes flors, un gos, un núvol i un Sol tals que les distàncies entre tots ells siguin petites. Hem convertit el fet de fer un dibuix en el problema geomètric de trobar punts propers. Només queda un detall. Hem de saber quins són els pesos que donarem als diferents descriptors. I això, en el treball que estic comentant, es va fer amb tècniques d’aprenentatge automàtic supervisat (en concret, tècniques d’aprenentatge de la mètrica). En aquest cas es van escollir moltes tripletes de dibuixos A, B, C, i es va demanar a molts voluntaris que en cada cas contestessin si A era més semblant a B que no pas a C o si pel contrari, A era més semblant a C que no pas a B. Cada tripleta de dibuixos A, B, C va ser analitzada per 10 voluntaris diferents, per tal d’evitar opinions extremes. L’algorisme d’aprenentatge automàtic supervisat va calcular el conjunt de pesos de manera que el resultat fos concordant amb el que havien dit els voluntaris: si aquests havien vist, per exemple, que A era més semblant a B que no pas a C, els pesos havien de ser tals que la distància entre A i B fos més petita que la distància entre A i C, i així en tots els casos. L’interessant de tot plegat és que es va veure que 91 dels 169 descriptors acabaven tenint un pes nul. En els dibuixos, només 78 descriptors són rellevants. Els altres 91 no són informatius.

En resum: si volem que el nostre ordinador pugui calcular la semblança entre dibuixos per així poder generar noves composicions gràfiques, hem de definir un nombre (elevat) de descriptors que caracteritzin cada dibuix i hem de calcular els paràmetres (els pesos, en el nostre cas) que finalment ens permetran calcular distàncies (semblances) entre dos dibuixos qualsevol. L’aprenentatge automàtic és el procés que calcula el conjunt de paràmetres que conformaran el model de l’espai dels dibuixos i que permetran el càlcul correcte de distàncies entre els mateixos.

Doncs bé, si volem identificar músiques, el que ens cal és tenir una biblioteca de músiques ja identificades i trobar la més semblant a la que estem escoltant. Per a fer-ho, hem de definir un nombre (elevat) de descriptors que caracteritzin cada música i hem de calcular els paràmetres (els pesos, en el nostre cas) que finalment ens permetran calcular distàncies (semblances) entre qualsevulla dues melodies. L’aprenentatge automàtic és el procés que calcula el conjunt de paràmetres que conformaran el model de l’espai de les músiques i que permetran el càlcul correcte de distàncies entre aquestes.

Aprendre a mesurar semblances entre dibuixos és molt semblant a aprendre a calcular similituds entre músiques. Tot passa per tenir un bon conjunt de descriptors. En el cas de la música, el que és bastant habitual és calcular la transformada de Fourier de petits fragments solapats (d’uns 25 mil·lisegons cada un), convertir les freqüències en unitats adaptades al nostre sistema psicoacústic (les anomenades unitats mel, MFCC) i considerar com a descriptors els pics de freqüència més grans que un cert valor. Els descriptors són els ingredients de l’aprenentatge automàtic, un camp que és molt més ampli que el que he explicat, que inclou tècniques com les anomenades xarxes neuronals i que, en poques paraules, vol aconseguir algorismes que sàpiguen generalitzar a partir de la seva experiència.

Les tècniques d’intel·ligència artificial són en el centre d’un debat ètic. Poden servir per identificar músiques i compondre dibuixos, però també per rastrejar grans quantitats d’informació (el “big data”) i acabar sabent més sobre nosaltres del que podem imaginar. Són eines de doble tall. De totes maneres, Neil Lawrence diu, crec que amb molt encert, que a ell no li preocupen les màquines sinó les persones. L’aprenentatge automàtic i la intel·ligència artificial poden ser un perill, però no pas per les raons que molts pensen. El problema no són els ordinadors ni els algorismes, sinó els humans. El perill és que hi haurà qui les voldrà utilitzar com armes per a enfonsar i destruir els demés mentre incrementa el seu poder.

Per cert, en Xavier Roig diu que per tal de controlar les fronteres exteriors d’una manera efectiva caldria implantar una autoritat única per a tot Europa, perquè el tractat de Schengen de lliure circulació de persones és una bona idea mal implantada.

—–

NOTA (quasi idèntica a la d’aquest article): El teorema de Pitàgores diu, com sabem, que el quadrat de la hipotenusa d’un triangle rectangle és igual a la suma de quadrats dels catets. Això, clar, és en el pla, en dues dimensions. Però una de les coses interessants d’aquest teorema és que serveix per a qualsevol dimensió. Si tenim dos punts P i Q en un mapa i volem calcular la distància que els separa per saber si són propers o llunyans, podem pintar un triangle rectangle i començar calculant la diferència b entre les seves latituds (que correspon a la longitud del catet nord-sud) i la separació c entre les seves longituds (que correspon a la longitud del catet est-oest). Si b i c els expressem en quilòmetres i si no són massa grans, podrem menysprear la curvatura de la Terra, suposar que el triangle és pla, i calcular el quadrat de la distància entre P i Q amb el teorema de Pitàgores, fent b*b+c*c. Ara bé, aquest càlcul només serà cert si som en una comarca plana. Si P és a la vora del mar i Q és dalt d’una muntanya a 1000 metres, el teorema de Pitàgores en tres dimensions ens diu que el quadrat de la distància entre P i Q és b*b+c*c+h*h, on h és la diferència d’alçades entre els dos punts. En tres dimensions, el teorema de Pitàgores té tres termes. I no és difícil veure que això es compleix en qualsevol dimensió. El quadrat de la distància (anomenada Euclidiana) entre els punts que representen dues melodies en l’espai de les músiques (espai que podem suposar, per exemple, de dimensió 450) és el resultat de restar els valors de cada una de les parelles homòlogues de gens a una i altra melodia, elevar totes aquestes diferències al quadrat, i sumar-les. i el quadrat de la distància (anomenada Euclidiana) entre els punts que representen dos dibuixos en l’espai dels dibuixos individuals (espai que podem suposar, en aquest cas, de dimensió 169) és el resultat de restar els valors de cada una de les parelles homòlogues de descriptors a un i altre dibuix, elevar totes aquestes diferències al quadrat, i sumar-les. Només amb un petit detall: no totes les diferències “valen igual”, hem de donar més importància a unes que a les altres. És el mateix que passa amb els punts dels mapes. Si veiem que la distància en horitzontal (arrel quadrada de b*b+c*c) entre els nostres punts P i Q és de 10 quilòmetres, és fàcil veure que amb una diferència d’alçades de 1000 metres, la nova distància Euclidiana, arrel de b*b+c*c+h*h és de 10 quilòmetres i 50 metres. La línia recta entre P i Q només s’allarga 50 metres quan el punt Q puja 1000 metres. És el que ens diu la geometria, que no coincideix pas amb el que ens diu el nostre cos perquè la nostra percepció subjectiva de distància és bastant més petita quan P i Q són a una mateixa plana que quan Q és dalt d’una muntanya. Com podem calcular aquestes distàncies subjectives? És fàcil, només cal donar més importància a les alçades. És el que en geometria es diu “canviar la mètrica”. És com si canviéssim l’escala vertical. Podem calcular distàncies subjectives en els mapes si canviem una mica la formula i escrivim b*b+c*c+w*h*h, on w és el pes o importància que volem donar a les alçades. Quan fem el càlcul amb w=1 obtenim la distància Euclidiana mentre que si el fem, per exemple, amb w=100, obtenim un valor molt més proper a la nostra percepció subjectiva. I ara, tornant al cas de les distàncies entre melodies o dibuixos, el que fan els programes de reconeixement va en aquesta línia de donar pesos diferents als diferents descriptors i treballar amb una mètrica no Euclidiana: cal restar els valors de cada una de les parelles homòlogues de gens a una i altra melodia o dibuix, elevar totes aquestes diferències al quadrat, multiplicar cada un d’aquests quadrats pel seu pes, i sumar-los. Els pesos es calculen habitualment amb algorismes d’aprenentatge automàtic.

L’oligarquia de les dades

dimecres, 1/04/2015

Les dades són la nova eina de poder. Ho explica molt bé en Neil Lawrence, professor d’intel·ligència artificial a la Universitat de Sheffield, en un article que publicava fa poc el diari The Guardian.

En Neil Lawrence parla del poder dels bancs i del poder de les dades. El poder dels bancs es basa en el capital que acumulen. Però el més modern, ara mateix, és aconseguir poder tot acumulant dades. Les dades són els diners del futur. A internet hi ha moltíssimes dades de tots nosaltres, més de les que imaginem. Analitzant-les, contrastant-les i relacionant-les és possible entendre cada cop millor la gent, els grups i fins i tot les persones. Són tècniques de doble fil, com moltes d’altres. És ben segur que ens serviran per a dissenyar noves eines de diagnosi i tractament mèdic i nous recursos per a les persones grans que viuen soles. Però també s’estan utilitzant com a eines de control, de publicitat invasiva i fins i tot d’atac. Amb una gran diferència: tothom sap que els bancs són dipositaris dels nostres diners, i que els podem anar a buscar sempre que vulguem. En canvi, no tenim cap control sobre les nostres dades i no les podem recuperar ni esborrar. S’han quedat al “núvol” d’internet, se les han quedat.

Fa molts anys que es parla d’intel·ligència artificial. Fa cinquanta anys, quan tot just es començava a parlar dels ordinadors, ja hi havia qui els anomenava cervells electrònics. És una disciplina que ha estat molt temps en hibernació: fins fa poc se’n parlava més en escrits de ciència ficció que en texts científics. Però els nous algorismes d’aprenentatge automàtic, l’anomenat machine learning, ho estan estan començant a canviar tot. Les dades de les xarxes socials, del que graven les càmeres de vigilància, del que ens interessa quan cerquem informació a internet, de les nostres transaccions amb targetes de crèdit i de molt del que fem cada dia es guarden “al núvol” d’internet i serveixen per a que les màquines, els ordinadors, vagin aprenent. El volum de dades és ingent (per això es parla de big data), però els humans hem sabut dissenyar bons algorismes d’aprenentatge just en el moment en el que els ordinadors han assolit la mida crítica necessària. Hem aconseguit que els ordinadors sàpiguen analitzar, filtrar i utilitzar les dades disponibles. Ha estat un canvi radical. Fa deu anys, havíem de programar els ordinadors per a que fessin les tasques que desitjàvem. Ara, en canvi, els programem per a que interpretin informació i es vagin auto-programant en funció d’aquestes dades que van trobant a internet. Aquest aprenentatge automàtic en base a la informació és dinàmic i adaptatiu, perquè l’auto-programació es va perfeccionant constantment: els actuals ordinadors analitzen les dades mentre aprenen de la seva experiència, si em permeteu el símil en termes humans. Tenim un bon exemple en el sistema traductor de Google, en el que les traduccions no es basen en regles sintàctiques prefixades, sinó en l’anàlisi dels texts ja traduïts que trobem a internet.

En Neil Lawrence parla d’un bon nombre de científics, entre ells l’Stephen Hawking, que demanen que es reguli la recerca en intel·ligència artificial. Però diu, amb molt encert, que a ell no li preocupen les màquines sinó les persones. La intel·ligència artificial pot ser un perill, però no pas per les raons que molts pensen. No ho serà pel que pot significar el fet de tenir màquines intel·ligents, sinó perquè hi haurà qui les voldrà utilitzar com armes per a enfonsar i destruir els demés mentre augmenta el seu poder.

El problema no són les dades ni els ordinadors. El problema és la concentració de poder, d’un poder immens, en mans de molts pocs. El que ens ha de preocupar, diu en Neil Lawrence, són els nous oligarques de les dades, siguin individus, governs o empreses, que han vist l’oportunitat de fer-se rics i augmentar el seu poder amb dades que no els pertanyen. En Neil Lawrence demana una democràcia de les dades, una democràcia on l’objectiu siguin les persones i on només es pugui actuar amb consentiment d’aquestes persones. Cal una regulació relativa a la propietat de les dades, per a que quan som observats, quan cerquem informació a internet o quan deixem dades al “núvol” no haguem de pensar que estem reproduint el pacte de Faust amb el diable. De fet, en aquests moments estem ben desprotegits: ja hem vist que podem anar al banc i demanar els nostres diners, però no podem fer que esborrin les nostres dades del “núvol”. És just que hi hagi una oligarquia que tregui profit de les nostres dades, fins i tot en certs casos en contra nostra?

Per cert, la Margot Wallström, ministra sueca d’afers estrangers, va denunciar el tracte que es dóna a les dones a Arabia Saudí, dient que els seus mètodes són medievals i un atemptat cruel que vol silenciar les formes modernes d’expressió. Sembla que els altres països Europeus no tenen intenció de donar-li suport i que fins i tot té problemes al seu país, per haver gosat dir això.

Per què ho simplifiquem tot?

dimecres, 22/01/2014

Darrerament ha sorgit un nou terme d’aquests que diuen que queda bé utilitzar. Es parla cada cop més de big data, que no són més que volums de dades gegantins que volem analitzar però que sobrepassen la capacitat dels nostres ordinadors. Poden ser dades meteorològiques, astronòmiques, sociològiques, econòmiques, farmacèutiques, resultats d’experiments de física d’altes energies o de molts altres tipus.

Sembla que la innovació verbal ens és vital. Hem d’anar trobant nous termes per a referir-nos a conceptes que no tenen res de nou. Tal vegada volem suplir la manca real d’idees creatives amb aquesta moda d’anar canviant la terminologia. Tenim volums de dades gegantins, això però no és cap novetat. Sempre n’hem tingut i sempre n’hi haurà, en el futur. La solució es basa en simplificar i filtrar, tot separant el gra de la palla i destil·lant l’essència de les dades. És el que sempre ha fet el cervell humà. El nostre sistema perceptiu, sobretot el visual, capta una quantitat ingent de dades, un volum intractable d’informació. El cervell filtra les dades, fa neteja, simplifica mentre dormim, i acaba conservant només el que ens és rellevant. Penseu en la diferència entre la riquesa de tots els detalls que esteu veient i el poc que recordeu del que vàreu fer abans d’ahir. Podem viure perquè optimitzem i filtrem la informació. Ho simplifiquem tot perquè sinó no sobreviuríem.

Aquests volums de dades gegantins esdevenen tractables quan els simplifiquem selectivament i en destil·lem el que ens és essencial. L’estadística ens ofereix un bon nombre d’eines per a fer la feina. Imaginem, per exemple, que tenim informació sobre els ingressos mensuals de tots els ciutadans europeus. Són moltes dades. Suposem que per a cada persona tenim les seves dades personals, el lloc on viu i els seus ingressos. Una eina estadística senzilla que ens pot servir per a reduir les dades és l’histograma. Per a calcular l’histograma en aquest cas, hem de dividir el rang d’ingressos en intervals i, per a cada un d’ells, comptar-ne el nombre de persones. Si ho fem en intervals de 100 euros, l’histograma ens mostrarà, en un diagrama de barres verticals, el nombre de persones amb ingressos entre 400 i 499 euros, entre 500 i 599 euros, i així successivament. L’histograma converteix les dades en anònimes, les simplifica i les destil·la. Ja no tenim informació de cada persona en concret, però podem saber el nombre de ciutadans europeus (o catalans) que cobren entre 1100 i 1199 euros i també els que cobren més de sis mil euros, si sumem els valors d’uns quants intervals. Hem passat de les dades individuals a les dades estadístiques, i de milions de dades a una llista de poques desenes de valors.

Els histogrames conserven, però, la informació rellevant. Podem fer-lo per països i veurem amb un sol cop d’ull quins són pobres i quins rics. Podem també llegir-hi el grau de desigualtat, només mirant la forma de les barres. Un país pot ser més ric que un altre si només mesurem la mitjana d’ingressos per persona, però pot tenir un grau més alt de desigualtat. Què és millor, tenir un nivell limitat de desigualtat o tenir una mitjana d’ingressos elevada?

Les mesures habituals de creixement ens donen una visió massa simplificada de la realitat. No és possible tenir una idea clara del què passa si només coneixem el valor del PIB. Pensem en un país imaginari del que coneixem l’histograma d’ingressos dels seus habitants. Si hi ha una rebaixa generalitzada de sous i tots els diners resultants d’aquesta rebaixa van a parar a uns quants ciutadans, el valor de la mitjana d’ingressos per persona no haurà canviat perquè no s’ha modificat ni la suma total d’ingressos ni el nombre d’habitants. Però la desigualtat és clar que haurà augmentat, com podrem veure ben clarament pel desplaçament de les barres de l’histograma cap als valors més elevats de la renda.

Hem de simplificar la realitat perquè sinó ni podríem sobreviure ni podríem entendre el què passa, però tampoc la podem simplificar massa. La realitat és polièdrica i ens calen mesures que l’expliquin bé. Cal simplificar, és clar; però fins un cert limit. Si ens passem i pretenem reduir més la informació, deixem d’entendre el que està passant. Les dades econòmiques no es poden reduir a un únic valor, el PIB. Com a mínim cal tenir alguna mesura de les que els estadístics anomenen “de segon ordre”, que mesuren les desigualtats i la dispersió. Quan us parlin del PIB, demaneu dades sobre les desigualtats, perquè les mitjanes i les sumes no són suficients. I quan us vulguin donar dades massa simplificades, sospiteu. No sempre tothom ho vol explicar tot.

Els sociòlegs, estadístics i economistes fan servir un bon indicador per mesurar la desigualtat en un país: l’índex que porta el nom del seu creador, Gini. L’índex Gini va de 0 a 1. Un país amb un índex 0 voldria dir que tothom guanya exactament el mateix, i en canvi un país amb un índex 1, indica que hi ha una sola persona que ho guanya absolutament tot, i la resta no guanyen res. Marc Grau de Justícia i Pau diu que el 2012, el país amb el coeficient més baix, i per tant més igualitari va ser Noruega (0.22). La mitjana Europea va ser de 0.3, i Espanya va quedar en la penúltima posició de la llista amb un 0.35, índex només superat per Letònia. Segons l’observatori de les desigualtats, la crisi ha provocat que un 38% de les llars hagi disminuït els seus ingressos al 2009, respecte el 2003. Al mateix temps, un 21% ha augmentat els seus ingressos i un 41% s’ha mantingut estable. S’aprecia també l’empobriment de les capes mitjanes ja que un 47% ha vist disminuir els seus ingressos de 2003 a 2009.

De fet, amb la crisi, no tots hem anat a pitjor. Alguns pocs han anat a millor o a molt millor, tal i com l’índex Gini demostra (de 0.31 al 2003 a 0.35 al 2012). Queda clar doncs que les desigualtats entre els dos pols es van fent, a poc a poc, més grans i visibles. Marc Grau explica que les 300 persones més riques del món van afegir durant el 2013 un total de 524.000 milions a les seves fortunes. D’altra banda, en Joan Majó diu que que a Catalunya, durant els últims anys, els ingressos bruts del 10% de les famílies més pobres han disminuït al voltant  del 50%, mentre que els del 10% de les famílies més riques han disminuït un 25%. El que és més greu és que les transferències públiques a les primeres han disminuït un 20%, mentre que les transferències a les més riques han augmentat un 17%. El govern està finançant la desigualtat.

Vaig dubtar entre posar el títol que finalment he escollit, o bé escriure el de “els límits de la dignitat”. Perquè quan les desigualtats van creixent, hi ha un moment en el que creuem la línia vermella de la dignitat. Els premis Nobel Stiglitz, Sen i Krugman parlen de desigualtat. Krugman diu, al seu blog del New York Times, que combatre la desigualtat no ha de ser un objectiu secundari, sinó el repte principal de qualsevol país. Les polítiques reguladores, fiscals i anti-corrupció han d’aconseguir reduir l’index Gini, i això només es pot fer si s’inverteix el sentit del flux de la riquesa. Durant la crisi, la majoria hem contribuït a l’enriquiment d’uns quants. Ara, cal anivellar i capgirar aquest flux. Els terrenys abruptes i desiguals no produeixen, i les societats amb excessiva desigualtat es trenquen. Tots sabem que per a anivellar un terreny cal rebaixar les seves parts més elevades, portant la terra a les zones enfonsades.

Per cert, Joseph Stiglitz diu que les accions dels banquers i les polítiques governamentals influenciades per la dreta no sols han minat directament la confiança, sinó que també han contribuït en gran part a la desigualtat. Diu que els ciutadans han de poder confiar que el sistema és raonablement just, però que quan veuen un sistema tributari que grava els més rics amb una fracció del que ells paguen, tenen la sensació que els estan prenent el pèl.

_________________________________________________________________
NOTA i extracte de les cites: Oxfam Intermón, en l’informe que va presentar a la Taula del Tercer Sector que es va celebrar el passat mes de setembre, explica que els programes d’austeritat europeus han desmantellat els mecanismes que reduïen la desigualtat i que feien possible un creixement equitatiu. Amb l’augment de la desigualtat i de la pobresa, Europa s’enfronta a una dècada perduda. Diu que si les mesures d’austeritat segueixen endavant, l’any 2025 hi haurà entre 15 i 25 milions d’europeus més que podrien viure en la pobresa. Oxfam ho sap perquè ja ha estat testimoni de situacions similars. Hi ha clares semblances entre aquests programes d’austeritat i les ruïnoses polítiques d’ajustament estructural imposades a Amèrica Llatina, l’Est Asiàtic i Àfrica subsahariana durant les dècades de 1980 i 1990. Aquestes polítiques van ser un fracàs, un tractament que pretenia curar la malaltia matant al pacient. Actualment, la fortuna de les 85 persones més riques del món és equivalent al que tenen els 3.500 milions de persones més pobres de la Terra. Oxfam fa una crida als governs europeus perquè abandonin les polítiques d’austeritat, i per a que optin en canvi pel camí d’un creixement inclusiu que afavoreixi les persones, les comunitats i el medi ambient. Això no pot continuar i no s’ha de repetir.

Joan Majó cita també l’informe d’Intermón i diu que ara mateix, un 24% dels ciutadans d’Europa són pobres. A Espanya el percentatge és del 27%, i a Catalunya és del 17%. Però que si es manté la tendència i les actuals poliítiques, aquests percentatges poden arribar l’any 2025 al 29%, el 42% i el 34%. La crisi ha enriquit els rics i ha empobrit les classes mitjanes i baixes. Un estudi recent de l’IERM de Barcelona demostra que a Catalunya, durant els últims anys, els ingressos bruts del 10% de les famílies més pobres han disminuït al voltant  del 50%, mentre que els del 10% de les famílies més riques han disminuït un 25%. El que és més greu és que les transferències públiques a les primeres han disminuït un 20%, mentre que les transferències a les més riques han augmentat un 17%. En d’altres paraules, l’acció del sector públic ha agreujat encara més la desigualtat.

En Xavier Aragay també en parla i explica que Oxfam Intermón demana als líders que es reuniran aquests dies al Fòrum Econòmic Mundial de Davos que no se segueixi governant per a “les elits” i que es posi la lluita contra la desigualtat com a prioritat. La crida és absolutament pertinent, i més venint d’Espanya, el segon país amb més desigualtats d’Europa segons l’homologat índex Gini, només per darrere de Letònia.

Marc Grau, president de Justícia i Pau de Terrassa, diu que les desigualtats entre els dos pols es van fent, a poc a poc, més grans i visibles. El percentatge de població espanyola que té molta dificultat per arribar a final de mes passa d’un 10,7% al 2007 a un 16.9% al 2013, i el percentatge de població amb impagats del seu habitatge principal passen d’un 5,6% (2007) a un 9.2% (2013), segons l’INE. Diu que tots parlem de desigualat. No obstant, després de dir allò (cert) de els rics cada cop són més rics, i els pobres més pobres, què passa? Què fem? Som una societat que fa grans diagnòstics, però que amb diagnòstic en mà ens costa posar-hi remei. Per tant, per no deixar florir paraules com Justícia, Solidaritat o Igualtat fa falta acció. Diu que tenim diagnòstics, però que fa falta acció. Com el simple fet d’estimar requereix d’acció, per escriure de nou amb majúscules i fer brotar conceptes claus per una societat avança, Marc Grau diu que cal posar-nos mans a l’obra.

Martha C. Nussbaum, quan va rebre el premi príncep d’Astúries 2012, va dir que les mesures correctes del desenvolupament s’han de focalitzar en les persones, han de ser plurals, i han de ser sensibles a la distribució i a les desigualtats. I que han d’incloure les capacitats humanes essencials, que són requisits mínims d’una vida basada en la dignitat humana.