Arxiu de la categoria ‘Informàtica’

Les nostres metadades

divendres, 12/05/2017

En Ferran Requejo diu que som cecs i sords però ebris de paraules; que som intrínsecament xerraires i que constantment inventem ficcions que ens acabem creient i que fins i tot defensem. El cert és que cada dia generem moltíssima informació que acaba circulant per la xarxa. Trucades telefòniques, missatges de text, missatges d’àudio, fotos i vídeos. No parem d’explicar-nos coses i de compartir informació. Segurament, podríem passar amb molt menys. És informació, són dades que moltes vegades considerem privades i que no voldríem que ningú en pogués fer ús sense el nostre permís.

Però a més de dades, generem una gran quantitat de metadades. El que ens diem per telèfon o quan ens enviem missatges són dades; en canvi, la informació que hem trucat a tal persona el dia X i que hi hem estat parlant durant 9 minuts és una metadada, de la mateixa manera que ho és el fet d’haver-li enviat un whattsapp. Les dades són el què, les metadades són el quan, el com i el on ho hem fet. Les cerques per internet, les compres amb targeta, els llocs per on anem amb el mòbil, el lloc on el deixem tota la nit, són metadades. L’ús d’aquestes metadades és encara molt poc regulat, i, com sempre, hi ha empreses que les utilitzen per a fer negoci.

En Paul Wood comenta, en aquest article, un exemple ben recent del que es pot arribar a fer amb tota aquesta informació. Es tracta de la passada campanya electoral als Estats Units. Parla de la doble personalitat de Donald Trump i del que anava fent a l’ombra dels seus comentaris destralers i dels seus tuits. Concretament, al juny del 2016, en Trump va negociar amb l’empresa anglesa Cambridge Analytica un contracte milionari per esbrinar, en base a l’anàlisi de metadades, què era el més probable que acabés votant cada ciutadà dels EEUU a les eleccions presidencials. L’estratègia es va basar en connectar dos estudis independents, el primer dels quals va analitzar la personalitat de més d’un milió de ciutadans. Això es va fer en base a les seves respostes a petites enquestes telefòniques, per internet, o al que contestaven qüestionaris d’enquestadors que els aturaven durant les seves compres en grans superfícies comercials dels Estats Units. Amb algorismes d’aprenentatge similars a altres que actualment s’estan estudiant, van poder fer una valoració de la personalitat de tots i cada un d’ells en cinc eixos diferents: el de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Al final, Cambridge Analytica va acabar tenint una estimació dels trets de personalitat de més d’un milió de persones, quantificats en base al valor d’aquests 5 eixos ja mencionats.

Però això no és tot. Cambridge Analytica també va acabar disposant d’informació sobre tots i cada un dels 230 milions de potencials electors als Estats Units. De cada un d’ells, va poder aconseguir un total d’entre 4.000 i 5.000 dades: edat, gènere, on viu, on treballa, on va els caps de setmana, si surt o no a les nits, què menja, quins diaris i revistes compra, quins programes de tele mira, quin cotxe condueix, i moltes més coses. Dades i metadades que, un cop recollides dia a dia, ens defineixen i classifiquen fins convertir-nos en un punt dins un immens espai de maneres de ser i fer. Hi ha empreses que ens tenen fitxats. En Paul Wood reconeix que tot plegat és impressionant i fa por: Cambridge Analytica les té a la venda, en una operació comercial que, en paraules seves, converteix dades en or.

A partir d’aquests dos estudis, el repte era aconseguir fer una estimació de la tendència política de cada ciutadà. Cambridge Analytica es va basar en dues hipòtesis que van resultar certes: que hi havia correlació entre el que comprem i fem cada dia i els trets de la nostra personalitat, i que també hi havia correlació entre aquests trets de personalitat i la nostra tendència electoral. En altres paraules, els que fan coses similars i tenen hàbits semblants (i es troben representats per punts propers), tenen personalitats similars; a més, els trets de la personalitat ajuden a predir el comportament i a saber si ens agrada més el vi o la cervesa i si pensem votar el candidat A o el B. Amb l’ajut d’aquestes dues correlacions, els de Cambridge Analytica van poder fer una estimació del valor dels 5 eixos de personalitat per tots els 230 milions de potencials votants, i, en un segon pas, deduir quin candidat era el preferit de cada un d’ells.

La conseqüència de tot l’anterior és que es va poder actuar amb propaganda electoral “micro-dirigida” a cada petit grup i a cada persona concreta. El missatge, enviat a través de correus electrònics o amb voluntaris que feien el porta-porta, era sobretot dirigit a les persones indecises, i a cada una d’elles se li explicava justament el que ella desitjava escoltar. No hi havia un únic programa polític, només publicitat per convèncer la gent. Tot era “a gust del consumidor”. Qui estava preocupat pels llocs de treball rebia missatges que deien que tota la situació laboral milloraria, qui era partidari de les armes de foc es trobava amb cartes que parlaven de la necessitat de preservar-les, qui tenia por del terrorisme rebia informacions sobre la importància de fer fora els musulmans i estrangers.

Només va caldre treballar amb les dues correlacions ja mencionades. La de les dades de cada persona amb el seu perfil de personalitat, i la d’aquest perfil amb el comportament electoral. Evidentment el resultat no és exacte, i el sistema es pot equivocar, enviant cartes inadequades a molta gent. Però estadísticament funciona, perquè la doble correlació fa que la probabilitat d’encertar sigui molt més elevada que la d’enviar cartes que no serveixen. La conclusió, molt preocupant, és que una empresa ha sabut com fer-s’ho per enviar missatges individualitzats de publicitat electoral, i que hem acabat veient que ha aconseguit el que volia.

En Paul Wood cita en Jill Lepore, especialista en historia dels processos electorals a la Universitat de Harvard, que reconeix que els sistemes tradicionals de votació poden ser poc fiables, però que la ciència de les dades pot ser encara molt més perjudicial. No només els missatges actuals dels polítics acaben sent dictats pels seus consultors amb l’únic objectiu de guanyar vots, sino que ara, a més, a cada votant se li diu el que vol escoltar. És el que diu la imatge de dalt, que he tret d’aquesta pàgina web. Moltes vegades no és que ens venguin alguna cosa: el que passa és que ens estan venent a nosaltres mateixos. Nosaltres som el producte…

Per cert, l’Adrià Rocha Cutiller diu que Facebook, Google i Amazon ho saben tot de nosaltres i que fan “el negoci de la nostra vida”. Saben amb qui parlem, on som, cap on anem, qui som i qui ens agradaria ser. I que ho saben perquè els ho diem. Diu que Facebook acumula, juntament amb Google, el 50% de tota la inversió publicitària mundial.

Els ordinadors visuals

dijous, 27/04/2017

Fa poc, en una conversa amb en Gérard Berry, va sorgir el tema dels telèfons mòbils. En Gérard opina que les coses s’estan capgirant. Vam passar del telèfon fix d’ara fa vint anys a uns mòbils que bàsicament servien per trucar i enviar missatges de text, amb poques capacitats de càlcul i emmagatzemament. Després, hem passat lentament a tenir petites màquines amb altes capacitats de computació i tractament de dades, que continuem anomenant telèfons però que de fet són potents ordinadors que poden telefonar, ajudar-nos a cercar informació o mostrar-nos mapes. Els mòbils s’han convertit en ordinadors que capten fotos i vídeos i que fan moltes més coses. I de fet, ben aviat estarem envoltats d’ordinadors que “ens ajuden” a fer-ho tot, controlant les nostres cases, cotxes i electrodomèstics.

La fotografia ha sofert dues revolucions en menys de vint anys. La primera, que va començar els darrers anys del segle XX, va significar el pas, dràstic, de la fotografia analògica a la digital. Algunes empreses com Kodak es van enfonsar, i la gent va deixar de revelar rodets de fotos. Ja no calia mirar-s’hi molt, a l’hora de fer fotos, perquè en podíem fer moltes i escollir després la que més ens agradava sense cap cost addicional. En eliminar el cost de cada foto individual, va començar a canviar l’essència mateixa de la fotografia. Lentament, vam anar entrant a l’època de la massificació de la imatge, perquè tot era fàcil i a l’abast de tothom.

Després va venir la segona revolució, més invisible, que ens han portat els telèfons mòbils. Us heu preguntat alguna vegada com és que, amb un objectiu tan petit i amb una distància focal tan minsa, els telèfons actuals poden fer fotos tan bones? És clar que els objectius de les càmeres convencionals i els de les més bones (com les rèflex) recullen molta més llum i poden obtenir fotos de molt bona qualitat, però el que a mi sempre m’ha sorprès és que els telèfons puguin fer les fotos que fan amb uns objectius tan petits, de pocs mil·límetres. La resposta, que ens explica en Frédéric Guichard en aquest vídeo, es troba en els algorismes de tractament d’imatge dels nostres mòbils, que són veritables ordinadors visuals. Abans, les lents dels sistemes òptics de les càmeres es fabricaven amb un procés delicat i d’alta precisió. Ara no cal, perquè durant el control de qualitat final, cada càmera individual s’ajusta per tal d’aconseguir el màxim de prestacions. Com que ja no es pot tocar la lent òptica, el que es fa és ajustar els algorismes que tracten la imatge capturada de manera que compensin els errors i distorsions de la lent. Cada telèfon adapta, de manera quasi òptima, el tractament de les imatges als defectes del seu sistema òptic, de manera que acaba tenint un conjunt lent-algorismes únic i que no té cap altre telèfon. Aquesta segona revolució de la fotografia ha canviat totalment els sistemes de fabricació de les lents dels objectius de les càmeres fotogràfiques, com bé explica en Frédéric Guichard: enlloc de fabricar lents d’alta precisió i conjunts òptics que compensin les aberracions, fem lents de baix cost més imperfectes i després corregim intel·ligentment els errors que apareixen a la imatge capturada.

Hi ha tota una nova àrea de recerca, anomenada fotografia computacional, que estudia els algorismes que, a qualsevol telèfon mòbil, “cuinen” la imatge crua que capta el sensor de la càmera fins deixar-la preparada per a que la puguem veure. La imatge de dalt, que he compost a partir del vídeo d’aquesta conferència d’en Gérard Berry, mostra dues d’aquestes transformacions. Dalt a la esquerra veiem la imatge “crua” tal com surt del xip de sensors de la càmera, i a la dreta tenim com queda un cop s’han ajustat automàticament els colors. La fila de baix mostra com es corregeix l’anomenada aberració esfèrica: les imatges d’esquerra i dreta mostren la imatge, primer crua i després d’haver estat tractada pels algorismes (personalitzats per a cada telèfon) de correcció de distorsions.  Com bé diu en Frédo Durand, els mòbils han passat a ser les càmeres de fotos per antonomàsia, i en ells, el component central de la creació de les imatges és la computació (i els algorismes). El que fa qualsevol mòbil en el breu període de temps que hi ha des que premem el botó de l’obturador fins que ens mostra la foto en el visor és increïble, com explica en Gérard Berry a la seva conferència. Cuina i millora els colors, corregeix distorsions, compensa zones molt fosques o molt clares, elimina sorolls i altres tipus d’errors, detecta cares i analitza si algú ha tancat els ulls… És la nova informàtica, dels colors, de la forma i de la imatge.

Un darrer detall. En Frédéric Guichard explica que moltes vegades, la foto que obtenim no és de l’instant que premem el disparador, sino que és d’uns moments abans. Això és possible perquè les actuals càmeres dels mòbils no capturen una única imatge, sino que, mentre estem ajustant l’enquadrament, es guarden temporalment tota la ràfega de fotos dels fotogrames que veiem en el visor de la càmera quan som a punt de fer la foto. Part del processat de la imatge que fa l’ordinador-càmera consisteix en analitzar les fotos anteriors a la darrera, identificar cares de la gent, i substituir aquelles cares de persones que han quedat amb els ulls tancats, pels trossos corresponents d’imatge a altres fotogrames on han quedat millor. La foto final no és més que un collage de trossos de fotogrames amb distorsió i colors adequadament corregits.

Els ordinadors, les aplicacions i tots els ginys intel·ligents que van entrant a les nostres vides ben segur que ens ajudaran a viure millor, però impliquen una responsabilitat per part nostra: la de saber marcar els límits. No parem de fer i enviar-nos fotos i vídeos. Però, on les tenim? Qui controla aquesta informació tan etèria que va i ve per la xarxa? Podem estar segurs que ningú farà servir fotos nostres sense el nostre permís? Podem trobar una foto determinada que vam fer fa set anys? Fem còpies de seguretat (en dispositius privats nostres) o còpies en paper de tot el que deixem al “núvol”? Tenim una immensa capacitat de compartir informació visual, però sembla que només ens importi el present. I el més probable és que, d’aquí a 20 anys, quasi totes les fotos i vídeos actuals hagin desaparegut. No sé què feu vosaltres, però a mi m’agrada regirar capses i trobar fotos i cartes dels meus avis. Podran fer el mateix, els nostres néts i besnéts? La informació que ens enviem i compartim és volàtil com els núvols. Si limitem el temps que dediquem a la immediatesa de la comunicació i no estem sempre connectats, si trobem temps per gaudir de les fotos que hem fet i de les que ens han enviat, si podem veure-les amb la mirada de l’assossec, segurament descobrirem que algunes d’elles han de ser mimades, recordades i conservades, perquè són part del que ens queda d’aquells que estimem o hem estimat. Aturem-nos, limitem el nostre constant neguit, escollim, evoquem, gaudim, i conservem.

Per cert, la Marxa per la Ciència és una iniciativa que va començar als Estats Units però que ara ja aplega més de 500 ciutats de tot el planeta i compta, a més, amb el suport de més de 220 organitzacions científiques oficials. El comunicat diu textualment que són molts el que veuen que cal fer un pas més i exigir que les polítiques públiques no estiguin en mans d’indocumentats que menyspreen el coneixement i es guien per prejudicis, interessos espuris o dogmes religiosos.

Evolució i robustesa

divendres, 21/04/2017

Robustesa, en informàtica, és sinònim de tolerància als problemes i als errors. Un sistema  o algorisme robust ha de poder seguir treballant en condicions satisfactòries en presència d’errades. No importa que aquestes siguin degudes a un mal-funcionament del hardware o a que la persona que està entrant les dades s’hagi equivocat. El sistema, si no pot seguir endavant, ha d’avisar i demanar, per exemple, que hem de tornar a entrar part de les dades; però no es pot col·lapsar. Algun dia, quan els nostres ordinadors arribin de veritat a l’edat adulta de la robustesa, ja no farem els ben coneguts acudits informàtics que parlen d’apagar i tornar a engegar.

Però no cal fixar-nos en els algorismes, perquè la gran mestra en robustesa és la natura. Ho han vist, per exemple, un grup d’investigadors d’Alemanya, Mèxic, Anglaterra i la Xina, que han investigat els peixos de tipus poecílid a les aigües sulfuroses del riu El Azufre, a Tapijulapa (Mèxic). Aquest riu, que podeu veure a la imatge de dalt (imatge que he obtingut d’aquesta pàgina web) és d’aigua tòxica, amb una concentració de sulfur d’hidrogen (també anomenat àcid sulfhídric) que fa impossible la vida de quasi tots els vertebrats. Aquest grup de científics ha publicat un treball que podeu trobar aquí, on analitzen l’evolució d’aquesta família de peixos. Rüdiger Riesch i Martin Plath, que també en parlen a un article a la revista Scientific American, expliquen que van trobar diversos tipus de peixos de la mateixa família, tots ells descendents d’antics poecílids que vivien en aigües clares i netes. Aquests diferents grups de peixos han anat evolucionant de manera independent a partir d’un avantpassat comú que va existir fa uns 600 mil anys, perquè s’han hagut d’anat adaptant a viure en entorns tòxics incomunicats i separats bastants quilòmetres l’un de l’altre. En total, han estat analitzant vuit grups diferents de peixos poecílids, tots ells lleugerament diferents i que viuen en diferents paratges. D’aquests vuit grups, quatre viuen en aigües clares i quatre es troben en entorns molt tòxics amb àcid sulfhídric. Aquests darrers, encara que han hagut d’evolucionar de manera independent, tenen unes característiques anatòmiques i metabòliques molt similars, amb boques i caps més grans, que els ajuden a viure en condicions inhòspites. Ara bé, el sorprenent és que, tot i que són prou semblants (ho podeu veure en aquesta foto, que també és del Scientífic American), tenen genomes molt i molt diferents: els canvis genòmics en un determinat grup, molt importants i distribuïts per tot l’ADN, tendeixen a ser únics per aquest grup i a no ser compartits pels altres grups. En canvi, el resultat, en termes de camins metabòlics (el conjunt de reaccions químiques que fan possible la vida), és el mateix en tots ells. En altres paraules: els camins evolutius, independents, han estat diferents, però el resultat és molt semblant perquè és el que acaba possibilitant l’adaptació a entorns agressius. Calia adaptar-se, i ho van fer, d’una o altra manera. És la robustesa de l’evolució: encara que hi ha molts camins, veiem resultats similars perquè els que no es van adaptar, ja no hi són. Els autors diuen a més que els seus resultats corroboren les hipòtesis de Jay Gould en el sentit que l’evolució és sovint el resultat irrepetible d’esdeveniments estocàstics que tenen efectes altament contingents, però que acaben adaptant-se a l’entorn gràcies a la selecció natural.

I no només els peixos. Els diferents grups d’humans, com explica en D.T. Max en un recent article a la revista National Geographic, hem anat evolucionant de manera independent per adaptar-nos al medi, amb solucions ben satisfactòries en tots els casos. Els inuit tenen gens que els permeten metabolitzar el greix de les balenes, i els japonesos, uns altres per digerir les algues marines. Les civilitzacions ramaderes són més tolerants a la lactosa, mentre que la pell dels africans els protegeix de les radiacions ultraviolades. Solucions ben diferents, totes robustes, que ens adapten a tots els indrets de la Terra. Som molt iguals i ben diferents…

De fet, la ciència mateixa, amb el rigor en els experiments i amb els seus mecanismes de revisió anònima dels resultats abans de publicar-se, treballa de manera semblant i intenta maximitzar la seva robustesa. Molts dirigents, però, la ignoren. Prefereixen crear mons paral·lels i realitats alternatives, objectivament falses però que són útils per als seus interessos. Per això, molts científics han dit que ja n’hi ha prou i organitzen, demà, la marxa per la ciència. Els convocants diuen que la ciència, els científics i la política basada en l’evidència científica estan sent atacades, i que les retallades, la censura, la desaparició de les dades i les amenaces de desmantellar les agències governamentals ens amenacen a tots i posen en risc la salut, el menjar, l’aire, l’aigua, el clima i fins i tot el treball. No som en un moment fàcil, però som coherents amb l’actitud de tolerància als problemes, i pensem que ens en sortirem.

———

Per cert, en John Carlin diu que en castellà no existeix cap traducció de la paraula anglesa “compromise”, concepte que vol dir que tots dos costats cedeixen en una negociació per tal que tots surtin guanyant. Parla també de Jonathan Powell, que comenta que a més, hi ha una paraula nostra que tampoc té traducció a l’anglès: “crispació”. Perquè l’esport espanyol preferit, diu Carlin, és la indignació, que concedeix una rica sensació de superioritat moral sobre l’altre.

L’accessibilitat nocturna

dijous, 23/03/2017

Un comentari recent sobre per a qui és la tecnologia i sobre l’enllumenat nocturn als carrers dels nostres pobles i ciutats, que podeu veure aquí al costat, és realment encertat. He de reconèixer que vaig fer una interpretació parcial del mapa fotogràfic nocturn del nostre planeta. És cert que Àfrica és a les fosques, però també és evident que l’enllumenat públic als països del primer món és desmesurat. M’agrada la reflexió sobre si de veritat cal que, en sortir al carrer a la nit, poguem llegir el diari mentre caminem. Per què hem de gastar tanta energia?

Si ens pregunten el per què de l’enllumenat públic a la nit, segurament la nostra resposta inclourà diverses consideracions sobre la qualitat de vida, l’accessibilitat i la seguretat. Al segle XX ningú va qüestionar aquest enllumenat elèctric i la progressiva substitució dels fanals de gas: era un signe de progrès i de millora de la qualitat de vida. En no massa dècades vam passar de les torxes al gas i després a la llum elèctrica incandescent, neta i eficient. Podíem anar a casa de nit sentint-nos segurs, i podíem, si calia, anar tranquils a la farmàcia, al teatre o a una cita per conversar amb amics. L’enllumenat ens ho va fer tot més accessible.

Fa pocs mesos vaig assistir a una conferència d’en Kim Brostrøm sobre el Laboratori DOLL de Dinamarca. Es tracta d’un experiment realment interessant, a 15 minuts de Copenhaguen. DOLL és un veritable laboratori vivent, un barri de més d’un quilòmetre quadrat amb 12 quilòmetres de carrers i carrils bici, on hi viu gent normal. La diferència és que el barri accepta que s’hi facin experiments per comprovar la viabilitat de sistemes de gestió urbana basats en les noves tecnologies tot avaluant-los en base a les necessitats reals de la gent. Podeu llegir-ne més detalls a la seva pàgina web. Pel que fa a l’enllumenat nocturn, els responsables del laboratori DOLL creuen que és realment urgent trobar noves solucions i ho justifiquen perquè les llums del carrer consumeixen 350 Giga Watts hora cada any, només a Dinamarca. La solució que estan experimentant es basa en fanals amb llums LED que, a partir d’una certa hora (mitjanit, per exemple), baixen dràsticament la intensitat lumínica fins a un 10% o 20% de l’actual. El truc és que el sistema inclou una xarxa de sensors i un bon sistema de detecció que sap diferenciar persones i vehicles, a la vegada que no fa cas de petits objectes i animals en moviment (gats i gossos, per exemple). Quan algú entra en una determinada àrea específica, la il·luminació s’incrementa fins un nivell semblant al de la intensitat que ara tenim, però només a la zona on s’està passant. Hi ha llum on cal, i no n’hi ha on no és necessària. Tot i que pot semblar que la foscor redueix la seguretat, el que passa és justament el contrari perquè l’enllumenat s’activa automàticament sempre que algú entra de nit a la zona. Podem sortir de casa a la nit, podem anar on ens calgui sense ensopegar i fins i tot llegint el diari, i ho podem fer amb seguretat i sense desaprofitar energia. És la nova accessibilitat nocturna.

Ara fa uns quants segles, abans de la revolució industrial, viure millor era tenir més. Més terres, més or i metalls preciosos, més cases i animals. Després, i sobretot al segle XX, el progrès i la qualitat de vida van quedar associats a l’accés a l’energia. Una energia que feia possible la climatització, el transport, l’aprofitament de les hores nocturnes. El repte actual, en canvi, és el de l’accés sostenible als serveis. Perquè, un cop satisfetes les necessitats bàsiques, podem bàsicament associar qualitat de vida a facilitat d’ús dels serveis. I ara, les noves tecnologies, amb el gran ventall que inclou dels sensors a les telecomunicacions passant pels models, els algorismes i els sistemes de control, ens poden permetre el que abans era impossible: accedir a més serveis, accedir-hi millor, amb menys despesa energètica i arribant al màxim d’habitants del planeta. Tant de bo que acabem associant viure millor amb accedir, amb baix consum energètic, al que ens cal i al que ens fa feliços. A la farmàcia i a la conversa amb amics. De dia i de nit.

(La imatge de dalt, del barri del laboratori DOLL, és d’aquesta pàgina web).

Per cert, en Xavier Antich diu que donar temps a algú altre és potser la forma suprema de generositat. I diu que el temps sobretot es dona durant l’espai compartit de la conversa, perquè és el temps de l’escolta, de l’atenció, de l’entrega.

Els algorismes que aprenen

dijous, 9/02/2017

Hi ha paraules boniques que també ens fan una mica de por. Poca gent sap que la seva vida és plena d’algorismes. Alguns, quan se’n adonen, no saben si ho han d’acceptar o s’han de posar nerviosos. I el cert és que, tot i que no els reconeguem i que pensem que no ens afecten, els portem sempre al nostre costat.

Un algorisme no és més que un conjunt ordenat, finit i no ambigu de regles i operacions que permeten resoldre un problema o realitzar una determinada activitat. Els algorismes són descripcions precises de processos que fem o que fan els altres. Les instruccions per muntar un moble a partir d’un kit de peces o el full on expliquem com posar en marxa la calefacció quan marxem de casa i han de venir uns amics, són algorismes. Les receptes de cuina i les partitures musicals són algorismes per preparar menjars i interpretar melodies. I ho són les instruccions de qualsevol joc, els manuals d’usuari i els protocols que segueixen els metges als hospitals. Algunes vegades, els algorismes els podem escriure per a nosaltres mateixos, quan acabem de descobrir alguna cosa complexa que ens ha estat útil (per exemple en el nostre mòbil), i volem no oblidar-la. En altres ocasions, les escrivim per a que algú altre pugui fer més endavant quelcom que nosaltres ja sabem fer. És per això que el conjunt de regles d’un algorisme ha de ser no ambigu: si no l’escrivim bé, la persona que vingui a casa no entendrà com engegar el rentaplats o com posar en marxa la calefacció.

Espero no guanyar-me el mot de “friqui” si confesso que m’agrada la paraula “algorisme”. Tal vegada perquè ha estat al meu costat durant quasi cinquanta anys, i perquè ve de molt lluny. Concretament d’ara fa 1.150 anys, quan al-Khwarazmí treballava a l’observatori de Bagdad. Durant els segles de l’edat mitjana, al-Khwarazmí va ser la principal font de transmissió de coneixements matemàtics de l’Orient a l’Occident, en part en base a les traduccions de textos en grec, llatí i sànscrit que es feien a la Casa de la Saviesa. En el seu tractat d’àlgebra, “Hissab al-jabr wa-l-muqàbala“, explicava regles i receptes (o sigui, algorismes) per repartir herències, cosa que en aquell temps i en el món àrab era molt complicada i requeria fer molts càlculs. En un altre llibre, “Sobre el càlcul amb nombres indis”, llibre del que només se’n conserva una traducció del segle XII, al-Khwarazmí va explicar, sembla que per primera vegada, el sistema de numeració posicional en base 10 (incloent el zero) que va aprendre de l’Índia i que és el que ara utilitzem. Fa més de 11 segles, al-Khwarazmí ens va deixar llibres meravellosos, tots plens d’algorismes. És per això que els algorismes porten el seu nom.

Quan sumem nombres portant-ne, estem aplicant l’algorisme que vam aprendre a l’escola; i, quan multipliquem, també. Euclides ens va deixar un algorisme molt elegant per calcular el màxim comú denominador de dos nombres, i Pitàgores ens va explicar l’algorisme per calcular hipotenuses i distàncies entre punts. Després, amb els ordinadors, hem acabat tenint algorismes per tot. Perquè els ordinadors i els telèfons mòbils només funcionen en base als algorismes que alguns programadors els han preparat. Totes les aplicacions que ens hem baixat als nostres mòbils són algorismes. Tenim algorismes per millorar fotos, per cercar informació a internet, per saber la posició dels astres i per preveure el temps que farà demà. Tenim algorismes que ens troben el nom de les músiques que escoltem, i algorismes que saben traduir textos d’un idioma a un altre.

I ara, el que hem començat a veure fa pocs anys són algorismes que es van refinant amb les dades. Són algorismes que aprenen, algorismes que conformen els mecanismes d’aprenentatge automàtic que es troben en el nucli de l’anomenat “big data“. Hi ha moltíssims exemples, un dels quals, molt il·lustratiu, el teniu en aquest document (que és un pòster científic presentat ara fa uns mesos; com podeu observar, la imatge de dalt és d’aquest mateix document). Es tracta d’un algorisme que, a partir d’una gravació de vídeo de 15 segons en la que s’ens demana que expliquem qui som, fa una valoració de la nostra personalitat en cinc eixos diferents, i ens ho mostra amb 5 bandes verdes (les que veieu a la dreta de la imatge) al cap de menys de tres segons. Aquests cinc eixos són els de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Com ho fa? Doncs amb un algorisme que conté dues xarxes neuronals de 17 nivells, una per la senyal de vídeo i l’altra per la d’àudio, amb un darrer nivell de fusió de les dues, com bé podeu veure a la figure 3 del document. Cada un dels 17 nivells d’una i altra xarxa combina adequadament els resultats del nivell anterior i genera una sortida que transmet a algun o alguns dels nivells següents. Cada nivell és com una taula de mescles de so, però digital. Barreja les entrades per tal de produir el senyal de sortida. En resum, fem 17+17+1 mescles, i acabem trobant els trets de personalitat de la persona que ha estat parlant durant 15 segons al vídeo. Però, com fem aquestes mescles? Com ajustem la importància que donarem a cada un dels valors d’entrada a cada una de les mescles? Com ajustem el valor de cada un dels “potenciòmetres” de la nostra xarxa neuronal?. En el cas de l’article que comento, això es va fer amb un sistema d’aprenentatge dirigit. Amb anterioritat als experiments, els autors, amb l’ajut de molts voluntaris, van analitzar deu mil vídeos de 15 segons de YouTube. Cada voluntari, a cada prova, presenciava una parella de vídeos (corresponents a dues persones) i després havia de dir quina de les dues persones creia que era la més curiosa, quina la més extravertida, .. i així fins analitzar el cinquè eix de neuroticisme. Cal observar que no es demanava cap valoració, únicament havien de comparar la parella de persones que estaven veient. Això es va fer així perquè és ben conegut que les comparacions les fem molt millor que les valoracions. Doncs bé, la informació d’aquests experiments amb 10.000 vídeos és la que va permetre ensinistrar els  mescladors dels 17+17+1 nivells de l’algorisme i ajustar els seus valors. Però això no va acabar aquí. L’interessant és que l’algorisme va continuar i continua aprenent, perquè quan el sistema ja estava ajustat i “trained” (mireu la imatge de dalt), l’anàlisi del vídeo de cada nova persona que vol experimentar aquesta aplicació i que dona la corresponent autorització per usar les seves dades, serveix per acabar d’ajustar una mica més els paràmetres de tots els nivells de la xarxa neuronal. El sistema va aprenent cada dia, i cada persona que l’utilitza l’ajuda a fer-ho. Només cal que digui si creu que el resultat que li mostra la màquina reflexa la seva personalitat o no, perquè això és l’únic que necessita la xarxa neuronal per auto-refinar-se.

Per bé o per mal (esperem que per bé), els algorismes que aprenen han arribat, i han vingut per quedar-se amb nosaltres. Ens poden ser molt útils, però no hem de perdre mai de vista la necessitat de la seva regulació ni els aspectes ètics. Els algorismes són aquí, però la responsabilitat sempre serà de les persones que els utilitzen.

Per cert, en Christophe Galfard diu que sense una visió científica, la democràcia es torna més complicada. També diu que la humanitat no és conscient del seu lloc a l’Univers, que només ara ho estem començant a entreveure.

El rellotge dels 10.000 anys

dijous, 5/01/2017

Els acords de llarga durada són sans i desitjables. Però segurament hi ha moltes més coses que podríem fer amb visió serena i a llarg termini. Sense anar més lluny, la Fundació “Long Now es proposa fomentar el pensament a llarg termini en el context dels propers 100 segles. El seu objectiu és oferir un contrapunt a la visió actual de “més ràpid i més barat”, en base a fomentar la responsabilitat i promoure el pensament “més lent i millor”. En el context d’aquest pensament a llarg termini, la Fundació utilitza dates de 5 dígits i diu que som a l’any 02017, per exemple.

L’inventor d’aquest rellotge dels cent segles, que és també un dels fundadors de Long Now, és en Danny Hillis. En Danny va presentar les seves idees ja fa més de vint anys, l’any 01995. En una declaració òbviament optimista deia que, tenint en compte que l’edat de la nostra civilització és de deu mil anys, aquest rellotge suposa el repte de no extingir-nos durant uns altres 10.000 anys, durant els quals caldrà que els nostres descendents sàpiguen tenir cura d’ells mateixos i del rellotge.

El rellotge està dissenyat amb materials resistents i estables que inclouen el titani a més del quars, boles de ceràmica per als coixinets i acer inoxidable marí amb un alt percentatge de molibdè. Es muntarà en un pou artificial vertical de 150 metres que està sent excavat en una muntanya de l’estat de Texas. És un rellotge clàssic, mecànic, però molt sofisticat. El seu pèndol de titani, amb un període de 10 segons, oscil·larà lentament impulsat per un típic mecanisme d’escapament i amb l’energia subministrada per un gran pes de pedra. Els dissenyadors han fet ja un prototip a escala reduïda, que es pot veure al museu de la ciència de Londres. El teniu a la imatge de dalt, que he obtingut d’aquest pdf. Però, qui i com donarà corda al rellotge? La resposta és que l’energia que necessita per funcionar la obtindrà en part dels visitants i en part del Sol. Els que vulguin visitar el rellotge es trobaran amb un molinet horitzontal, com el de l’àncora d’un vaixell però més gran. Com podeu veure al vídeo d’aquesta web, el gir del molinet farà girar el cabrestant del rellotge i aixecarà els pesos de pedra. Això sí, caldrà la força de dos o tres visitants. Quan no hi hagi visitants, el rellotge obtindrà l’energia a partir de les diferències de temperatura entre dia i nit. La llum solar entrarà per una finestra de safir orientada cap al sud situada dalt de la muntanya, i escalfarà una càmera d’aire que acabarà fent girar un cilindre de grafit. Aquest sistema subministrarà energia suficient per mantenir el pèndol en moviment, i a més servirà per corregir l’hora del rellotge a partir de la posició del Sol al migdia. Trobareu més detalls en aquest article científic. Tot està pensat per a que el rellotge pugui funcionar durant anys sense cap visitant i fins i tot sense llum solar. Si alguna erupció volcànica acabés amagant el Sol durant mesos o anys, la variació de temperatura entre dia i nit seria suficient per mantenir-lo en moviment.

Els visitants entraran a la gran cambra del rellotge, foradada a la muntanya, i hauran de començar a pujar. Després de passar els pesos de pedra, arribaran al molinet horitzontal per donar-li corda. A continuació, veuran 20 enormes rodes horitzontals amb enginyosos mecanismes de creu de Malta, que calcularan i tocaran més de 3,5 milions de melodies, totes diferents, al llarg dels segles. Una cada dia, al migdia, però només els dies que hi hagi visitants (perquè les campanes necessiten l’energia del molinet; el pèndol en té prou amb l’energia dels canvis tèrmics entre dia i nit, però no el mecanisme de tocar les campanes). Les campanades mai es repetiran, de manera que l’experiència de cada visitant serà única. El rellotge “calcularà” les melodies amb aquest sistema mecànic de ranures i passadors lliscants. De manera similar a la màquina diferencial de Babbage, generarà cada dia una seqüència diferent per a les deu campanes. Tot sense electricitat i sense energia externa. En Danny Hillis diu, ben cofoi, que aquest rellotge serà l’ordinador més lent del món. Mireu l’animació de les creus de Malta d’aquesta pàgina web. Oi que té el seu encant?

El rellotge també incorpora un sofisticat sistema per posar-se en hora automàticament, i treballa amb 5 temps diferents. El temps del pèndol és el que surt de comptar les seves oscil·lacions, i avança un pas cada 5 minuts (30 oscil·lacions de pèndol). El temps solar sense corregir es trobarà moodificant el temps del pèndol en base a l’equació del temps, mentre que el temps solar corregit tindrà en compte la posició del Sol al migdia. Aquest temps només es podrà obtenir els dies solejats; els altres dies, el sistema anirà emmagatzemant les correccions pendents, que seran recuperades i aplicades quan torni a sortir el Sol. Després tenim el temps solar mostrat, que només s’activarà i calcularà quan hi hagi visitants que donin corda al rellotge fent girar el seu molinet. Aquest temps solar mostrat inclou un calendari Gregorià que indicarà la data de la visita. Finalment, el temps planetari incorporarà una correcció per tenir en compte la reducció de la velocitat de rotació de la Terra, i ho farà amb una lleva que representarà i codificarà la funció quadràtica de correcció en la seva pròpia forma. El temps planetari és el que permetrà la visualització, cada cop que algú entri a mirar-ho, de la posició de tots els astres del sistema solar en aquell moment.

M’agrada aquesta idea del pensament a llarg termini, del pensament “lent i millor” que promou la Fundació Long Now. El fet de construir objectes i ginys de llarga durada és tot un repte, pels que els construeixen i per tots aquells que s’hauran de plantejar si en tenen cura o es fan responsables, davant els seus descendents, de la seva destrucció. Jo diria que ja ara tenim dos mons que conviuen. El món frenètic de la immediatesa, de la velocitat i de fer el màxim de coses en poc temps, i el món tranquil del pensament assossegat i creatiu. Són dues maneres de gestionar el temps. Dia a dia ens toca escollir quina adoptem. Però hem de ser ben conscients d’una cosa: la creativitat està renyida amb les presses i amb la visió a curt termini, perquè és ben conegut que les idees ens venen quan pensem lentament i sense angoixa. És el que ens expliquen els membres de la fundació Long Now. Aquest telèfon mòbil que portem a la butxaca i amb el que enviem centenars de missatges ràpids cada dia, existeix perquè moltes persones van estar pensant i donant voltes durant hores i hores, capficats en infinits problemes científics i tecnològics que ja no valorem. Van tenir temps, van tenir idees, van ser creatius, i ara en gaudim. Per això és bonic que, davant un món que pensa bàsicament en comprar, vendre, especular i enriquir-se el més ràpid possible, els responsables del projecte del rellotge dels deu mil anys ens expliquin que no tenen cap pressa: l’estan pensant pels nostres néts i pels besnéts dels nostres besnéts.

Per cert, en aquest context de treball tranquil i de llarga durada, els responsables de la construcció del rellotge diuen que no tenen cap data de finalització prevista. Pensen obrir al públic el seu rellotge dels cent segles una vegada estigui llest i acabat.

Einstein i les cinc cases

divendres, 23/12/2016

Fa poc, una amiga em parlava de l’endevinalla d’Einstein. Bé, de fet no és clar que fos proposada per Einstein, però val a dir que és interessant. Alguns suggereixen que Einstein la va inventar no pas com a test d’intel·ligència, sinó per desfer-se de la majoria d’estudiants que li demanaven que els dirigís la tesi doctoral. Una altra cosa que es diu és que Einstein afirmava que el 98% de les persones serien incapaces de resoldre-la.

Aquesta és l’endevinalla: En un carrer hi ha cinc cases de colors diferents i en cada una hi viu una persona de nacionalitat diferent. Els cinc amos beuen tipus de begudes diferents, fumen marques de tabac diferents i cada un té un animal de companyia diferent al dels altres (per cert, la imatge de dalt la podeu trobar a aquesta pàgina web). El que sabem és això:
1. El britànic viu a la casa vermella.
2. El suec té un gos d’animal de companyia.
3. El danès beu te.
4. El noruec viu a la primera casa.
5. L’alemany fuma Prince.
6. La casa verda és immediatament a l’esquerra de la blanca.
7. El propietari de la casa verda beu cafè.
8. El propietari que fuma Pall Mall cria ocells.
9. El propietari de la casa groga fuma Dunhill.
10. L’home que viu a la casa del centre beu llet.
11. L’home que fuma Blends viu al costat del que té un gat.
12. L’home que té un cavall viu al costat del que fuma Dunhill.
13. L’home que fuma Bluemaster beu cervesa.
14. L’home que fuma Blends viu al costat del que beu aigua.
15. El noruec viu al costat de la casa blava.

I la pregunta és: qui és que té un peix com animal de companyia?

L’endevinalla és un bon exercici de combinatòria i una bona mostra de l’ús de tècniques algorísmiques per resoldre problemes amb l’ajut dels ordinadors. Analitzem el que ens diuen. En primer lloc, és fàcil veure que dins d’aquestes 15 pistes trobem el color de totes les cases (blanc, groc, verd, vermell i blau), la nacionalitat de tots els seus habitants (britànic, suec, danès, noruec i alemany), les seves begudes (te, cafè, llet, cervesa i aigua), el seu tabac (Prince, Pall Mall, Dunhill, Bluemaster i Blends) i el seu animal de companyia (gos, ocells, gat, cavall i peix). El que hem de fer és posar en ordre totes aquestes informacions de manera que quedin relacionades segons les pistes que ens donen. A més, també hem de trobar en quin ordre tenim les cases, perquè algunes preguntes (com la 6) justament ens parlen de relacions de veïnatge.

Quantes possibles solucions tindríem si no ens donessin cap pista? Suposem que numerem les cases al llarg del carrer, de la 1 a la 5. Podem assignar nacionalitats dels habitants a cada una de les 5 cases de 120 maneres diferents, perquè el nombre de permutacions de 5 elements és 120. Ara bé, també tenim 120 maneres d’assignar color a les cases, 120 maneres d’assignar begudes als habitants de cada casa, 120 maneres d’assignar-los tabac i 120 d’assignar els animals de companyia. En total, el nombre de possibilitats és 120 multiplicat per sí mateix 5 vegades, o sigui 120 a la cinquena potència. En altres paraules: si volem anar provant fins encertar-la, hem de saber que el nombre total de casos possibles que haurem d’analitzar és de més de vint-i-vuit mil milions.

Per resoldre el problema de manera més eficient, és molt útil tenir una bona representació de la solució. En el nostre cas, pot ser una taula de doble entrada amb 5 files i 5 columnes. A cada una de les files tenim la informació de una de les cases (ordenada de manera que tenim la primera casa del carrer a la primera fila i la darrera a la fila 5), i, a cada una de les columnes, informació sobre el color de la casa, la nacionalitat de la persona que hi viu, la seva beguda, la seva marca de tabac i el seu animal de companyia. També es bo analitzar i classificar les pistes per veure quines d’elles són més informatives. N’hi de tres tipus. La 4 i la 10 són pistes estàtiques que ens permeten posar informació ja definitiva a la taula: la nacionalitat de la fila 1 és noruega, i la beguda de la fila 3 és llet. En un segon grup, tenim vuit pistes (les 1, 2, 3, 5, 7, 8, 9 i 13) que ens informen de relacions binàries entre dos elements de la mateixa fila de la taula (vegeu nota al final). Finalment, les 5 pistes restants (6, 11, 12, 14 i 15) són relacions de veïnatge entre cases de files contigües. L’interessant de tot plegat és que, amb les dues pistes estàtiques, les vuit binàries i dues de les de veïnatge podem reduir dràsticament l’espai de cerca i passar de les més de vint-i-vuit mil milions de possibilitats a 288, tot convertint un problema intractable en un altre de fàcil solució.

Ara ja podem continuar amb raonaments basats en les relacions de veïnatge. Podeu trobar la solució completa del problema a moltes pàgines web, si us canseu de fer proves. Fins i tot teniu vídeos, com aquest, que ens mostren la solució (l’amo del peixet és l’alemany) i una estratègia de prova i error per trobar-la. En tot cas, el bonic de veure és que, amb no massa feina, hem passar d’haver de tractar aquests vint-i-vuit mil milions de casos a uns quants centenars. I això és justament el que fem quan pensem algorismes per resoldre problemes amb ordinador: a l’oceà de possibles solucions, intentem descartar, amb el mínim esforç, camins que sabem que no ens portaran enlloc. És una manera de podar l’arbre de solucions possibles fins que el nombre d’alternatives sigui tractable. Llavors, podem continuar podant o podem simplement provar, per cada una de les opcions candidates que ens han quedat, si satisfan la resta de pistes o restriccions del problema (que en el nostre cas són les cinc de veïnatge).

———

Per cert, en Bru Rovira diu que els mateixos que ploraven  al Parlament Europeu durant l’acte d’entrega del premi Sàkharov a la llibertat d’esperit a la Nadia Murad i la Lamia Haji Bachar, van decidir la setmana passada que la UE podrà reenviar a Grècia, a partir del mes de març, els demandants d’asil que hagin entrat per aquest país.

———

NOTA: les vuit pistes (1, 2, 3, 5, 7, 8, 9 i 13) que codifiquen relacions binàries les podem expressar de manera compacte si anomenem les cinc files de la taula com C, N, B, T i A (color, nacionalitat, beguda, tabac i animal, respectivament. Direm que la pista 1 és N-C perquè ens relaciona la nacionalitat amb el color de la casa. De la mateixa manera, la pista 2 és N-A, i les altres sis relacions binàries són N-B, N-T, C-B, T-A, C-T i T-B. Són relacions que connecten elements d’una mateixa fila de la taula. Tenim quatre relacions N-x, mentre que el nombre de relacions que afecten altres columnes de la taula és menor. I ja sabem que el noruec viu a la casa 1, que la beguda de qui viu a la casa 3 és llet i que el color de la casa 2 és blau (pista 15). Veiem a més (per la relació N-C) que el britànic només pot viure a la casa 3 o a la casa 5 (no pot viure a la casa 1 perquè hi viu el noruec, ni a la casa 2 perquè és blava, ni a la casa 4 perquè en aquest cas, no tindriem cap parella de cases contigües que poguèssin ser verda i blanca, com requereix la pista 6). Tenim per tant dues possibilitats. Si el britànic viu a la casa 3, ja sabem tots els colors de les cases: la casa 2 ha de ser blava, la 3 ha de ser vermella, la 4 verda i la 5 blanca, i per tant, la casa 1 ha ser ser la groga). I en el cas que el britànic visqui a la casa 5, la casa 2 ha de ser blava, la 5 ha de ser vermella, la 3 verda i la 4 blanca, mentre que la casa 1 ha ser ser també la groga. En cada un dels dos casos, podem provar totes les possibilitats de la columna N, que ara són 6 (és el factorial de 3 i no de 5 perquè ja sabem que el noruec viu a la primera casa i que el britànic viu a la 3 o a la 5 segons el cas). Per cada una d’aquestes 6 possibilitats, les dues primeres columnes de la taula, C i N, ens queden ja determinades, així com un animal, dues begudes i dos tabacs (per les relacions N-A, N-B, N-T, C-B i C-T). Un cop fet això, la columna més determinada passa a ser la de la beguda, perquè sabem que la de la casa tercera és llet i en sabem dues més per les relacions N-B i C-B. Per tant, a la columna de la beguda tenim 2 possibilitats (factorial de 2), i encara hem d’usar les relacions N-T, T-A, C-T i T-B. Passem ara a treballar amb la columna del tabac, que és la que surt a les relacions N-T, T-B i C-T. Un cop més tenim 2 possibilitats (factorial de 2) pel fet de tenir 3 relacions.  Finalment, a la columna dels animals, les relacions N-A i T-A ens redueixen les possibilitats a 6 (factorial de 3). En resum: utilitzant la informació de les dues pistes estàtiques, de les vuit pistes binàries i de dues de les pistes de veïnatge (la 6 i la 15), veiem que només hem de provar 2*6*2*2*6 possibilitats (2 possibilitats de casa pel britànic, 6 per la resta de nacionalitats, 2 per la beguda, 2 pel tabac i 6 per l’animal). El total és 2*6*2*2*6 = 288. Estem parlant de menys de 300 possibilitats que haurem de provar ara en relació a les 3 pistes de veïnatge que encara no hem considerat.

Les intel·ligències

dijous, 15/12/2016

Sempre m’he preguntat per què tenim aquesta barreja de por i admiració davant d’un hipotètic futur amb màquines i ginys intel·ligents. La fascinació del que podrà arribar a passar s’ajunta amb el temor a ser controlats, i tot plegat acaba en una mescla ben estranya. Per què ens atrau tant la fantasia tecnològica, i per què ens fa por?

Moltes vegades, les fantasies i les pors deixen de ser-ho quan llegim, esbrinem i escoltem els qui han estudiat i treballat el tema, perquè ens fan tocar de peus a terra. Per això, recullo la opinió i el testimoni de tres persones expertes en intel·ligència artificial i robòtica que es preocupen pels aspectes ètics, que parlen clar, i que crec que deixen les coses al seu lloc. En tots tres casos es tracta d’entrevistes fetes aquest any 2016. Ens parlen del frau inherent a moltes aplicacions comercials d’intel·ligència artificial (Roger Schank), de la gran exageració que hi ha en molt del que es diu sota l’epígraf de “transhumanisme” (Ramon López de Mántaras) o de la necessitat d’una visió ètica de la tecnologia (Carme Torras).

Pel que fa a la tecnologia, la Carme Torras és realista. Diu que la curiositat humana és imparable, i que si alguna cosa es pot inventar, s’acabarà fent. Això no obstant, el que cal és estar sempre ben segurs que el que fem va en la línia dels nostres objectius. I aquí és on apareix l’ètica. La Carme deixa clar que ella intenta orientar la tecnologia cap on èticament sembla que és un bon camí, en comptes de deixar-la en mans d’interessos comercials.

Es parla massa de sistemes, objectes i ciutats intel·ligents, i se’n parla per raons comercials, perquè això acaba donant diners a algú. Roger Schank diu directament que totes les empreses que s’omplen la boca venent intel·ligència artificial són un frau, i que el més gran mentider és IBM, que no fa res més que mentir. Quasi res.

En Ramon Lopez de Mantaras també desmitifica la intel·ligència artificial des del seu profund coneixement. Diu que la intel·ligència no és només memòria i capacitat de càlcul, i que fins i tot els sistemes de reconeixement d’objectes cometen errors garrafals. Posa com exemple els errors de Google Translator en les traduccions. Explica que tot plegat és perquè a les màquines els falta sentit comú: No saben resoldre ambigüitats i el món n’està ple. En definitiva, no tenen el que s’anomena comprensió profunda. En aquest sentit, la Carme Torras ens recorda que la intel·ligència no és només la del coeficient intel·lectual, sinó que inclou l’emocional, l’afectiva, la relacional i moltes altres.

Podem estar tranquils. En Roger Schank diu que podem fer moltes coses, però que fins que un ordinador no sigui capaç d’entendre els objectius d’una persona humana no hi podrà interactuar i aprendre d’ella, perquè la ment humana funciona per objectius.

Però hem de vigilar. La Carme Torras ens explica que hem d’estar molt atents a les suposades veritats que ens arriben i que sempre les hem d’analitzar críticament. Perquè a la llarga només ens arribaran noticies que se suposa que ens interessen, amb una preselecció que hauran fet certes màquines en base a informació anterior que hauran recollit sobre el que fem i el que ens agrada. Amb tot això, el nostre univers cultural s’anirà reduint. Diu que alguns privilegiats buscaran noves fonts d’informació, però que la majoria es quedarà amb aquest món fet a la seva mida. Serà una fractura digital que anirà augmentant: una nova forma de desigualtat.

I en Ramon Lopez de Mantaras ens explica que el que en realitat ens hauria de preocupar és què fan els robots que analitzen dades. Creu que a les grans empreses els interessa parlar de la singularitat de la intel·ligència artificial per desviar l’atenció del seu autèntic problema, que és la privacitat i l’ús comercial de les nostres dades. En Ramon és totalment contrari a l’ús de la recerca científica amb finalitats militars.

Finalment, la Carme Torras va ser contundent quan li van preguntar si la vida podrà arribar a expressar-se com un algorisme. La seva resposta, “com vols que la posem en un algorisme si ni tan sols sabem què és?”, és un bon resum de la visió científica actual. Per què hem de pensar tota l’estona en el que podran fer les intel·ligències artificials i els sistemes intel·ligents quan no sabem què és la vida, ni què és la intel·ligència, ni tan sols sabem per què dormim?

Si tenim dubtes, el millor és llegir el que diuen els experts. Llegir de diverses fonts, analitzar críticament, arribar a conclusions.

(La imatge de dalt la podreu trobar en aquesta pàgina web)

———

Per cert, la tinent d’alcaldia de Drets Socials, Laia Ortiz, va dir que el recurs de la patronal de les elèctriques (que integra companyies com Endesa, Gas Natural, Iberdrola i EDP) a la multa de l’Ajuntament de Barcelona és una falta de respecte a la llei de pobresa energètica i la ciutadania, que és qui va la impulsar.

Píxels de fa 120 anys

dijous, 1/12/2016

Hi ha idees que són més antigues del que pensem. Fa quasi 120 anys, concretament en un article a la revista “Electrón” escrit l’any 1898, José de Echegaray explicava un sistema per a la transmissió elèctrica d’imatges i moviments que segons deia estava desenvolupant un mestre a Viena. El sistema, certament enginyós, va ser un primer precedent, caigut després en l’oblit, de la televisió i fins i tot de les actuals imatges digitals i dels sistemes de tele-conferència.

José de Echegaray, mort ara fa cent anys, va ser un catedràtic de matemàtiques que va rebre el premi Nobel de literatura l’any 1904. Certament curiós. En això se’l pot comparar a Betrand Russell, l’altre matemàtic que també va obtenir el Nobel de literatura. Echegaray ha estat qüestionat molt sovint com escriptor, però cal reconèixer la seva extraordinària producció com a divulgador de ciència i la tecnologia, a més de la seva tasca com a professor. Echegaray deia que si hagués pogut, enlloc d’escriure drames i teatre, s’hauria dedicat únicament a les matemàtiques. No ho va poder fer perquè, com explicava, “el drama més desgraciat i el crim teatral més modest proporcionen molt més diners que la solució del més alt problema de càlcul integral”

L’article d’Echegaray es basa en les propietats del seleni, que és fotoelèctric. A finals del segle XIX ja era ben sabut que la conductivitat elèctrica del seleni augmenta quan rep la llum. Doncs bé, la idea que exposava Echegaray l’any 1898 (i que podeu veure a l’esquema a la imatge de dalt) es basava en aquesta propietat del seleni i en la idea, molt moderna, de píxel. Echegaray deia: “suposem que construïm una mena de tauler d’escacs amb petits trossets cúbics de seleni, perfectament aïllats i separats els uns dels altres, com un mosaic”. És un tauler de píxels (C a la imatge) que caldrà que col·loquem dins d’una cambra fosca i que rep els raigs de llum (B) que passen pel forat (A) de la cambra. Una munió de cables (I) connecten un dels terminals d’una pila o bateria (P) a tots i cada un dels cubs de seleni. A més, cada un d’aquests cubs està connectat i soldat a un sector circular, de coure, del cercle (E) de transmissió, de manera que el nombre de sectors independents i aïllats del cercle E és igual al nombre de cubs (píxels) del tauler C. Permeteu-me ara que citi textualment Echegaray: “Quan el sistema recull i projecta sobre el tauler (C) qualsevol imatge, el cap d’una dona, per exemple, les petites peces de seleni del encasellat del tauler general rebran diferent quantitat de llum. En plena llum estaran algunes; en plena ombra estaran altres. Moltes només rebran una mitja tinta. I aquestes ombres i aquestes llums formaran, com en la fotografia, per la seva varietat i intensitat: on la resistència és gran, el corrent serà petit; on la resistència sigui petita, arribarà el corrent amb més força. I d’aquesta manera, i amb aquest grapat de conductors, la imatge primitiva s’haurà convertit en una mena d’imatge elèctrica, en què ombres i llums, amb totes les seves gradacions, estaran representades per corrents elèctrics d’intensitat diferent. Serà veritablement una imatge elèctrica, que va caminant per uns filferros. Per uns anirà el cabell amb les seves ondulacions, les seves ombres i les seves llums. Per altres aniran els ulls amb els seus punts brillants i les seves pupil·les blaves o negres. Per altres, els llavis rosats o les suaus galtes. Una imatge dividida en petits trossos, tants com trossos de seleni comprèn el quadre general”. Però la seva idea de la transmissió elèctrica d’imatges no queda aquí, i Echegaray també incorpora el principi de seqüenciació en el temps. Un braç giratori (F), mogut per un motor (G), agafa a cada moment el corrent elèctric d’un dels sectors de coure del cercle de transmissió (E) i l’envia pel cable H1, de manera que entre l’emissor i el receptor de les imatges només cal que tinguem dos cables, els H1 i H2. A cada volta del braç giratori F, el sistema recorre i envia tots els píxels de la imatge projectada sobre C, sabent transmetre imatges en moviment a raó d’un fotograma per volta. Després, en el sistema receptor, un sistema braç-cercle idèntic al E-F envia els senyals elèctrics a un tauler semblant al C però amb petites bombetes enlloc de cubs de seleni. Echegaray fins i tot pensava que es podia arribar a enviar i reproduir imatges en color.

El sistema no es va arribar a fabricar de manera satisfactòria, segurament per la dificultat que hi havia, amb la tecnologia de finals de segle XIX, per sincronitzar els braços giratoris dels sistemes emissor i receptor. Però no podem negar que aquest invent portava ja l’embrió d’unes quantes idees que després van quallar durant el segle XX i que ara ens permeten interactuar a distància amb sistemes com skype, duo-google o hangouts. Moltes idees que ens sembla que són noves, no ho són tant, oi?

———

Per cert, la Rosa Montero cita un estudi que va analitzar més de 43.000 empreses multinacionals i que va posar de manifest que el 80% d’elles estava controlat per només 737 persones. Diu que, com que hi ha menys d’un miler de persones que dominen el món, els polítics haurien d’estar de part nostra, de part de tots els altres ciutadans, per intentar controlar aquests potentats.

L’ull és com una càmera de fotos. O no?

dijous, 22/09/2016

El funcionament de l’ull sembla força senzill i fàcil d’entendre. Permet l’entrada de la llum, enfoca les imatges amb el cristal·lí, i les projecta a les cèl·lules sensibles de la retina. L’anatomia dels ulls dels animals va inspirar el disseny de les càmeres de fotos. En elles, el sistema òptic emula el cristal·lí humà mentre que la pel·lícula sensible de fa uns anys i el sensor de les actuals càmeres digitals fa les funcions de la retina.

Però les coses no són mai tan senzilles com semblen. Des de fa poc (menys de cinc anys) estem descobrint que la retina, aquesta capa de cèl·lules sensibles de no més de mig mil·límetre de gruix, és una immensa caixa de sorpreses. Sabem que conté dos tipus de cèl·lules sensibles a la llum: els bastons, que només detecten claror o foscor i que no distingeixen colors, i els cons, que són sensibles al vermell, verd o blau segons el seu tipus. Tenim, a cada ull, uns 120 milions de bastons i uns 7 milions de cons, aquests darrers més concentrats a la zona foveal, que és la que usem quan volem fixar la vista i veure detalls. Però, sota els cons i bastons tenim, en capes, les cèl·lules bipolars horitzontals, les cèl·lules amacrines i finalment les ganglionars com mostra la imatge de dalt (que he tret d’aquesta pàgina web). Tenim prop d’un milió d’aquestes cèl·lules ganglionars. Ara sabem que al voltant del 80% d’aquestes cèl·lules són de tipus parvo, mentre que el 20% restant creen camins magnocel·lulars. Les parvo processen la informació de més qualitat visual que es forma a la fòvea i tenen una latència (persistència temporal) més gran, mentre que les magno processen sobretot canvis a l’entorn visual, amb molta rapidesa i poca precissió. Tots dos tipus de cèl·lules ganglionars són ja l’inici del nervi òptic i envien informació al cervell. Les cèl·lules magno són detectores: avisen de possibles perills i moviments, de manera que que l’ull, de manera automàtica i instintiva, gira per projectar allò que hem detectat a la zona foveal de la retina per entendre bé el que passa. Però a més, les cèl·lules bipolars, amacrines i ganglionars processen la informació visual de manera molt sofisticada. Podriem dir que la retina digereix la informació visual tot enviant-la de manera molt simplificada al cervell. Des de fa pocs anys, sabem que la retina és un veritable ordinador biològic que aplica algorismes de processament d’imatges a la informació visual que arriba a la retina. L’ull no és com una càmera de fotos. Ara sabem que és càmera i ordinador.

Tot va començar quan es van fabricar els primers implants retinals. Com que tothom pensava que l’ull enviava imatges al cervell, es va començar a provar amb pròtesis retinals semblants als sensors de les càmeres digitals. No van funcionar. El cervell necessita imatges digerides i processades, i li estàvem enviant imatges en cru que eren totalment incomprensibles. Vam haver d’esperar uns quants anys fins entendre el que passava.

L’any 2012, Sheila Nirenberg i Chethan Pandarinath van aconseguir-ho. Van fer una pròtesi retinal que consta de dues parts: un codificador i un transductor. Les actuals pròtesis, basades en els seus descobriments, són ja exitoses a la quarta part dels pacients, i encara ens falta molt per entendre i millorar. El codificador de Nirenberg i Pandarinath inclou un algorisme informàtic que converteix les imatges captades per una càmera digital externa (o bé per un sensor com el de les càmeres, implantat a la retina) en el codi que sabem que utilitzen les cel·les ganglionars de sortida cap al nervi òptic. El transductor, a continuació, acciona adequadament les cèl·lules ganglionars. El truc per a la construcció de l’algorisme codificador va ser treballar amb ratolins i modelar el seu comportament a partir d’analitzar les imatges d’entrada (en moviment) i els codis ganglionars resultants en una gran quantitat de situacions i escenes diferents, des de paisatges a cares i des de escenes estàtiques a gent caminant o corrent. Hem entès el model de processament de la retina humana a partir de l’estudi del comportament de la retina dels ratolins.

Ho explica molt bé en Jose Alain Sahel en aquest vídeo (en francès). La retina processa el que veiem tenint en compte el que hi ha just al costat i el que acabem de veure en instants anteriors. El processat biològic de la retina té en compte l’espai i el temps, de manera que els colors que percebem són relatius als del seu costat i que els objectes que no es mouen ens passen desapercebuts. Un cercle taronja no el veiem igual si és damunt d’un fons blau o d’una paret groga, i no ens adonem que tenim una abella al costat si no es mou (de fet, això ho resolem parcialment amb els moviments de nistagme). Perquè la retina no és ni una càmera digital ni una càmera de vídeo. Sap processar simultàniament l’espai i el temps i acaba enviant només unes 20 senyals diferents al cervell. De fet, ara que sabem que l’ull és molt més que una càmera de fotos, Es comença a parlar de càmeres de foto i vídeo que emulen els nostres ulls. Hi ha càmeres biomimètiques que aconsegueixen una màxima qualitat compressió d’entre 20 i 400 vegades i que es basen en una xarxa de píxels autònoms que només envien informació visual quan hi ha canvis.

Per cert, l’Eulàlia Fanar explica un costum esquimal per superar la ràbia i el rancor: es tracta de caminar en línia recta fins que tregui la ràbia. El punt on l’emoció s’ha aconseguit dominar i expulsar es marca amb un pal, com a senyal de victòria i també per comprovar la longitud de l’emoció enquistada.