Arxiu de la categoria ‘Informàtica’

Les mostres aleatòries i el consens

dijous, 19/10/2017

La imatge mostra un petit tros del conjunt de punts que obtenim amb un sistema d’escaneig de tipus LIDAR quan estem capturant i reconstruint una zona urbana. El sistema detecta, genera i ens dona milions de punts a l’espai, cada un d’ells amb les seves coordenades (x,y,z) i el seu color. El que veiem aquí a l’esquerra no és més que una munió de punts 3D (una mena de núvol), que podem analitzar i visualitzar interactivament. Mireu, per exemple, aquest vídeo o bé aquest altre. Els punts d’aquests núvols, però, són aproximats, perquè els sistemes d’escaneig, com tots els sensors, malauradament introdueixen errors. Errors que es fan més grans a mesura que els edificis que volem capturar, com el de la imatge, són més lluny.

Pensem ara en el problema de detectar, de la manera més exacta possible, la façana dels edificis. Només sabem que habitualment, les façanes són planes i verticals. Com la podem reconèixer i detectar, si només tenim punts i tots ells són aproximats? Què hem de fer per eliminar i no considerar tots aquells punts “atípics” (anomenats outliers en anglès) que poden emmascarar el resultat, com per exemple els punts de les fulles dels arbres que són propers a les façanes?

Sortosament, tenim una solució. L’algorisme RANSAC, proposat l’any 1981 per Martin Fischler i Robert Bolles, ens pot resoldre el problema. És un algorisme que cerca el consens a partir de mostres aleatòries. Podem tenir milers o milions de punts, això no importa massa. N’escollim N (per exemple, 50) a l’atzar. Fem la hipòtesi que aquests N punts són de la façana que volem detectar, i calculem un pla vertical F que els aproximi. Això no ha de ser difícil, perquè podem utilitzar tècniques de regressió i perquè només estem utilitzant un conjunt reduït de N punts. I ara ve el pas important: analitzem quin consens té aquest pla F entre tots els altres punts. Això tampoc és complicat. Només necessitem una tolerància que anomenaré T (per exemple, un centímetre). Llavors, per cada un de tots els altres punts del núvol, mirem si la seva distància al pla F és o no més petita que T. Si és més petita, és que aquest punt “accepta” el pla F. A final, acabem tenint una mesura del grau de consens que genera aquest pla F, en base al percentatge de punts que l’accepten. La resta de punts, en canvi, són atípics (outliers) en relació a F. fet això, en aquest moment ja hem aconseguit tenir una primera estimació de la façana. Però ara, l’algorisme RANSAC repeteix tot el procés amb uns altres N punts a l’atzar, troba un nou pla F’, compara el grau de consens de F i F’, i es queda amb el que en té més. I això ho va repetint una i altra vegada, comparant cada vegada el consens del nou pla amb el millor consens de tots els anteriors, fins que decidim que l’aproximació de la solució ja és prou bona.

L’algorisme RANSAC és no determinista, perquè les mostres són aleatòries. A més, només és segur que ens trobarà la millor solució possible si no tenim pressa i el deixem que vagi provant anys i anys. Si, en canvi, l’aturem en un cert moment, només podem afirmar que la solució serà correcta amb una certa probabilitat. En tot cas, l’experiència demostra que en general acaba donant molt bons resultats i separant les dades útils (inliers) de les atípiques (outliers) en un temps raonable. Un cop separats, podem eliminar aquests punts atípics i quedar-nos amb els punts que ens determinen bé la façana, perquè RANSAC ens ha detectat tot allò que ens pertorbava la solució del problema.

Els humans, de fet, no som tan lluny d’aquest consens de mostres aleatòries. Si fem l’exercici de substituir núvols de punts per grups socials i rellegim els paràgrafs de dalt pensant en persones en lloc de punts, l’algorisme RANSAC segurament ens recordarà el nostre comportament quan escollim comissions, votem representants, o bé discutim projectes urbanístics o d’altre tipus que les administracions exposen públicament. En tots els casos, l’objectiu és obtenir el màxim de consens de la resta de la societat. La única diferència amb l’algorisme RANSAC és que nosaltres aviat ens cansem, mentre que ell no. No és fàcil, això de canviar la mostra. Costa canviar i fer refer projectes, costa renovar comissions i revocar representants per tal de millorar el consens. És així. És la condició humana. Per bé i per mal, no som màquines.

———
Per cert, en David Fernàndez diu que segurament, l’única contrarevolució en marxa avui és l’ofensiva autoritària, devastadora i neoliberal que recorre el planeta. Replegaments de la por i una estranya retrotopia, diu, quan en difícils temps de crisi l’extrema ambigüitat de la condició humana es dirimeix sempre, antagònicament, entre la brutalitat i la cooperació.

La paradoxa de la informació

divendres, 8/09/2017

La informació no té una definició única. La gran enciclopèdia catalana diu que informació és una “notícia o notícies que hom tracta de saber, que hom rep”, però que també és el “contingut d’una o més dades, tot fent abstracció de la representació concreta que adopta”. Coses que volem saber o que acabem sabent, i que podem extreure de les dades que rebem. La Wikipèdia, d’altra banda, la defineix com “tot allò que un ser humà és capaç de percebre, incloent-hi les comunicacions escrites i orals, les imatges, l’art o la música”, i com “el fet de processar, manipular i organitzar dades d’una forma que produeixin coneixement i esvaeixin el desordre”.

La informació és multifacètica. És el que percebem, el que incrementa el nostre coneixement. També, en paraules de Claude Shannon, informació és allò que redueix la incertesa. La frase “avui a la nit serà fosc” no és informativa perquè és quelcom que tots sabem. Però si dic “aquesta nit no vindré a sopar” estic concretant, disminueixo la incertesa, i per tant informo (vegeu la nota al final). Ara bé, a més d’aquest aspecte cultural i comunicatiu, la informació s’ha de transmetre, i aquí és on apareixen les dades, l’ordre i el substrat que la suporta. Les plantes informen amb les seves olors, les formigues amb els rastres i els ocells amb els seus cants. Els sons dels dofins o dels rossinyols, perfectament codificats, ordenats i seqüenciats, són útils als seus companys encara que nosaltres no els entenguem. Per això, podem dir que la informació requereix un determinat ordre en un cert substrat, a més d’un codi que li doni sentit i ens permeti llegir-ne el significat. Podem llegir un article a la pantalla de l’ordinador només quan el seu conjunt de més d’un milió de píxels s’ordena i ens mostra les lletres del text en negre sobre blanc, i tot seguit el podem recordar gràcies a l’ordre químic de les neurones del nostre cervell. Quan una persona parla en una llengua que desconeixem o escriu signes que no entenem, observem l’ordre sonor o gràfic del que fa, però no podem captar la semàntica dels seus missatges.

Què ens diu, la imatge de dalt? A primera vista, són 15 ametlles disposades en un ordre estrany damunt una pedra, formant set columnes amb 4, 3, 2, 1, 1, 2 i 2 fruits secs. Imagineu ara que tenim una quadrícula imaginària amb 4 files i 8 columnes, de manera que la primera columna és a l’esquerra i no té cap ametlla. L’ordre es fa més explícit, i ens presenta quatre files de 8 caselles, algunes plenes i altres buides. Ara ja veiem, en aquest substrat d’ametlles, una taula ordenada; però encara ens falta el descodificador. Però només cal que ens diguin que les hem disposat en files seguint el codi ASCII dels ordinadors, i ja podrem llegir el missatge: les quatre files codifiquen les quatre lletres de la paraula “Bits”.

En informàtica, tota la informació es codifica i representa amb seqüències de bits. Cada lletra dels texts que escrivim als missatges i correus electrònics i cada lletra dels articles i llibres que llegim i que trobem a la web, es guarda en un “byte“, que són 8 bits. Els sons, els missatges de veu, les fotos, la nostra agenda, els vídeos i tot el que tenim als ordinadors tenen el mateix aspecte: una llarga tirallonga de bits “1” i “0”. Els ordinadors funcionen gràcies a que apliquen el descodificador adequat a cada tipus d’informació, perquè si per exemple utilitzessin el codi ASCII per interpretar vídeos, no veuríem res. D’altra banda, els bits són també una eina de mesura: si codifiquem la informació de manera òptima i eliminant totes les possibles redundàncies, la quantitat d’informació es pot mesurar pel nombre de bits que ocupa. Però aquesta mesura acaba sent diferent pels humans i pels ordinadors, cosa que té conseqüències pràctiques molt concretes, per exemple quan l’ordinador o el mòbil ens demana que escollim i entrem una nova paraula clau (un nou “password“): tenim una falsa percepció d’allò que és indesxifrable (vegeu un cop més la nota al final).

Per bé o per mal, som al segle de la informació. En Gérard Berry comenta que el segle XIX va ser el segle de la matèria, de la química i de la síntesi dels metalls i altres elements. El segle XX, en canvi, va ser el segle de l’energia, a més de la matèria: l’electricitat, el petroli, l’energia nuclear i fins i tot l’inici de les renovables. El segle passat va veure el naixement de la informàtica, però no ha estat fins el segle XXI que hem vist un creixement quasi explosiu de la quantitat informació que corre pel món. Recordo que, l’any 1992, el disc dur del meu ordinador era de 20 MB (un “MegaByte” és un milió de bytes, equivalent a 8 milions de bits). Ara, qualsevol targeta “MicroSD” de mòbil té 16 o 32 GB, més de mil vegades més que el que jo podia guardar fa tan sols 25 anys. No parem de generar, guardar i “compartir” informació.

La paradoxa del moment actual, però, ens l’explica molt bé en Renee Morad. Internet fa que la informació sigui més accessible que mai. Però molts dubten (dubtem) de la veracitat del que hi troben. Aquesta desconfiança (sobretot en fonts “llunyanes”, tal vegada esbiaixades i poc contrastades) alimenta una demanda de nova informació que és cada vegada més gran. En altres paraules: hi ha massa informació; però, en no saber quina és certa i quina és falsa i del tot il·lusòria, nosaltres en generem més. Com que moltes persones fan el mateix, es manté el creixement continu de la quantitat d’informació. Cada cop hi ha més informació que és menys fiable en mitjana i cada cop es farà més difícil filtrar-la. Incrementem la quantitat mentre reduïm la qualitat. Llegir és fàcil, entendre i comprendre serà cada vegada més difícil.

Per cert, en David Foster Wallace deia que ensenyar a pensar és ensenyar a ser una mica menys arrogant i a contemplar-nos nosaltres mateixos i les nostres certeses amb consciència crítica, perquè un gran percentatge del que tendim a donar per segur s’acaba demostrant que és fals i del tot il·lusòri.

———

NOTA: L’entropia de Shannon és una mesura del desordre que conté un missatge. És clau per a quantificar la informació que conté. En concret, la informació que conté un missatge es pot mesurar com la inversa de seva probabilitat (aquí, per exemple, en podeu veure una explicació senzilla i basada en exemples de predicció meteorològica). Quan ens parlen d’un fenomen rar, la seva probabilitat és baixa i per tant, la mesura de la informació que aporta és alta. En canvi, quan ens diuen una obvietat d’absoluta certesa (com que “la sang és vermella”), la probabilitat és màxima i la informació, nul·la. En tot cas, la novetat d’una certa informació depèn del receptor: la frase “la capital de Finlàndia és Hèlsinki” segurament no aporta cap nova informació a moltes persones mentre que, per algunes altres, pot ser quelcom nou i informatiu.

Com podeu veure en aquesta auca, la dificultat de les paraules clau que utilitzem (i la informació que contenen) és molt diferent pels humans i per les màquines. L’auca compara les paraules clau “Tr0ub4dor&3” i “correcthorsebatterystaple“. La primera es basa en escollir una paraula poc usada (en aquest cas podria ser “troubador” en anglès), posar o no la primera lletra en majúscules, fer un parell de substitucions, i afegir al final un signe de puntuació (“&” en aquest cas) i un dígit numèric. La segona consisteix simplement en concatenar quatre paraules més o menys corrents, “correct horse battery staple“.

L’entropia de la primera opció és de l’ordre de 28 bits, si pensem que el diccionari de paraules poc usades que utilitzem té unes 65 mil paraules (2 a la 16); la resta de bits són deguts a decisions sobre com hem de modificar aquesta paraula i quins són els darrers dos caràcters de la paraula clau. Una màquina que faci mil tests per segon pot provar totes les possibilitats (2 a la 28) en uns tres dies i per tant acabarà descobrint el nostre password. Però als humans se’ns fa molt difícil recordar la paraula inicial i tots els canvis i substitucions. Segur que al cap d’un temps no recordem el que havíem posat.

En canvi, l’entropia de la segona opció és de l’ordre de 44 bits, si pensem que el diccionari de paraules que utilitzem té dues mil paraules (2 a la 11), perquè 11 per 4 és 44. A raó de 1000 tests per segon, una màquina necessitaria 550 anys per provar totes les possibilitats (2 a la 41 segons). En aquest cas tenim una paraula clau que ens és fàcil de recordar si pensem en alguna regla mnemotècnica o en alguna idea que ho lligui tot, però que en canvi les màquines i sistemes automàtics no la podran desxifrar.

Com diu l’auca, després de vint anys d’esforços, hem après a usar paraules clau que els humans no som capaços de recordar, però que les màquines poden desxifrar fàcilment. Un consell: si volem tenir paraules clau que siguin realment privades, millor que pensem en trucs que siguin complicats per les màquines i sistemes automàtics, encara que a nosaltres ens semblin fàcils…

Internet i els nivells de realitat

divendres, 18/08/2017

En aquests temps de la postveritat, no és fàcil entendre el que realment passa i destriar-ho d’allò que ens volen vendre. Molts són els qui volen influir en els altres, amb mètodes que sovint deixen aparcades les consideracions ètiques. La publicitat ens promet l’impossible, i els polítics utilitzen mètodes publicitaris per a fer que cada persona escolti el que vol sentir, amb programes electorals individualitzats a la carta que només pretenen guanyar vots.

En Chris Swain, en un article científic (i profètic) de fa deu anys, proposava un conjunt de directrius per dissenyar jocs d’ordinador que poguessin conduir a un canvi social. Entre d’altres regles, deia que calia integrar experts en la matèria, abordar problemes recargolats (que no tinguin regles clares), construir una comunitat sostenible, mesurar la transferència de coneixements i fer que siguin divertits. Pot semblar innocent, però el fet de voler influir, a travès de jocs suposadament innocus, fa saltar moltes alarmes. Qui decideix les característiques d’aquest pretès canvi social? Hi ha gent que té clar on vol que anem els demés? Darrera l’aparent caire democràtic d’internet, hi ha la tirania d’uns pocs?

De fet, he de confessar que he descobert en Chris Swain fa pocs dies, mentre llegia el darrer llibre de la Carme Torras: “Enxarxats”. El meu interès va anar creixent a mesura que llegia i anava entrant a l’estructura i al joc narratiu, fins que al cap de ben poc vaig quedar enganxat a la seva “xarxa” i ja no el vaig poder deixar. En acabar, tenia els pèls de punta. Només us en faig un tast. És de quan proposen un sistema, a una de les protagonistes, per donar a cadascú l’ample de banda que es mereix i així escollir sempre l’opció més beneficiosa per la col·lectivitat. Li diuen que només haurà d’assenyalar les veus a potenciar i a inhibir, valorant la gradació i la seva urgència. Després, “l’equip” ja s’encarregarà d’arbitrar els recursos en xarxa per a que cada identitat tingui el ressò que li correspon.

Tot plegat pot semblar ciència ficció, però hi ha molts indicis que diuen que una part de tot això ja és aquí amb nosaltres. Al món de la xarxa, hi ha qui pot veure més nivells de la realitat que altres. La Carme Torras, a més d’altres exemples, parla també dels jocs amb objectiu i concretament del joc ESP. En aquest article, que cita la Carme, en Luis von Ahn i la Laura Dabbish van proposar treure profit de la intel·ligència humana a través dels jocs d’ordinador. El recurs és vast i temptador, perquè, per exemple i segons von Ahn i Dabbish, els joves americans de 21 anys han destinat una mitjana de deu mil hores (poca broma) jugant a jocs d’ordinador. La idea darrera d’ESP és aprofitar, com a efecte secundari, part d’aquestes hores per etiquetar imatges i millorar després la cerca web d’imatges basada en noms. Per exemple, una imatge d’un home i un gos es podria etiquetar com “gos”, “home” i “mascota”. El joc és ràpid, agradable i competitiu. Les coincidències dels jugadors determinen les millors descripcions i també els rànquings. Ara bé, al final, uns juguen i altres s’aprofiten de la feina feta mentre els primers s’entretenien. Perquè el cert és que hi ha qui va guanyant diners amb el que fem, el que diem i el que pugem a la xarxa. En som prou conscients?

Crec que en Michael Shermer té tota la raó. La única manera de entendre les coses i de tenir un bon nivell de visió i comprensió de la realitat a tots nivells, és ser molt escèptic. No ens podem creure res del que ens ofereixen ni del que trobem a internet sense abans comprovar-ho. Cal cercar diverses fonts d’informació (com més, millor) i conèixer la seva autoria, perquè les autories sòlides són les que porten a “l’auctoritas“. I, en cas d’incertesa, sempre és millor i aconsellable continuar en el dubte abans que acceptar explicacions poc convincents. Diuen que els dubtes obren la ment, mentre que les certeses la tanquen…

————

Quan acabava d’escriure aquest article, els terribles atemptats de Barcelona i Cambrils ens han colpit en ple estiu. El que segueix, així com el comunicat del Centre Delàs i molts d’altres, ens confirma que no tenim por i que continuarem defensant els drets humans, la pau, la diversitat i la justícia global. La imatge de dalt és la foto de la normalitat, que he fet a les 24 hores de l’atemptat de les Rambles.

Per cert, el Centre Cultural Islàmic Català comunica que s’uneixen a tots els ciutadans de totes les creences i religions en contra de la barbàrie d’aquests dies, i que s’uneixen per la pau i la seguretat a la nostra diversa societat catalana. Perquè no es pot permetre que els racistes utilitzin la sang de les víctimes per acusar i criminalitzar cap col·lectiu de l’espectre ciutadà de Catalunya.

Escalfament, responsabilitat i poder

dimecres, 21/06/2017

Fa poc, l’Antoni Bassas comentava que el 69% dels barcelonins creuen que tindran cotxe d’aquí 10 anys i que el 81% creuen que el faran servir igual o més que ara. És curiós. L’aire de la ciutat és moltes vegades sota mínims pel que fa a contaminació, però nosaltres volem mantenir els nostres hàbits i seguir tenint cotxe. Espero i desitjo que, amb la nostra curtesa de vista, no ens passi com les granotes a l’olla d’aigua calenta.

La setmana passada vaig ser a un congrés de visualització. Aquest és un camp que estudia com presentar la informació i les dades, amb tècniques informàtiques, de manera que les persones puguin entendre-les, analitzar-les i treure’n el màxim de profit. Un dels conferenciants va mostrar, com a proposta interessant, un còmic-web d’en Randall Patrick Munroe sobre l’escalfament global del planeta. En Randall Patrick Munroe, nascut el 1984, és físic. Va treballar a la NASA, però ara fa 11 anys no va voler renovar el contracte i es va voler dedicar a temps complet a la creació de còmics sobre matemàtica, ciència i vida.

El còmic-web d’en Randall Patrick Munroe sobre l’escalfament global el podeu veure aquí (també el teniu en vídeo). És una imatge, llarga, que si voleu us podeu descarregar. Però el que us aconsello és que la mireu directament a la web, amb el vostre navegador, desplaçant-vos amunt i avall amb el ratolí o la pantalla tàctil. La imatge que veieu aquí al costat és un collage que inclou tot el còmic (estret i llarg) a l’esquerra i tres trossets, ampliats, a la dreta. Les dades provenen del comitè IPCC de la ONU i de diferents treballs científics de Shakun, Marcott, Annan, Hargreaves i altres (2012 i 2013). És una cronologia del nostre planeta des de fa 22 mil anys fins ara que mostra els principals esdeveniments històrics i la temperatura mitjana de la superfície del planeta, estimada amb els mitjans científics que tenim avui. Després de l’edat de gel, la temperatura es va estabilitzar en valors similars als dels segles XIX i XX ara fa uns onze mil anys (cap a l’any 9000 abans de Crist), poc després de l’inici de l’agricultura neolítica. Podem anar pujant i baixant i anirem veient l’evolució de la temperatura. Però la sorpresa ve quan som a baix de tot i veiem el que ha passat des de 1980: la única pujada anòmala dels darrers vint-i-dos mil anys ha tingut lloc durant les darreres quatre dècades. Qui pot defensar, veient això, que no és culpa nostra i que l’escalfament no és antropogènic? Però és que, a més, la corba dels darrers 40 anys té un aspecte clar, terrible i temible: exponencial. Com diuen molts científics, hem entrat a l’època de les conseqüències.

Tots en som responsables, però no ens hem d’enganyar. Uns ho són molt més que els altres. Hi ha qui està trencant el planeta amb l’únic objectiu d’enriquir-se. Veiem que es manté l’extracció de combustibles fòssils mentre es redueix el pressupost de recerca en renovables i no s’elabora cap pla de transició energètica (al menys, a Espanya). En Ben Hayes i en Nick Buxton, al darrer llibre que han editat, parlen de l’actual distòpia: els governs han deixat d’ocupar-se de les persones mentre que els qui manen són les grans corporacions que treballen per al seu benefici econòmic. No importa què diguin els científics: cal fer negoci com sigui, cal continuar explotant i escalfant el planeta, cal tenir més petroli, cal garantir la seguretat energètica del “castell” dels privilegiats. En un bon exemple, en Bru Rovira parla del Txad i explica que va viure un moment ple d’esperança l’any 2003. S’inaugurava l’oleoducte que havia de portar el petroli que es començava a explotar als pous de Doba fins a l’oceà Atlàntic. El petroli havia de portar prosperitat i riquesa. Però aquests 14 anys han demostrat el contrari. El Txad és ara un Estat corrupte, dictatorial, endeutat i militaritzat. I aquest model txadià de destrucció i empobriment d’un país ric en recursos que podrien haver servit per millorar la vida de la població, no és un fet estrany o aïllat, com ens fa notar en Bru Rovira, sinó que pertany al nou colonialisme global, amb el qual les grans empreses depreden els recursos amb la col·laboració necessària dels governs occidentals i dels militars. Seguim el dit que assenyala el terrorisme mentre se’ns escapa la mà criminal que amaga el petroli, diu. La ma que ignora el planeta i la immensa majoria de la població mundial.

Acabo amb el que explicava fa uns mesos la Rosa Montero, citant els professors Vitali, Glattfelder i Battiston, que van analitzar més de 43.000 empreses multinacionals. Amb el seu estudi, van descobrir que el 80% d’aquestes empreses estava controlat per només 737 persones. La Rosa Montero (també ho diu Oxfam Intermón) ens confirma que el món pertany a menys de mil persones. I diu que els polítics s’haurien de posar de la nostra part, de part de tota la resta de ciutadans, per intentar controlar els potentats. Perquè això és el que implica el binomi democràcia – sostenibilitat. No crec que es pugui dir més clar.

Per cert, en Rafael Vilasanjuan es pregunta on són ara els refugiats, i constata que Europa destina molts diners per pagar guardacostes libis per impedir-los que surtin del país, o per tornar-los si aconsegueixen sortir-ne.

Les nostres metadades

divendres, 12/05/2017

En Ferran Requejo diu que som cecs i sords però ebris de paraules; que som intrínsecament xerraires i que constantment inventem ficcions que ens acabem creient i que fins i tot defensem. El cert és que cada dia generem moltíssima informació que acaba circulant per la xarxa. Trucades telefòniques, missatges de text, missatges d’àudio, fotos i vídeos. No parem d’explicar-nos coses i de compartir informació. Segurament, podríem passar amb molt menys. És informació, són dades que moltes vegades considerem privades i que no voldríem que ningú en pogués fer ús sense el nostre permís.

Però a més de dades, generem una gran quantitat de metadades. El que ens diem per telèfon o quan ens enviem missatges són dades; en canvi, la informació que hem trucat a tal persona el dia X i que hi hem estat parlant durant 9 minuts és una metadada, de la mateixa manera que ho és el fet d’haver-li enviat un whattsapp. Les dades són el què, les metadades són el quan, el com i el on ho hem fet. Les cerques per internet, les compres amb targeta, els llocs per on anem amb el mòbil, el lloc on el deixem tota la nit, són metadades. L’ús d’aquestes metadades és encara molt poc regulat, i, com sempre, hi ha empreses que les utilitzen per a fer negoci.

En Paul Wood comenta, en aquest article, un exemple ben recent del que es pot arribar a fer amb tota aquesta informació. Es tracta de la passada campanya electoral als Estats Units. Parla de la doble personalitat de Donald Trump i del que anava fent a l’ombra dels seus comentaris destralers i dels seus tuits. Concretament, al juny del 2016, en Trump va negociar amb l’empresa anglesa Cambridge Analytica un contracte milionari per esbrinar, en base a l’anàlisi de metadades, què era el més probable que acabés votant cada ciutadà dels EEUU a les eleccions presidencials. L’estratègia es va basar en connectar dos estudis independents, el primer dels quals va analitzar la personalitat de més d’un milió de ciutadans. Això es va fer en base a les seves respostes a petites enquestes telefòniques, per internet, o al que contestaven qüestionaris d’enquestadors que els aturaven durant les seves compres en grans superfícies comercials dels Estats Units. Amb algorismes d’aprenentatge similars a altres que actualment s’estan estudiant, van poder fer una valoració de la personalitat de tots i cada un d’ells en cinc eixos diferents: el de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Al final, Cambridge Analytica va acabar tenint una estimació dels trets de personalitat de més d’un milió de persones, quantificats en base al valor d’aquests 5 eixos ja mencionats.

Però això no és tot. Cambridge Analytica també va acabar disposant d’informació sobre tots i cada un dels 230 milions de potencials electors als Estats Units. De cada un d’ells, va poder aconseguir un total d’entre 4.000 i 5.000 dades: edat, gènere, on viu, on treballa, on va els caps de setmana, si surt o no a les nits, què menja, quins diaris i revistes compra, quins programes de tele mira, quin cotxe condueix, i moltes més coses. Dades i metadades que, un cop recollides dia a dia, ens defineixen i classifiquen fins convertir-nos en un punt dins un immens espai de maneres de ser i fer. Hi ha empreses que ens tenen fitxats. En Paul Wood reconeix que tot plegat és impressionant i fa por: Cambridge Analytica les té a la venda, en una operació comercial que, en paraules seves, converteix dades en or.

A partir d’aquests dos estudis, el repte era aconseguir fer una estimació de la tendència política de cada ciutadà. Cambridge Analytica es va basar en dues hipòtesis que van resultar certes: que hi havia correlació entre el que comprem i fem cada dia i els trets de la nostra personalitat, i que també hi havia correlació entre aquests trets de personalitat i la nostra tendència electoral. En altres paraules, els que fan coses similars i tenen hàbits semblants (i es troben representats per punts propers), tenen personalitats similars; a més, els trets de la personalitat ajuden a predir el comportament i a saber si ens agrada més el vi o la cervesa i si pensem votar el candidat A o el B. Amb l’ajut d’aquestes dues correlacions, els de Cambridge Analytica van poder fer una estimació del valor dels 5 eixos de personalitat per tots els 230 milions de potencials votants, i, en un segon pas, deduir quin candidat era el preferit de cada un d’ells.

La conseqüència de tot l’anterior és que es va poder actuar amb propaganda electoral “micro-dirigida” a cada petit grup i a cada persona concreta. El missatge, enviat a través de correus electrònics o amb voluntaris que feien el porta-porta, era sobretot dirigit a les persones indecises, i a cada una d’elles se li explicava justament el que ella desitjava escoltar. No hi havia un únic programa polític, només publicitat per convèncer la gent. Tot era “a gust del consumidor”. Qui estava preocupat pels llocs de treball rebia missatges que deien que tota la situació laboral milloraria, qui era partidari de les armes de foc es trobava amb cartes que parlaven de la necessitat de preservar-les, qui tenia por del terrorisme rebia informacions sobre la importància de fer fora els musulmans i estrangers.

Només va caldre treballar amb les dues correlacions ja mencionades. La de les dades de cada persona amb el seu perfil de personalitat, i la d’aquest perfil amb el comportament electoral. Evidentment el resultat no és exacte, i el sistema es pot equivocar, enviant cartes inadequades a molta gent. Però estadísticament funciona, perquè la doble correlació fa que la probabilitat d’encertar sigui molt més elevada que la d’enviar cartes que no serveixen. La conclusió, molt preocupant, és que una empresa ha sabut com fer-s’ho per enviar missatges individualitzats de publicitat electoral, i que hem acabat veient que ha aconseguit el que volia.

En Paul Wood cita en Jill Lepore, especialista en historia dels processos electorals a la Universitat de Harvard, que reconeix que els sistemes tradicionals de votació poden ser poc fiables, però que la ciència de les dades pot ser encara molt més perjudicial. No només els missatges actuals dels polítics acaben sent dictats pels seus consultors amb l’únic objectiu de guanyar vots, sino que ara, a més, a cada votant se li diu el que vol escoltar. És el que diu la imatge de dalt, que he tret d’aquesta pàgina web. Moltes vegades no és que ens venguin alguna cosa: el que passa és que ens estan venent a nosaltres mateixos. Nosaltres som el producte…

Per cert, l’Adrià Rocha Cutiller diu que Facebook, Google i Amazon ho saben tot de nosaltres i que fan “el negoci de la nostra vida”. Saben amb qui parlem, on som, cap on anem, qui som i qui ens agradaria ser. I que ho saben perquè els ho diem. Diu que Facebook acumula, juntament amb Google, el 50% de tota la inversió publicitària mundial.

Els ordinadors visuals

dijous, 27/04/2017

Fa poc, en una conversa amb en Gérard Berry, va sorgir el tema dels telèfons mòbils. En Gérard opina que les coses s’estan capgirant. Vam passar del telèfon fix d’ara fa vint anys a uns mòbils que bàsicament servien per trucar i enviar missatges de text, amb poques capacitats de càlcul i emmagatzemament. Després, hem passat lentament a tenir petites màquines amb altes capacitats de computació i tractament de dades, que continuem anomenant telèfons però que de fet són potents ordinadors que poden telefonar, ajudar-nos a cercar informació o mostrar-nos mapes. Els mòbils s’han convertit en ordinadors que capten fotos i vídeos i que fan moltes més coses. I de fet, ben aviat estarem envoltats d’ordinadors que “ens ajuden” a fer-ho tot, controlant les nostres cases, cotxes i electrodomèstics.

La fotografia ha sofert dues revolucions en menys de vint anys. La primera, que va començar els darrers anys del segle XX, va significar el pas, dràstic, de la fotografia analògica a la digital. Algunes empreses com Kodak es van enfonsar, i la gent va deixar de revelar rodets de fotos. Ja no calia mirar-s’hi molt, a l’hora de fer fotos, perquè en podíem fer moltes i escollir després la que més ens agradava sense cap cost addicional. En eliminar el cost de cada foto individual, va començar a canviar l’essència mateixa de la fotografia. Lentament, vam anar entrant a l’època de la massificació de la imatge, perquè tot era fàcil i a l’abast de tothom.

Després va venir la segona revolució, més invisible, que ens han portat els telèfons mòbils. Us heu preguntat alguna vegada com és que, amb un objectiu tan petit i amb una distància focal tan minsa, els telèfons actuals poden fer fotos tan bones? És clar que els objectius de les càmeres convencionals i els de les més bones (com les rèflex) recullen molta més llum i poden obtenir fotos de molt bona qualitat, però el que a mi sempre m’ha sorprès és que els telèfons puguin fer les fotos que fan amb uns objectius tan petits, de pocs mil·límetres. La resposta, que ens explica en Frédéric Guichard en aquest vídeo, es troba en els algorismes de tractament d’imatge dels nostres mòbils, que són veritables ordinadors visuals. Abans, les lents dels sistemes òptics de les càmeres es fabricaven amb un procés delicat i d’alta precisió. Ara no cal, perquè durant el control de qualitat final, cada càmera individual s’ajusta per tal d’aconseguir el màxim de prestacions. Com que ja no es pot tocar la lent òptica, el que es fa és ajustar els algorismes que tracten la imatge capturada de manera que compensin els errors i distorsions de la lent. Cada telèfon adapta, de manera quasi òptima, el tractament de les imatges als defectes del seu sistema òptic, de manera que acaba tenint un conjunt lent-algorismes únic i que no té cap altre telèfon. Aquesta segona revolució de la fotografia ha canviat totalment els sistemes de fabricació de les lents dels objectius de les càmeres fotogràfiques, com bé explica en Frédéric Guichard: enlloc de fabricar lents d’alta precisió i conjunts òptics que compensin les aberracions, fem lents de baix cost més imperfectes i després corregim intel·ligentment els errors que apareixen a la imatge capturada.

Hi ha tota una nova àrea de recerca, anomenada fotografia computacional, que estudia els algorismes que, a qualsevol telèfon mòbil, “cuinen” la imatge crua que capta el sensor de la càmera fins deixar-la preparada per a que la puguem veure. La imatge de dalt, que he compost a partir del vídeo d’aquesta conferència d’en Gérard Berry, mostra dues d’aquestes transformacions. Dalt a la esquerra veiem la imatge “crua” tal com surt del xip de sensors de la càmera, i a la dreta tenim com queda un cop s’han ajustat automàticament els colors. La fila de baix mostra com es corregeix l’anomenada aberració esfèrica: les imatges d’esquerra i dreta mostren la imatge, primer crua i després d’haver estat tractada pels algorismes (personalitzats per a cada telèfon) de correcció de distorsions.  Com bé diu en Frédo Durand, els mòbils han passat a ser les càmeres de fotos per antonomàsia, i en ells, el component central de la creació de les imatges és la computació (i els algorismes). El que fa qualsevol mòbil en el breu període de temps que hi ha des que premem el botó de l’obturador fins que ens mostra la foto en el visor és increïble, com explica en Gérard Berry a la seva conferència. Cuina i millora els colors, corregeix distorsions, compensa zones molt fosques o molt clares, elimina sorolls i altres tipus d’errors, detecta cares i analitza si algú ha tancat els ulls… És la nova informàtica, dels colors, de la forma i de la imatge.

Un darrer detall. En Frédéric Guichard explica que moltes vegades, la foto que obtenim no és de l’instant que premem el disparador, sino que és d’uns moments abans. Això és possible perquè les actuals càmeres dels mòbils no capturen una única imatge, sino que, mentre estem ajustant l’enquadrament, es guarden temporalment tota la ràfega de fotos dels fotogrames que veiem en el visor de la càmera quan som a punt de fer la foto. Part del processat de la imatge que fa l’ordinador-càmera consisteix en analitzar les fotos anteriors a la darrera, identificar cares de la gent, i substituir aquelles cares de persones que han quedat amb els ulls tancats, pels trossos corresponents d’imatge a altres fotogrames on han quedat millor. La foto final no és més que un collage de trossos de fotogrames amb distorsió i colors adequadament corregits.

Els ordinadors, les aplicacions i tots els ginys intel·ligents que van entrant a les nostres vides ben segur que ens ajudaran a viure millor, però impliquen una responsabilitat per part nostra: la de saber marcar els límits. No parem de fer i enviar-nos fotos i vídeos. Però, on les tenim? Qui controla aquesta informació tan etèria que va i ve per la xarxa? Podem estar segurs que ningú farà servir fotos nostres sense el nostre permís? Podem trobar una foto determinada que vam fer fa set anys? Fem còpies de seguretat (en dispositius privats nostres) o còpies en paper de tot el que deixem al “núvol”? Tenim una immensa capacitat de compartir informació visual, però sembla que només ens importi el present. I el més probable és que, d’aquí a 20 anys, quasi totes les fotos i vídeos actuals hagin desaparegut. No sé què feu vosaltres, però a mi m’agrada regirar capses i trobar fotos i cartes dels meus avis. Podran fer el mateix, els nostres néts i besnéts? La informació que ens enviem i compartim és volàtil com els núvols. Si limitem el temps que dediquem a la immediatesa de la comunicació i no estem sempre connectats, si trobem temps per gaudir de les fotos que hem fet i de les que ens han enviat, si podem veure-les amb la mirada de l’assossec, segurament descobrirem que algunes d’elles han de ser mimades, recordades i conservades, perquè són part del que ens queda d’aquells que estimem o hem estimat. Aturem-nos, limitem el nostre constant neguit, escollim, evoquem, gaudim, i conservem.

Per cert, la Marxa per la Ciència és una iniciativa que va començar als Estats Units però que ara ja aplega més de 500 ciutats de tot el planeta i compta, a més, amb el suport de més de 220 organitzacions científiques oficials. El comunicat diu textualment que són molts el que veuen que cal fer un pas més i exigir que les polítiques públiques no estiguin en mans d’indocumentats que menyspreen el coneixement i es guien per prejudicis, interessos espuris o dogmes religiosos.

Evolució i robustesa

divendres, 21/04/2017

Robustesa, en informàtica, és sinònim de tolerància als problemes i als errors. Un sistema  o algorisme robust ha de poder seguir treballant en condicions satisfactòries en presència d’errades. No importa que aquestes siguin degudes a un mal-funcionament del hardware o a que la persona que està entrant les dades s’hagi equivocat. El sistema, si no pot seguir endavant, ha d’avisar i demanar, per exemple, que hem de tornar a entrar part de les dades; però no es pot col·lapsar. Algun dia, quan els nostres ordinadors arribin de veritat a l’edat adulta de la robustesa, ja no farem els ben coneguts acudits informàtics que parlen d’apagar i tornar a engegar.

Però no cal fixar-nos en els algorismes, perquè la gran mestra en robustesa és la natura. Ho han vist, per exemple, un grup d’investigadors d’Alemanya, Mèxic, Anglaterra i la Xina, que han investigat els peixos de tipus poecílid a les aigües sulfuroses del riu El Azufre, a Tapijulapa (Mèxic). Aquest riu, que podeu veure a la imatge de dalt (imatge que he obtingut d’aquesta pàgina web) és d’aigua tòxica, amb una concentració de sulfur d’hidrogen (també anomenat àcid sulfhídric) que fa impossible la vida de quasi tots els vertebrats. Aquest grup de científics ha publicat un treball que podeu trobar aquí, on analitzen l’evolució d’aquesta família de peixos. Rüdiger Riesch i Martin Plath, que també en parlen a un article a la revista Scientific American, expliquen que van trobar diversos tipus de peixos de la mateixa família, tots ells descendents d’antics poecílids que vivien en aigües clares i netes. Aquests diferents grups de peixos han anat evolucionant de manera independent a partir d’un avantpassat comú que va existir fa uns 600 mil anys, perquè s’han hagut d’anat adaptant a viure en entorns tòxics incomunicats i separats bastants quilòmetres l’un de l’altre. En total, han estat analitzant vuit grups diferents de peixos poecílids, tots ells lleugerament diferents i que viuen en diferents paratges. D’aquests vuit grups, quatre viuen en aigües clares i quatre es troben en entorns molt tòxics amb àcid sulfhídric. Aquests darrers, encara que han hagut d’evolucionar de manera independent, tenen unes característiques anatòmiques i metabòliques molt similars, amb boques i caps més grans, que els ajuden a viure en condicions inhòspites. Ara bé, el sorprenent és que, tot i que són prou semblants (ho podeu veure en aquesta foto, que també és del Scientífic American), tenen genomes molt i molt diferents: els canvis genòmics en un determinat grup, molt importants i distribuïts per tot l’ADN, tendeixen a ser únics per aquest grup i a no ser compartits pels altres grups. En canvi, el resultat, en termes de camins metabòlics (el conjunt de reaccions químiques que fan possible la vida), és el mateix en tots ells. En altres paraules: els camins evolutius, independents, han estat diferents, però el resultat és molt semblant perquè és el que acaba possibilitant l’adaptació a entorns agressius. Calia adaptar-se, i ho van fer, d’una o altra manera. És la robustesa de l’evolució: encara que hi ha molts camins, veiem resultats similars perquè els que no es van adaptar, ja no hi són. Els autors diuen a més que els seus resultats corroboren les hipòtesis de Jay Gould en el sentit que l’evolució és sovint el resultat irrepetible d’esdeveniments estocàstics que tenen efectes altament contingents, però que acaben adaptant-se a l’entorn gràcies a la selecció natural.

I no només els peixos. Els diferents grups d’humans, com explica en D.T. Max en un recent article a la revista National Geographic, hem anat evolucionant de manera independent per adaptar-nos al medi, amb solucions ben satisfactòries en tots els casos. Els inuit tenen gens que els permeten metabolitzar el greix de les balenes, i els japonesos, uns altres per digerir les algues marines. Les civilitzacions ramaderes són més tolerants a la lactosa, mentre que la pell dels africans els protegeix de les radiacions ultraviolades. Solucions ben diferents, totes robustes, que ens adapten a tots els indrets de la Terra. Som molt iguals i ben diferents…

De fet, la ciència mateixa, amb el rigor en els experiments i amb els seus mecanismes de revisió anònima dels resultats abans de publicar-se, treballa de manera semblant i intenta maximitzar la seva robustesa. Molts dirigents, però, la ignoren. Prefereixen crear mons paral·lels i realitats alternatives, objectivament falses però que són útils per als seus interessos. Per això, molts científics han dit que ja n’hi ha prou i organitzen, demà, la marxa per la ciència. Els convocants diuen que la ciència, els científics i la política basada en l’evidència científica estan sent atacades, i que les retallades, la censura, la desaparició de les dades i les amenaces de desmantellar les agències governamentals ens amenacen a tots i posen en risc la salut, el menjar, l’aire, l’aigua, el clima i fins i tot el treball. No som en un moment fàcil, però som coherents amb l’actitud de tolerància als problemes, i pensem que ens en sortirem.

———

Per cert, en John Carlin diu que en castellà no existeix cap traducció de la paraula anglesa “compromise”, concepte que vol dir que tots dos costats cedeixen en una negociació per tal que tots surtin guanyant. Parla també de Jonathan Powell, que comenta que a més, hi ha una paraula nostra que tampoc té traducció a l’anglès: “crispació”. Perquè l’esport espanyol preferit, diu Carlin, és la indignació, que concedeix una rica sensació de superioritat moral sobre l’altre.

L’accessibilitat nocturna

dijous, 23/03/2017

Un comentari recent sobre per a qui és la tecnologia i sobre l’enllumenat nocturn als carrers dels nostres pobles i ciutats, que podeu veure aquí al costat, és realment encertat. He de reconèixer que vaig fer una interpretació parcial del mapa fotogràfic nocturn del nostre planeta. És cert que Àfrica és a les fosques, però també és evident que l’enllumenat públic als països del primer món és desmesurat. M’agrada la reflexió sobre si de veritat cal que, en sortir al carrer a la nit, poguem llegir el diari mentre caminem. Per què hem de gastar tanta energia?

Si ens pregunten el per què de l’enllumenat públic a la nit, segurament la nostra resposta inclourà diverses consideracions sobre la qualitat de vida, l’accessibilitat i la seguretat. Al segle XX ningú va qüestionar aquest enllumenat elèctric i la progressiva substitució dels fanals de gas: era un signe de progrès i de millora de la qualitat de vida. En no massa dècades vam passar de les torxes al gas i després a la llum elèctrica incandescent, neta i eficient. Podíem anar a casa de nit sentint-nos segurs, i podíem, si calia, anar tranquils a la farmàcia, al teatre o a una cita per conversar amb amics. L’enllumenat ens ho va fer tot més accessible.

Fa pocs mesos vaig assistir a una conferència d’en Kim Brostrøm sobre el Laboratori DOLL de Dinamarca. Es tracta d’un experiment realment interessant, a 15 minuts de Copenhaguen. DOLL és un veritable laboratori vivent, un barri de més d’un quilòmetre quadrat amb 12 quilòmetres de carrers i carrils bici, on hi viu gent normal. La diferència és que el barri accepta que s’hi facin experiments per comprovar la viabilitat de sistemes de gestió urbana basats en les noves tecnologies tot avaluant-los en base a les necessitats reals de la gent. Podeu llegir-ne més detalls a la seva pàgina web. Pel que fa a l’enllumenat nocturn, els responsables del laboratori DOLL creuen que és realment urgent trobar noves solucions i ho justifiquen perquè les llums del carrer consumeixen 350 Giga Watts hora cada any, només a Dinamarca. La solució que estan experimentant es basa en fanals amb llums LED que, a partir d’una certa hora (mitjanit, per exemple), baixen dràsticament la intensitat lumínica fins a un 10% o 20% de l’actual. El truc és que el sistema inclou una xarxa de sensors i un bon sistema de detecció que sap diferenciar persones i vehicles, a la vegada que no fa cas de petits objectes i animals en moviment (gats i gossos, per exemple). Quan algú entra en una determinada àrea específica, la il·luminació s’incrementa fins un nivell semblant al de la intensitat que ara tenim, però només a la zona on s’està passant. Hi ha llum on cal, i no n’hi ha on no és necessària. Tot i que pot semblar que la foscor redueix la seguretat, el que passa és justament el contrari perquè l’enllumenat s’activa automàticament sempre que algú entra de nit a la zona. Podem sortir de casa a la nit, podem anar on ens calgui sense ensopegar i fins i tot llegint el diari, i ho podem fer amb seguretat i sense desaprofitar energia. És la nova accessibilitat nocturna.

Ara fa uns quants segles, abans de la revolució industrial, viure millor era tenir més. Més terres, més or i metalls preciosos, més cases i animals. Després, i sobretot al segle XX, el progrès i la qualitat de vida van quedar associats a l’accés a l’energia. Una energia que feia possible la climatització, el transport, l’aprofitament de les hores nocturnes. El repte actual, en canvi, és el de l’accés sostenible als serveis. Perquè, un cop satisfetes les necessitats bàsiques, podem bàsicament associar qualitat de vida a facilitat d’ús dels serveis. I ara, les noves tecnologies, amb el gran ventall que inclou dels sensors a les telecomunicacions passant pels models, els algorismes i els sistemes de control, ens poden permetre el que abans era impossible: accedir a més serveis, accedir-hi millor, amb menys despesa energètica i arribant al màxim d’habitants del planeta. Tant de bo que acabem associant viure millor amb accedir, amb baix consum energètic, al que ens cal i al que ens fa feliços. A la farmàcia i a la conversa amb amics. De dia i de nit.

(La imatge de dalt, del barri del laboratori DOLL, és d’aquesta pàgina web).

Per cert, en Xavier Antich diu que donar temps a algú altre és potser la forma suprema de generositat. I diu que el temps sobretot es dona durant l’espai compartit de la conversa, perquè és el temps de l’escolta, de l’atenció, de l’entrega.

Els algorismes que aprenen

dijous, 9/02/2017

Hi ha paraules boniques que també ens fan una mica de por. Poca gent sap que la seva vida és plena d’algorismes. Alguns, quan se’n adonen, no saben si ho han d’acceptar o s’han de posar nerviosos. I el cert és que, tot i que no els reconeguem i que pensem que no ens afecten, els portem sempre al nostre costat.

Un algorisme no és més que un conjunt ordenat, finit i no ambigu de regles i operacions que permeten resoldre un problema o realitzar una determinada activitat. Els algorismes són descripcions precises de processos que fem o que fan els altres. Les instruccions per muntar un moble a partir d’un kit de peces o el full on expliquem com posar en marxa la calefacció quan marxem de casa i han de venir uns amics, són algorismes. Les receptes de cuina i les partitures musicals són algorismes per preparar menjars i interpretar melodies. I ho són les instruccions de qualsevol joc, els manuals d’usuari i els protocols que segueixen els metges als hospitals. Algunes vegades, els algorismes els podem escriure per a nosaltres mateixos, quan acabem de descobrir alguna cosa complexa que ens ha estat útil (per exemple en el nostre mòbil), i volem no oblidar-la. En altres ocasions, les escrivim per a que algú altre pugui fer més endavant quelcom que nosaltres ja sabem fer. És per això que el conjunt de regles d’un algorisme ha de ser no ambigu: si no l’escrivim bé, la persona que vingui a casa no entendrà com engegar el rentaplats o com posar en marxa la calefacció.

Espero no guanyar-me el mot de “friqui” si confesso que m’agrada la paraula “algorisme”. Tal vegada perquè ha estat al meu costat durant quasi cinquanta anys, i perquè ve de molt lluny. Concretament d’ara fa 1.150 anys, quan al-Khwarazmí treballava a l’observatori de Bagdad. Durant els segles de l’edat mitjana, al-Khwarazmí va ser la principal font de transmissió de coneixements matemàtics de l’Orient a l’Occident, en part en base a les traduccions de textos en grec, llatí i sànscrit que es feien a la Casa de la Saviesa. En el seu tractat d’àlgebra, “Hissab al-jabr wa-l-muqàbala“, explicava regles i receptes (o sigui, algorismes) per repartir herències, cosa que en aquell temps i en el món àrab era molt complicada i requeria fer molts càlculs. En un altre llibre, “Sobre el càlcul amb nombres indis”, llibre del que només se’n conserva una traducció del segle XII, al-Khwarazmí va explicar, sembla que per primera vegada, el sistema de numeració posicional en base 10 (incloent el zero) que va aprendre de l’Índia i que és el que ara utilitzem. Fa més de 11 segles, al-Khwarazmí ens va deixar llibres meravellosos, tots plens d’algorismes. És per això que els algorismes porten el seu nom.

Quan sumem nombres portant-ne, estem aplicant l’algorisme que vam aprendre a l’escola; i, quan multipliquem, també. Euclides ens va deixar un algorisme molt elegant per calcular el màxim comú denominador de dos nombres, i Pitàgores ens va explicar l’algorisme per calcular hipotenuses i distàncies entre punts. Després, amb els ordinadors, hem acabat tenint algorismes per tot. Perquè els ordinadors i els telèfons mòbils només funcionen en base als algorismes que alguns programadors els han preparat. Totes les aplicacions que ens hem baixat als nostres mòbils són algorismes. Tenim algorismes per millorar fotos, per cercar informació a internet, per saber la posició dels astres i per preveure el temps que farà demà. Tenim algorismes que ens troben el nom de les músiques que escoltem, i algorismes que saben traduir textos d’un idioma a un altre.

I ara, el que hem començat a veure fa pocs anys són algorismes que es van refinant amb les dades. Són algorismes que aprenen, algorismes que conformen els mecanismes d’aprenentatge automàtic que es troben en el nucli de l’anomenat “big data“. Hi ha moltíssims exemples, un dels quals, molt il·lustratiu, el teniu en aquest document (que és un pòster científic presentat ara fa uns mesos; com podeu observar, la imatge de dalt és d’aquest mateix document). Es tracta d’un algorisme que, a partir d’una gravació de vídeo de 15 segons en la que s’ens demana que expliquem qui som, fa una valoració de la nostra personalitat en cinc eixos diferents, i ens ho mostra amb 5 bandes verdes (les que veieu a la dreta de la imatge) al cap de menys de tres segons. Aquests cinc eixos són els de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Com ho fa? Doncs amb un algorisme que conté dues xarxes neuronals de 17 nivells, una per la senyal de vídeo i l’altra per la d’àudio, amb un darrer nivell de fusió de les dues, com bé podeu veure a la figure 3 del document. Cada un dels 17 nivells d’una i altra xarxa combina adequadament els resultats del nivell anterior i genera una sortida que transmet a algun o alguns dels nivells següents. Cada nivell és com una taula de mescles de so, però digital. Barreja les entrades per tal de produir el senyal de sortida. En resum, fem 17+17+1 mescles, i acabem trobant els trets de personalitat de la persona que ha estat parlant durant 15 segons al vídeo. Però, com fem aquestes mescles? Com ajustem la importància que donarem a cada un dels valors d’entrada a cada una de les mescles? Com ajustem el valor de cada un dels “potenciòmetres” de la nostra xarxa neuronal?. En el cas de l’article que comento, això es va fer amb un sistema d’aprenentatge dirigit. Amb anterioritat als experiments, els autors, amb l’ajut de molts voluntaris, van analitzar deu mil vídeos de 15 segons de YouTube. Cada voluntari, a cada prova, presenciava una parella de vídeos (corresponents a dues persones) i després havia de dir quina de les dues persones creia que era la més curiosa, quina la més extravertida, .. i així fins analitzar el cinquè eix de neuroticisme. Cal observar que no es demanava cap valoració, únicament havien de comparar la parella de persones que estaven veient. Això es va fer així perquè és ben conegut que les comparacions les fem molt millor que les valoracions. Doncs bé, la informació d’aquests experiments amb 10.000 vídeos és la que va permetre ensinistrar els  mescladors dels 17+17+1 nivells de l’algorisme i ajustar els seus valors. Però això no va acabar aquí. L’interessant és que l’algorisme va continuar i continua aprenent, perquè quan el sistema ja estava ajustat i “trained” (mireu la imatge de dalt), l’anàlisi del vídeo de cada nova persona que vol experimentar aquesta aplicació i que dona la corresponent autorització per usar les seves dades, serveix per acabar d’ajustar una mica més els paràmetres de tots els nivells de la xarxa neuronal. El sistema va aprenent cada dia, i cada persona que l’utilitza l’ajuda a fer-ho. Només cal que digui si creu que el resultat que li mostra la màquina reflexa la seva personalitat o no, perquè això és l’únic que necessita la xarxa neuronal per auto-refinar-se.

Per bé o per mal (esperem que per bé), els algorismes que aprenen han arribat, i han vingut per quedar-se amb nosaltres. Ens poden ser molt útils, però no hem de perdre mai de vista la necessitat de la seva regulació ni els aspectes ètics. Els algorismes són aquí, però la responsabilitat sempre serà de les persones que els utilitzen.

Per cert, en Christophe Galfard diu que sense una visió científica, la democràcia es torna més complicada. També diu que la humanitat no és conscient del seu lloc a l’Univers, que només ara ho estem començant a entreveure.

El rellotge dels 10.000 anys

dijous, 5/01/2017

Els acords de llarga durada són sans i desitjables. Però segurament hi ha moltes més coses que podríem fer amb visió serena i a llarg termini. Sense anar més lluny, la Fundació “Long Now es proposa fomentar el pensament a llarg termini en el context dels propers 100 segles. El seu objectiu és oferir un contrapunt a la visió actual de “més ràpid i més barat”, en base a fomentar la responsabilitat i promoure el pensament “més lent i millor”. En el context d’aquest pensament a llarg termini, la Fundació utilitza dates de 5 dígits i diu que som a l’any 02017, per exemple.

L’inventor d’aquest rellotge dels cent segles, que és també un dels fundadors de Long Now, és en Danny Hillis. En Danny va presentar les seves idees ja fa més de vint anys, l’any 01995. En una declaració òbviament optimista deia que, tenint en compte que l’edat de la nostra civilització és de deu mil anys, aquest rellotge suposa el repte de no extingir-nos durant uns altres 10.000 anys, durant els quals caldrà que els nostres descendents sàpiguen tenir cura d’ells mateixos i del rellotge.

El rellotge està dissenyat amb materials resistents i estables que inclouen el titani a més del quars, boles de ceràmica per als coixinets i acer inoxidable marí amb un alt percentatge de molibdè. Es muntarà en un pou artificial vertical de 150 metres que està sent excavat en una muntanya de l’estat de Texas. És un rellotge clàssic, mecànic, però molt sofisticat. El seu pèndol de titani, amb un període de 10 segons, oscil·larà lentament impulsat per un típic mecanisme d’escapament i amb l’energia subministrada per un gran pes de pedra. Els dissenyadors han fet ja un prototip a escala reduïda, que es pot veure al museu de la ciència de Londres. El teniu a la imatge de dalt, que he obtingut d’aquest pdf. Però, qui i com donarà corda al rellotge? La resposta és que l’energia que necessita per funcionar la obtindrà en part dels visitants i en part del Sol. Els que vulguin visitar el rellotge es trobaran amb un molinet horitzontal, com el de l’àncora d’un vaixell però més gran. Com podeu veure al vídeo d’aquesta web, el gir del molinet farà girar el cabrestant del rellotge i aixecarà els pesos de pedra. Això sí, caldrà la força de dos o tres visitants. Quan no hi hagi visitants, el rellotge obtindrà l’energia a partir de les diferències de temperatura entre dia i nit. La llum solar entrarà per una finestra de safir orientada cap al sud situada dalt de la muntanya, i escalfarà una càmera d’aire que acabarà fent girar un cilindre de grafit. Aquest sistema subministrarà energia suficient per mantenir el pèndol en moviment, i a més servirà per corregir l’hora del rellotge a partir de la posició del Sol al migdia. Trobareu més detalls en aquest article científic. Tot està pensat per a que el rellotge pugui funcionar durant anys sense cap visitant i fins i tot sense llum solar. Si alguna erupció volcànica acabés amagant el Sol durant mesos o anys, la variació de temperatura entre dia i nit seria suficient per mantenir-lo en moviment.

Els visitants entraran a la gran cambra del rellotge, foradada a la muntanya, i hauran de començar a pujar. Després de passar els pesos de pedra, arribaran al molinet horitzontal per donar-li corda. A continuació, veuran 20 enormes rodes horitzontals amb enginyosos mecanismes de creu de Malta, que calcularan i tocaran més de 3,5 milions de melodies, totes diferents, al llarg dels segles. Una cada dia, al migdia, però només els dies que hi hagi visitants (perquè les campanes necessiten l’energia del molinet; el pèndol en té prou amb l’energia dels canvis tèrmics entre dia i nit, però no el mecanisme de tocar les campanes). Les campanades mai es repetiran, de manera que l’experiència de cada visitant serà única. El rellotge “calcularà” les melodies amb aquest sistema mecànic de ranures i passadors lliscants. De manera similar a la màquina diferencial de Babbage, generarà cada dia una seqüència diferent per a les deu campanes. Tot sense electricitat i sense energia externa. En Danny Hillis diu, ben cofoi, que aquest rellotge serà l’ordinador més lent del món. Mireu l’animació de les creus de Malta d’aquesta pàgina web. Oi que té el seu encant?

El rellotge també incorpora un sofisticat sistema per posar-se en hora automàticament, i treballa amb 5 temps diferents. El temps del pèndol és el que surt de comptar les seves oscil·lacions, i avança un pas cada 5 minuts (30 oscil·lacions de pèndol). El temps solar sense corregir es trobarà moodificant el temps del pèndol en base a l’equació del temps, mentre que el temps solar corregit tindrà en compte la posició del Sol al migdia. Aquest temps només es podrà obtenir els dies solejats; els altres dies, el sistema anirà emmagatzemant les correccions pendents, que seran recuperades i aplicades quan torni a sortir el Sol. Després tenim el temps solar mostrat, que només s’activarà i calcularà quan hi hagi visitants que donin corda al rellotge fent girar el seu molinet. Aquest temps solar mostrat inclou un calendari Gregorià que indicarà la data de la visita. Finalment, el temps planetari incorporarà una correcció per tenir en compte la reducció de la velocitat de rotació de la Terra, i ho farà amb una lleva que representarà i codificarà la funció quadràtica de correcció en la seva pròpia forma. El temps planetari és el que permetrà la visualització, cada cop que algú entri a mirar-ho, de la posició de tots els astres del sistema solar en aquell moment.

M’agrada aquesta idea del pensament a llarg termini, del pensament “lent i millor” que promou la Fundació Long Now. El fet de construir objectes i ginys de llarga durada és tot un repte, pels que els construeixen i per tots aquells que s’hauran de plantejar si en tenen cura o es fan responsables, davant els seus descendents, de la seva destrucció. Jo diria que ja ara tenim dos mons que conviuen. El món frenètic de la immediatesa, de la velocitat i de fer el màxim de coses en poc temps, i el món tranquil del pensament assossegat i creatiu. Són dues maneres de gestionar el temps. Dia a dia ens toca escollir quina adoptem. Però hem de ser ben conscients d’una cosa: la creativitat està renyida amb les presses i amb la visió a curt termini, perquè és ben conegut que les idees ens venen quan pensem lentament i sense angoixa. És el que ens expliquen els membres de la fundació Long Now. Aquest telèfon mòbil que portem a la butxaca i amb el que enviem centenars de missatges ràpids cada dia, existeix perquè moltes persones van estar pensant i donant voltes durant hores i hores, capficats en infinits problemes científics i tecnològics que ja no valorem. Van tenir temps, van tenir idees, van ser creatius, i ara en gaudim. Per això és bonic que, davant un món que pensa bàsicament en comprar, vendre, especular i enriquir-se el més ràpid possible, els responsables del projecte del rellotge dels deu mil anys ens expliquin que no tenen cap pressa: l’estan pensant pels nostres néts i pels besnéts dels nostres besnéts.

Per cert, en aquest context de treball tranquil i de llarga durada, els responsables de la construcció del rellotge diuen que no tenen cap data de finalització prevista. Pensen obrir al públic el seu rellotge dels cent segles una vegada estigui llest i acabat.