Entrades amb l'etiqueta ‘Ferran Requejo’

Mentiders i xerraires

dijous, 20/07/2017

La revista National Geographic ha publicat un article amb diferents estudis científics sobre la nostre condició de mentiders i sobre la nostra relació, complexa, amb allò que és objectiu. Gràcies als experiments dels darrers anys, hem pogut saber que el fet de mentir és part del nostre desenvolupament, com caminar o parlar: els nens comencen a mentir entre els 2 i els 5 anys, quan el seu desenvolupament mental ja els ho permet. De fet, el fàcil és dir la veritat, però mentir requereix en canvi un bon grau d’agudesa i flexibilitat mental, segons explica el psicòleg Bruno Verschuere a l’article.

La imatge, que podeu trobar a la web de l’article, mostra els resultats d’un estudi sobre quantes mentides diem cada dia. Per cada franja d’edat podeu veure en gris el percentatge de persones que, de mitjana, en diuen entre una i cinc, i, en negre, el percentatge de les que en diuen més de 5 en mitjana. La gent gran no és lluny dels més petits (34% i 29% a la franja grisa), mentre que el pic més significatiu és entre els 13 i els 17 anys. En aquesta franja d’edat, les tres quartes parts dels joves menteixen una o més vegades cada dia. Sembla que quan estem configurant la nostra independència, mentim més. De fet, i segons l’estudi, mentim per causes molt i molt diferents. Ho fem per evitar estar amb gent amb qui no tenim ganes de parlar, per mostrar una imatge ideal de nosaltres mateixos, també per ajudar als altres o per fer-los riure, per tapar errors o coses que hem fet de mala fe, per guanyar més diners, per augmentar el nostre prestigi personal, per a ser ben educats, i per moltes més raons.

El professor Kang Lee, de la Universitat de Toronto, va preparar un experiment molt enginyós per estudiar les mentides dels més petits. Feia entrar un nen al despatx, li mostrava una capsa, i li deia que sentiria una música. Amb la seva tonada, hauria d’endevinar què hi havia a la capsa. Un cop endevinat (o no), repetirien el mateix dues o tres vegades més, amb altres capses i tonades. Les dues primeres eren molt fàcils: s’escoltava un gos bordant, i a la capsa hi havia un gos de peluix; el nen escoltava el so d’un gat miolant, i ràpidament encertava que el que hi havia a la capsa era un gat de peluix. Però el tercer experiment era una trampa, i la música no tenia cap relació amb el que hi havia a la capsa. Per exemple, uns compassos de Beethoven, i a la capsa hi havia un cotxe de joguina. En aquest cas, just després de sentir la musica, al professor li sonava el mòbil, i s’excusava, i sortia del despatx un minut. Això sí, abans de sortir li deia al nen: “pensa, però no miris dins la capsa, d’acord?”. En tornar, li feia dues preguntes: “què creus que hi ha a la capsa?” i “has mirat, o no?”. Val a dir que una càmera oculta havia enregistrat allò que el nen havia fet. Després de repetir l’experiment amb molts nens, el resultat va ser molt interessant: el 30% dels nens de dos anys va mentir, mentre que aquest percentatge va ser del 50% en el grup de nens de tres anys, i del 80% en els de 8 anys. Quasi tots els grans van negar allò que havien fet: havien obert la capsa.

Un altre experiment, fet per en Dan Ariely de la Universitat de Duke amb un grup d’adults, va consistir a demanar que resolguessin 20 problemes senzills. Se’ls deia que cobrarien una petita quantitat de diners per cada resposta encertada. Havien de resoldre els problemes en el mateix full dels enunciats; en acabar, se’ls mostraven les solucions correctes per a que corregissin ells mateixos les seves respostes. Després, se’ls demanava que llencessin el full a la paperera; quan sortien, només havien de recordar el nombre de respostes correctes i cobraven en base al que deien. El truc, en aquest cas, estava en què els fulls estaven marcats. Els experimentadors, al final, recollien tots els fulls i podien estudiar, en cada cas, el que havia dit la persona en relació al seu nombre real de respostes correctes. La mitjana de respostes correctes va ser de 4, mentre que la mitjana del que van afirmar en sortir va ser de 6. Ara bé, el més interessant va venir a la segona fase de l’experiment. El van repetir amb un grup diferent de persones triades a l’atzar, però incrementant la quantitat de diners que rebrien per cada resposta encertada, i el nivell de mentides no es va incrementar: 4 respostes correctes de mitjana, 6 respostes manifestades pels participants a la sortida. Alguna cosa ens para i no ens deixa mentir més. Mentim, però amb moderació. La hipòtesi de Dan Ariely és que l’honestedat és un fet cultural. Volem transmetre una imatge de persones honestes.

L’opinió de Tim Levine (Universitat d’Alabama a Birmingham) i d’en Robert Feldman (de la Universitat de Massachusetts), expressada a l’article, és que tot el coneixement que usem per moure’ns pel món es basa en pensar que el que veiem, llegim i escoltem, és cert. Molt del nostre coneixement ve del que ens diuen, i sense aquesta confiança implícita que tenim en la comunicació amb els altres, ens acabaríem malfiant de tothom i no podríem fer res. Si algú ens truca i ens diu que és del servei de correus, ens ho creiem. La gent no espera mentides, ni està pensant tota la estona que el que li diuen és fals. És interessant: tot funciona gràcies a que mantenim un nivell “raonablement baix” de mentides, un nivell que sabem tenir sota control.

Una altra cosa interessant és que ens agrada escoltar mentides que concorden amb les nostres conviccions. Escoltem bàsicament el que volem escoltar i, si ens diuen alguna cosa que no lliga amb els nostres esquemes mentals, tendim a ignorar-ho, ridiculitzar-ho, o fins i tot atacar-ho. Moltes vegades preferim no tenir-ho en compte, encara que siguin fets demostrats. Ho ha vist la Briony Swire-Thompson durant els seu treball de tesi doctoral a la Universitat de Perth a Austràlia. En un estudi fet amb uns dos mil ciutadans nord-americans, la majoria dels qui pensen que les vacunes causen autisme acaben acceptant que no és cert quan se’ls mostren proves científiques que constaten que aquesta relació de causalitat és falsa. Però al cap d’una setmana, si se’ls pregunta, tornen a manifestar que estan ben segurs que la relació és certa.

Som mentiders, però a més no podem deixar de parlar. En Ferran Requejo ho explica molt bé. Diu que som intrínsecament xerraires, i que constantment estem proposant ficcions a través de llenguatges que hem inventat i en els quals dipositem una confiança descriptiva digna de millor causa. Anem pel món embriagats de paraules. No captem més que una part molt petita de la realitat, i ho fem a la nostra manera. Això sí: com els borratxos, creiem que tenim una gran clarividència sobre el món que ens envolta i estem segurs que el captem fins i tot en els seus sofisticats matisos interiors. Però de fet, el que fem és xerrar i mentir-nos.

Per cert, la Najat el Hachmi parla d’alliberament, de “la veritat” i del que no ho és. Diu que quan escolta coses com “l’islam vertader”, se li posen els pèls de punta. I parla del perill que les dones reivindiquin els seus drets sense voler sortir dels límits de la religió. Perquè això, diu, és una trampa molt perillosa.

Les nostres metadades

divendres, 12/05/2017

En Ferran Requejo diu que som cecs i sords però ebris de paraules; que som intrínsecament xerraires i que constantment inventem ficcions que ens acabem creient i que fins i tot defensem. El cert és que cada dia generem moltíssima informació que acaba circulant per la xarxa. Trucades telefòniques, missatges de text, missatges d’àudio, fotos i vídeos. No parem d’explicar-nos coses i de compartir informació. Segurament, podríem passar amb molt menys. És informació, són dades que moltes vegades considerem privades i que no voldríem que ningú en pogués fer ús sense el nostre permís.

Però a més de dades, generem una gran quantitat de metadades. El que ens diem per telèfon o quan ens enviem missatges són dades; en canvi, la informació que hem trucat a tal persona el dia X i que hi hem estat parlant durant 9 minuts és una metadada, de la mateixa manera que ho és el fet d’haver-li enviat un whattsapp. Les dades són el què, les metadades són el quan, el com i el on ho hem fet. Les cerques per internet, les compres amb targeta, els llocs per on anem amb el mòbil, el lloc on el deixem tota la nit, són metadades. L’ús d’aquestes metadades és encara molt poc regulat, i, com sempre, hi ha empreses que les utilitzen per a fer negoci.

En Paul Wood comenta, en aquest article, un exemple ben recent del que es pot arribar a fer amb tota aquesta informació. Es tracta de la passada campanya electoral als Estats Units. Parla de la doble personalitat de Donald Trump i del que anava fent a l’ombra dels seus comentaris destralers i dels seus tuits. Concretament, al juny del 2016, en Trump va negociar amb l’empresa anglesa Cambridge Analytica un contracte milionari per esbrinar, en base a l’anàlisi de metadades, què era el més probable que acabés votant cada ciutadà dels EEUU a les eleccions presidencials. L’estratègia es va basar en connectar dos estudis independents, el primer dels quals va analitzar la personalitat de més d’un milió de ciutadans. Això es va fer en base a les seves respostes a petites enquestes telefòniques, per internet, o al que contestaven qüestionaris d’enquestadors que els aturaven durant les seves compres en grans superfícies comercials dels Estats Units. Amb algorismes d’aprenentatge similars a altres que actualment s’estan estudiant, van poder fer una valoració de la personalitat de tots i cada un d’ells en cinc eixos diferents: el de la curiositat (gent inventiva i curiosa versus gent cautelosa), escrupolositat (gent eficient i organitzada versus gent descurada i desordenada), extraversió (gent extravertida i energètica versus gent reservada i solitària), agradabilitat (gent amigable i compassiva versus gent poc social) i neuroticisme (gent neuròtica versus gent fiable). Al final, Cambridge Analytica va acabar tenint una estimació dels trets de personalitat de més d’un milió de persones, quantificats en base al valor d’aquests 5 eixos ja mencionats.

Però això no és tot. Cambridge Analytica també va acabar disposant d’informació sobre tots i cada un dels 230 milions de potencials electors als Estats Units. De cada un d’ells, va poder aconseguir un total d’entre 4.000 i 5.000 dades: edat, gènere, on viu, on treballa, on va els caps de setmana, si surt o no a les nits, què menja, quins diaris i revistes compra, quins programes de tele mira, quin cotxe condueix, i moltes més coses. Dades i metadades que, un cop recollides dia a dia, ens defineixen i classifiquen fins convertir-nos en un punt dins un immens espai de maneres de ser i fer. Hi ha empreses que ens tenen fitxats. En Paul Wood reconeix que tot plegat és impressionant i fa por: Cambridge Analytica les té a la venda, en una operació comercial que, en paraules seves, converteix dades en or.

A partir d’aquests dos estudis, el repte era aconseguir fer una estimació de la tendència política de cada ciutadà. Cambridge Analytica es va basar en dues hipòtesis que van resultar certes: que hi havia correlació entre el que comprem i fem cada dia i els trets de la nostra personalitat, i que també hi havia correlació entre aquests trets de personalitat i la nostra tendència electoral. En altres paraules, els que fan coses similars i tenen hàbits semblants (i es troben representats per punts propers), tenen personalitats similars; a més, els trets de la personalitat ajuden a predir el comportament i a saber si ens agrada més el vi o la cervesa i si pensem votar el candidat A o el B. Amb l’ajut d’aquestes dues correlacions, els de Cambridge Analytica van poder fer una estimació del valor dels 5 eixos de personalitat per tots els 230 milions de potencials votants, i, en un segon pas, deduir quin candidat era el preferit de cada un d’ells.

La conseqüència de tot l’anterior és que es va poder actuar amb propaganda electoral “micro-dirigida” a cada petit grup i a cada persona concreta. El missatge, enviat a través de correus electrònics o amb voluntaris que feien el porta-porta, era sobretot dirigit a les persones indecises, i a cada una d’elles se li explicava justament el que ella desitjava escoltar. No hi havia un únic programa polític, només publicitat per convèncer la gent. Tot era “a gust del consumidor”. Qui estava preocupat pels llocs de treball rebia missatges que deien que tota la situació laboral milloraria, qui era partidari de les armes de foc es trobava amb cartes que parlaven de la necessitat de preservar-les, qui tenia por del terrorisme rebia informacions sobre la importància de fer fora els musulmans i estrangers.

Només va caldre treballar amb les dues correlacions ja mencionades. La de les dades de cada persona amb el seu perfil de personalitat, i la d’aquest perfil amb el comportament electoral. Evidentment el resultat no és exacte, i el sistema es pot equivocar, enviant cartes inadequades a molta gent. Però estadísticament funciona, perquè la doble correlació fa que la probabilitat d’encertar sigui molt més elevada que la d’enviar cartes que no serveixen. La conclusió, molt preocupant, és que una empresa ha sabut com fer-s’ho per enviar missatges individualitzats de publicitat electoral, i que hem acabat veient que ha aconseguit el que volia.

En Paul Wood cita en Jill Lepore, especialista en historia dels processos electorals a la Universitat de Harvard, que reconeix que els sistemes tradicionals de votació poden ser poc fiables, però que la ciència de les dades pot ser encara molt més perjudicial. No només els missatges actuals dels polítics acaben sent dictats pels seus consultors amb l’únic objectiu de guanyar vots, sino que ara, a més, a cada votant se li diu el que vol escoltar. És el que diu la imatge de dalt, que he tret d’aquesta pàgina web. Moltes vegades no és que ens venguin alguna cosa: el que passa és que ens estan venent a nosaltres mateixos. Nosaltres som el producte…

Per cert, l’Adrià Rocha Cutiller diu que Facebook, Google i Amazon ho saben tot de nosaltres i que fan “el negoci de la nostra vida”. Saben amb qui parlem, on som, cap on anem, qui som i qui ens agradaria ser. I que ho saben perquè els ho diem. Diu que Facebook acumula, juntament amb Google, el 50% de tota la inversió publicitària mundial.

Som un nyap meravellós

dimecres, 15/06/2016

Un dels temes que investiga el grup de neurologia i medicina cel·lular del professor Takao Hensch, a Harward, és el desenvolupament del cervell dels infants. Fa poc, en un article a la revista Scientific American, Hensch explicava que el cervell dels nens i adolescents evoluciona a salts, durant determinats períodes “crítics” en els quals hi ha un fort increment de la plasticitat cerebral. En aquests períodes, les connexions neuronals són molt més flexibles i s’adapten i configuren en funció dels estímuls sensorials. El més interessant és que han trobat un neurotransmissor, generat per neurones del tipus paralbúmina-positiva, que sembla que és el que controla tot el procés. En d’altres paraules, tot depèn de la concentració d’un determinat component químic: l’àcid gamma-aminobutíric. A les proves que han fet amb ratolins, han vist que quan incrementen la concentració d’aquest àcid, el cervell obre les portes de la plasticitat, entra en període crític i esdevé configurable. Quan es redueix la seva concentració, es tanca el període crític i el cervell torna al seu estat habitual de plasticitat. Takao Hensch acaba dient que això pot permetre, en un futur, disposar de medicaments que permetin reiniciar períodes crítics en persones adultes. Obrir un període crític pot ser una mica com “tornar a començar”, perquè durant aquest període el cervell farà neteja de records i traumes mentre es reconfigura en base a les noves experiències. Pot servir per corregir problemes neuronals i de comportament, però ja es veu que entrem en un terreny relliscós. Hensch diu explícitament que el perill d’obrir un període crític durant l’edat adulta és que acabi erosionant la pròpia experiència del Jo.

Poc després, en Prevesh Rustagi, psiquiatra de Nebraska, va escriure un comentari a la mateixa revista. Opinava que el fet de reduir i minar la pròpia experiència del Jo no tenia perquè ser quelcom de negatiu. Deia que el nostre Ego no és més que una construcció humana arbitrària i sobrevalorada a la que altres cultures com la budista donen molta menys importància.

Vaig recordar tot això quan fa pocs dies llegia l’article d’en Ferran Requejo, que ens defineix com cecs, sords i ebris de paraules. En Ferran Requejo explica que tenim un cervell establert en diverses etapes evolutives que reaccionen de manera diferent als estímuls i que sovint entren en conflicte . Sabem que la part racional sovint no és la més eficient en el moment de prendre decisions, i que la lògica i les matemàtiques acostumen a suposar dificultats greus per a una majoria dels irònicament autoanomenats sapiens. Pensa que potser això explica que els humans puguem ser tan sofisticats en el moment de crear simfonies o elaborades teories científiques i filosòfiques, mentre som tan crèduls en relació a les surrealistes ficcions que proposen les religions o altres tipus d’ideologies. Diu que resulta ben fàcil enganyar els humans i que la creativitat humana corre paral·lela a la seva inherent i repetida estupidesa: som intrínsecament xerraires i constantment inventem ficcions que ens acabem creient i que fins i tot defensem com explicacions del món.

Tot plegat és ben sorprenent. Els nostres sentits són deficients, i ho sabem. Hi ha animals que senten, veuen i oloren millor que nosaltres. El que ens arriba és només una part ínfima de la realitat, que mai sabrem copsar i conèixer. I a més, el nostre cervell és essencialment pobre a l’hora de processar aquests limitats estímuls perceptius. Això no és dolent, perquè l’evolució ens ha regalat el savi equilibri entre complexitat cerebral i despesa energètica: el cervell que tenim, l’òrgan del nostre cos que més energia requereix, no cal que sigui més complicat perquè el que tenim ja ens permet viure i fer volar coloms. Però és clar que som éssers racionals ineficients, que divaguem la major part del temps, que oblidem les coses i que ens costa baixar de la figuera. Això sí, no parem de xerrar. Inventem i expliquem histories que ens acabem creient, i fem interpretacions que defensem aferrissadament com a certes.

L’article d’en Ferran Requejo, a cavall entre la filosofia i la ciència, és un antídot contra la vanitat i contra la temptació de pensar que som els reis del món i que hem estat fets a imatge i semblança dels déus. Per això, les idees de Takao Hensch matisades per Prevesh Rustagi ens poden obrir una escletxa d’esperança. Us imagineu un futur on la gent pugui fer tractaments de neteja cerebral que obrin, controladament, nous períodes crítics? Si tot plegat s’aconsegueix controlar bé, pot ser una mena de reencarnació en el nostre propi cos i una poda de la vanitat i de l’Ego que hem anat acumulant durant la nostra vida. Clar que, si no ens volem arriscar, podem pensar en solucions més assequibles. Perquè, com diuen tant en Hensch com en Rustagi, la meditació incrementa la plasticitat cerebral i d’alguna manera ens apropa als períodes crítics.

Un darrer apunt: en Ferran Requejo pensa que en relació a la realitat, incloent-hi la nostra i a pesar de l’importants que creiem que som, no deixarem mai de ser nens. Uns nens que disposen d’un cervell que és un nyap evolutiu meravellós, diu.

———

Per cert, la Sílvia Soler ens recorda la Tatiana Sisquella, i ho fa amb les seves paraules: De tant en tant, ara mateix potser, busqueu un instant lleuger; poseu-hi tota la vostra atenció i gaudiu-lo. Quan acabeu, ja continuareu i, si ha funcionat, alguna cosa haurà canviat, possiblement a millor.

El nostre rèptil

divendres, 18/12/2015

Entendre el passat llunyà no és pas fàcil. Quasi tot s’ha perdut. Hem trobat proves que confirmen que els nostres avantpassats ja utilitzaven el foc fa més d’un milió d’anys, però en canvi sabem ben poc de com vivia la gent abans del neolític, fa només deu mil anys. Hem recuperat algunes de les seves eines de pedra, però desconeixem com treballaven la fusta, les fibres vegetals i altres materials caducs.

Els astrònoms, en canvi, tenen una altra perspectiva. Carl Sagan, com cita la Núria Barrios, deia que els estels ens porten a un passat antiquíssim. La llum dels puntets que veiem al cel de les nits estrellades va iniciar el seu viatge cap a nosaltres fa molts i molts d’anys. En alguns casos, veiem llum que els estels van emetre abans que es formés el nostre planeta; en d’altres casos, veiem llum d’estels fantasmes que ja han mort, encara que ni ho sabem ni ho podem saber. El cel de nit és un viatge al passat. Els telescopis ens expliquen (i ens explicaran molt més en el futur) què va passar fa molts i molts anys a diferents indrets de l’Univers. Sabrem més dels nostres orígens, perquè el que va passar aquí no és massa diferent del que va passar a altres racons de l’Univers.

I què ens diuen de tot això, els paleontòlegs? Doncs en Neil Shubin, per exemple, diu que a més de mirar els estels, és molt instructiu mirar dins nostre perquè tots vam ser rèptils. En el seu darrer llibre, Neil Shubin explica que el nostre cos és una càpsula del temps. Càpsula que, si la obrim i la sabem llegir, ens parla de tota la història de la vida a la Terra i dels oceans i boscos de fa milions d’anys. Portem gens de microbis, d’insectes, de rèptils i el rastre de tota l’evolució. Dins nostre podem trobar restes dels mecanismes vitals de peixos i animals de fa milions d’anys. Senyals de quan vam ser peixos.

Justament fa pocs dies vaig llegir un article exquisit d’en Ramon Folch sobre la democràcia i els nostres comportaments atàvics. Parlava de gats, gossos i primats. Deia que els gats són esperits lliures, però que no tenen amics. Els gossos, en canvi, presenten sempre un comportament coral, respecten l’ordre jeràrquic en la seva manada i són lleials per naturalesa. En Ramon Folch considera que és per això que el gos va ser amansit fa mil.lennis fins convertir-se en l’encarnació de la fidelitat. Diu que et pots refiar del teu gos: se li pot retreure la submissió, però se li ha de lloar la noblesa. Els pitjors mamífers, en canvi, són els primats: són agressius, caragirats i traïdors, diu. Els pitjors quan els mesurem segons els nostres valors humans, és clar. Tot plegat no deixa de ser sorprenent, perquè els humans som primats.

En Folch explica que la democràcia és impensable entre els gats, funcionaria molt bé en una societat canina i ha de ser necessàriament defectuosa en col·lectius de primats, humans inclosos. L’experiència ho corrobora. No som un orgue de gats, però quasi. Quan tenim por, quan ens fan creure que hem de tenir por, ens surt el comportament atàvic del gat i del rèptil que portem dins i ens apuntem a la violència de reacció ràpida. Davant la por, volem atacar o desitgem que altres ataquin en nom nostre.

Però hi ha un detall. Els humans som els únics que sabem que portem un rèptil dins nostre. Som els únics que podem raonar i adonar-nos que la democràcia i la defensa dels drets humans no coincideix amb les característiques atàviques de la nostra espècie. Som davant d’una gran paradoxa: constantment hem d’escollir entre els valors que hem anat construint i el nostre instint de primats. Ramon Folch acaba dient que només una forta contrariació de les inclinacions humanes per via de l’educació fa possible el triomf dels valors democràtics, perquè sense educació a fons, la democràcia pot acabar essent una paròdia representada per una espècie egoista i tramposa que ve dels rèptils.

Per cert, en Ferran Requejo diu que la caverna en la qual vivim és molt més profunda que la imaginada per Plató: no és que només captem aparences de la realitat, sinó que tota la realitat és tal vegada aparent.

La informació elàstica i els detectors de còpies

dimecres, 25/02/2015

La informació digital es pot comprimir i enviar per internet o guardar de manera que ocupi i “pesi” menys. Després, quan volem recuperar-la, només hem de descomprimir-la com si traguéssim l’esponja que guardem ben premuda en una caixeta. Els algorismes de compressió són ben corrents, avui en dia. Quan mirem fotos en format .jpg o .jpeg estem veient imatges comprimides, i quan mirem vídeos de YouTube estem utilitzant versions molt compactes, de menor qualitat que els originals. Però els sistemes de compressió de les fotos i vídeos eliminen informació. A partir d’una imatge comprimida en .jpg mai podrem recuperar la qualitat original. Quan reduïm i simplifiquem, perdem informació, com quan resumim un llibre. Estem retallant trossos i quedant-nos amb el més significatiu. Els anglesos diuen que en aquests casos, estem fent una compressió “lossy“. Hi ha altres algorismes, en canvi, que saben comprimir sense perdre informació. Son els algorismes “lossless“, en terminologia anglosaxona. En aquest cas podem parlar d’informació elàstica. La comprimim i la fem petita per a guardar-la o enviar-la. Però en qualsevol moment podem descomprimir-la i recuperar-la amb tots els seus detalls originals. És el que fem quan comprimim un o més fitxers i els deixem, per exemple, en format .zip o en formats com el que podeu veure a la nota del final. És fonamental que aquests sistemes puguin recuperar els documents originals sense pèrdua d’informació, perquè en cas contrari degradarien els nostres texts i no ens servirien de res.

Sabíeu que, en menys d’un minut i amb les eines clàssiques de compressió de fitxers que tenim a tots els ordinadors, podem calcular la probabilitat que un text hagi estat parcialment copiat d’un altre? Ho podem fer gràcies a Kolmogorov, que ens va ensenyar que la informació no sols és elàstica sinó que, analitzant la seva elasticitat, podem mesurar si és molt o poc complexa.

Andrei Kolmogorov va néixer a Tambov l’any 1903. Va estudiar a la Universitat Estatal de Moscou i ben aviat va proposar la seva teoria de la complexitat algorísmica. La idea és ben senzilla: de manera intuïtiva, Kolmogorov ens diu que una determinada informació és senzilla o poc complexa si es pot explicar amb poques paraules, i que en canvi té una complexitat elevada si és difícil d’explicar-la. Mireu els dos requadres de la imatge. El de l’esquerra es pot descriure dient que representa “quatre per quatre quadrats vermells”. En canvi, per descriure de manera precisa el de la dreta i explicar el dibuix que formen els quadrats vermells i grocs, calen molt més de cinc paraules. En d’altres paraules: la complexitat de Kolmogorov del requadre de l’esquerra és més baixa que la del de la dreta. A les primeres pàgines d’aquest article trobareu més exemples del mateix.

Si tinguéssim el millor sistema possible de compressió elàstica (sense pèrdua d’informació), es fàcil veure que el seu grau de compressió ens donaria la complexitat de Kolmogorov de qualsevol document, imatge o vídeo. Això és així perquè no hi ha millor manera de comprimir el requadre de l’esquerra de la imatge que escriure, en algun llenguatge compacte, “quatre per quatre quadrats vermells”. El problema és que no coneixem ni podem disposar d’aquest ideal “millor sistema possible” de compressió elàstica, i això fa difícil el càlcul precís del grau de complexitat dels nostres texts, imatges i documents. Però sí que podem calcular una mesura aproximada d’aquesta complexitat de Kolmogorov si tenim un sistema de compressió prou bo, i en molts casos, això ja ens pot servir. Investigadors com Leanne Seaward, Stan Matwin i molts altres utilitzen bons sistemes de compressió elàstica com per exemple l’algorisme Lempel–Ziv–Welch (vegeu la nota al final) per mesurar la complexitat de texts i per detectar plagis i còpies entre documents. El seu mètode es basa en calcular el que ells anomenen la distància de compressió normalitzada (NCD, vegeu la nota al final) entre els dos texts que estem analitzant.

I com es calcula aquesta màgica “distància de compressió normalitzada” que ens diu si un text és còpia de l’altre o no? L’únic que cal fer és comprimir el primer text, comprimir el segon text, i comprimir el text conjunt que obtenim per concatenació dels dos primers. Ens apuntem la mida, en octets o bytes, de cada un dels tres fitxers comprimits, i només hem de fer una resta i una divisió per a obtenir un indicador que ens diu el grau de semblança entre els dos texts i ens explica si som davant d’un cas de còpia o no. L’explicació intuïtiva es basa en que cada autor té el seu estil. Un bon sistema de compressió, en els casos de còpia sempre aconseguirà un millor resultat i un fitxer comprimit del fitxer concatenat que ocuparà menys bytes, perquè detectarà que les pautes d’autor del primer text es repeteixen el el segon, i aquestes darreres les podrà “explicar” en base a les que ja ha trobat en el primer text. Com ens va dir Kolmogorov, és més fàcil explicar (i comprimir) dos texts amb el mateix estil que dos texts diferents.

He de reconèixer que em captiva el fet que camps ben diversos es connectin i acabin donant fruits sovint inesperats. Qui ens havia de dir, fa uns anys, que les idees de Kolmogorov i els mètodes de compressió que utilitzem quan volem enviar fitxers grans per correu electrònic, ens podrien servir per detectar còpies. De fet, la idea és ben senzilla i fàcil d’usar. Tant, que alguns professors del meu departament de la UPC ja l’estan aplicant amb èxit…

Per cert, Ferran Requejo diu que el rescat de bancs privats, l’empobriment de la població i les pràctiques de corrupció constitueixen una presa de pèl sistèmica. Diu també que l’economia financera, que va causar la crisi, segueix dominant molt més enllà del pes de l’economia productiva.

—–

NOTA: L’algorisme Lempel–Ziv–Welch, anomenat també LZW, va ser proposat per Abraham Lempel, Jacob Ziv i Terry Welch entre els anys 1978 i 1984. S’utilitza en Linux i en el format .gif per imatges digitals, i és elàstic perquè comprimeix sense perdre informació. L’algorisme original de 1984 codifica una seqüència d’octets (bytes o conjunts de 8 bits) tot transformant-la en una seqüència de grups (que anomenarem codis) de 12 bits. El conjunt de totes les 4096 possibles combinacions d’aquests 12 bits conformen el diccionari de compressió, que es va generant a mesura que es llegeix la seqüència d’octets que volem comprimir i que després guiarà el procés de recuperació o descompressió. Imaginem que volem comprimir el text “Jean Daniel diu que cal anar a la força de la raó, més que a la raó de la força”. Inicialment, preparem el diccionari de manera que les seves 256 primeres entrades siguin el codi de totes les lletres i signes de puntuació. Ho podem fer perquè cada caràcter d’un text es codifica en un octet i perquè el nombre de possibles octets diferents és 256. Ara, la regla LZW de compressió és aquesta: en cada moment, agafem la màxima seqüència de caràcters consecutius a partir d’on ens trobem, de manera que el següent caràcter donaria lloc a una seqüència que no tenim al diccionari. El codi d’aquesta màxima seqüència (sense el caràcter final) s’afegeix al text comprimit i aquesta màxima seqüencia (ara, amb el caràcter final) s’inclou com una nova entrada en el diccionari. En el nostre cas, és fàcil veure que el text comprimit començarà amb els codis individuals de les lletres “J”, “e”, “a”, “n”, “_”, “D” (indico l’espai en blanc com “_”). Però a la vegada haurà afegit noves entrades al diccionari per a les seqüències “Je”, “ea”, “an”, “n_”, “_D” i “Da”, de manera que a partir d’ara ja podrà avançar de dos en dos en algun cas i donar el codi comprimit de “an” (que ja el troba al diccionari) mentre inclou la nova entrada “ani”. És fàcil veure que el diccionari aviat acabarà tenint entrades per paraules com “que” i trossos com “la força” o “la raó”. L’algorisme LZW és eficient perquè el seu diccionari acaba incorporant més de 3000 termes i frases que es repeteixen al llarg del text i que identifica. D’aquesta manera, l’algorisme de compressió s’adapta a l’estil de l’autor.

El càlcul de la distància de compressió normalitzada NCD entre dos texts X, Y és ben senzill. Només cal comprimir cada un dels dos texts per separat, i després comprimir el text XY, que es forma per concatenació de X i Y. Si les mides dels tres fitxers comprimits (en bytes) són CX, CY i CXY respectivament i si diem M al màxim dels dos valors CX i CY i m al seu mínim, el valor de la distància de compressió normalitzada NCD és el resultat de calcular l’expressió (CXY-m)/M. Si aquest valor de la distància NCD és petit, és que els texts X i Y són semblants en l’essencial. Si és gran, és que són independents.