Arxiu del dijous, 16/10/2014

MERDA

dijous, 16/10/2014

Una característica del llenguatge científic és l’ús abundant d’acrònims. Com que sempre intentem especificar amb tota exactitud de que estem parlant, les coses tenen noms llargs i enrevessats i els acrònims faciliten l’intercanvi d’informació. Cal dir que de vegades hi ha qui es passa i els seus articles són un seguit de sigles només comprensibles pels iniciats, però en general sempre hi ha molts acrònims en els textos científics.

El que passa és que hi ha qui li posa alegria a l’hora de triar acrònims. Per això hi ha molècules que s’anomenen DIABLO (Direct IAP-Binding protein with Low PI), IRAK (interleukin-1 receptor-associated kinase) o PORN (poly-L-ornithine) que fa molta gràcia quan el protocol experimental comença dient que treguis el porno del congelador i el comencis a escalfar. Però això no passa només amb les molècules i m’han fet notar un assaig estadístic curiós tant per la seva utilitat com per l’acrònim que li han posat.

La idea va sortir d’un investigador del American Museum of Natural History. Els que treballen en evolució dels organismes es troben moltes vegades que en els arbres evolutius hi ha forats en blanc. Espècies que es van extingir i de les que encara no hem trobat els corresponents fòssils. És complicat perquè no pots treballar si no tens les dades, i potser aquestes s’han perdut per sempre. La idea és veure com podem fer aproximacions que no siguin simplement imaginar com serien els organismes o les xifres que hi ha en els forats que queden en l’estudi.

Doncs per fer-ho va fer una aproximació matemàtica que va anomenar “Missing Entry Replacement Data Analysis” (una cosa així com “anàlisi per reemplaçar les dades perdudes”). La gràcia és que si us fixeu, el seu acrònim és MERDA. I efectivament es el que cal fer servir quan tens unes dades incompletes fragmentades i dubtoses. Vaja! Una merda de dades.

La tria no va ser casual sinó que el paio reconeix que sabia el que vol dir “merda” en català. També serviria en italià i segurament en alguna llengua romànica més, però quan li van preguntar ell va dir que ho havia tret del català. Sembla que la fama d’escatològics que tenim es va escampant. No només tenim caganers sinó que donem lloc al nom d’uns programes estadístics que generen unes xifres de MERDA.

És paradoxal pensar que es poden arribar a publicar treballs molt bons fent servir uns valors de MERDA. I també, és clar, uns treballs de merda fent servir dades molt bones.

En tot cas, reconec que no puc deixar de somriure quan trobes frases com “The MERDA value is the frequency with which a particular clade is recovered in replicated analyses where missing observations are replaced randomly with observable states”.