Prendo lo spunto da un articolo comparso l'anno scorso sulla rivista PLOS Biology, a firma di Florian Markowetz, dell'Università di Cambridge, in Inghilterra. Il titolo originale dell'articolo è "Tutta la biologia è biologia computazionale": mi è piaciuto perché l'autore è partito da uno spunto personale per parlare di come la biologia computazionale stia rivoluzionando l'intero mondo della biologia. O forse semplicemente di come la biologia stia arrivando a un livello di maturazione che ha già interessato altre discipline scientifiche. Lo spunto di partenza di Markowetz è il suo colloquio di lavoro che lo ha portato poi a ricoprire il ruolo che attualmente riveste presso il Centro di Ricerca sul Cancro dell'Università di Cambridge. Markowetz, matematico di formazione e con un'attività di ricerca prevalente in apprendimento automatico (il machine learning di cui si parla tanto), si trovava a fronteggiare una commissione di biologi che, giustamente, si chiedevano quale fosse l'utilità di assumere un matematico in un Centro di Ricerca sul Cancro. Proveniva già da esperienze negative in tal senso, in cui la commissione aveva ritenuto inutile puntare su quella che avevano definito "un'unità di servizio matematico", per qualcuno che mostrava "una mancanza di comprensione approfondita della biologia" e la cui carriera scientifica era stata "fondata sulle collaborazioni" (con i biologi, sottinteso), quasi a voler denigrare il suo apporto.
Nella comunità biomedica addirittura è stata usata l'espressione "parassiti della ricerca" per definire i biologi computazionali che fanno uso dei dati sperimentali già pubblicati sulle riviste per cercare di dar loro un senso e interpretarli con i loro modelli.
provato anche io nelle interazioni con i gruppi di ricerca più legati alla cosiddetta biologia tradizionale. In effetti, negli ultimi 20 anni, i metodi computazionali sono diventati parte integrante della biologia: nei congressi della Biophysical Society americana che ho frequentato agli inizi degli anni 2000, non c'erano vere e proprie sessioni dedicate ai modelli e alla biologia computazionale.
Oggi il termine "biologo computazionale" è diventato piuttosto diffuso, ma con accezioni diverse. A volte (anche qui, non sempre) nei dipartimenti di fisica viene usato questo termine per indicare la non-appartenenza: quella che fai non è fisica, ma biologia. Spiegare ai fisici che in realtà c'è tanto spazio per la fisica in biologia è un'esperienza bellissima se dall'altra parte c'è chi vuole ascoltare, ma può davvero raggiungere livelli altissimi di frustrazione se l'interlocutore o interlocutrice (l'apertura e la chiusura mentale, come tutto, è equamente distribuita fra i sessi) ha già deciso che la fisica è solo la sua. A quel punto diventa anche inutile spiegare che ci sono scoperte nella fisica che provengono dall'osservazione di fenomeni biologici, come ad esempio il famoso primo principio della termodinamica, formulato dal medico tedesco Julius Robert von Mayer, il quale aveva notato che il sangue venoso aveva un colore più chiaro nelle persone che vivono in climi caldi. Mayer aveva concluso che la combustione dovuta alla respirazione fosse più efficiente in climi caldi e quindi producesse un sangue più pulito. Di qui arrivò a ipotizzare l'equivalenza tra calore e lavoro, fornendo qualche indicazione quantitativa sul rapporto tra le loro unità di misura (caloria e joule). Le sue conclusioni furono poi riprese da Helmholtz che era ancora un medico, ma con qualche competenza matematica in più.
Nella comunità dei biologi avviene l'opposto: il computazionale non viene percepito come un vero biologo, ma come qualcuno la cui formazione è in altri campi (tipicamente fisica, matematica o informatica) e si è "riciclato" in biologia a causa delle maggiori opportunità di finanziamento, il che effettivamente lo qualifica come una versione scientifica di un parassita.
A volte si ha l'impressione che lo strumento computazionale (il computer) sia comparso in biologia al solo scopo di distruggere un fantastico mondo di diapositive, promettendo in cambio le meraviglie della bioinformatica. Non è una novità: i nuovi strumenti tendono a causare una certa resistenza in tutte le comunità scientifiche, che restano pur sempre comunità umane!
I biologi della "vecchia scuola" avrebbero preferito adattare l'uso dei computer alle loro esigenze, piuttosto che dover ricorrere agli informatici per imparare ad usarli. E, guarda caso, i primi a riuscire ad usarli sono stati i fisici e i matematici, che quindi hanno operato quella che, a tutti gli effetti, è sembrata ai biologi un'invasione di campo perpetrata da gente che amava inserire equazioni un po' ovunque (computer inclusi) e che si stava pericolosamente sostituendo ai "veri biologi" nelle università e nei centri di ricerca, un po' come nel film "Invasione degli ultracorpi", in cui gli alieni si impossessavano dei corpi degli umani che però apparivano esattamente uguali a prima ed erano, quindi, ancora più spaventosi.
Oggi il termine "biologo computazionale" è diventato piuttosto diffuso, ma con accezioni diverse. A volte (anche qui, non sempre) nei dipartimenti di fisica viene usato questo termine per indicare la non-appartenenza: quella che fai non è fisica, ma biologia. Spiegare ai fisici che in realtà c'è tanto spazio per la fisica in biologia è un'esperienza bellissima se dall'altra parte c'è chi vuole ascoltare, ma può davvero raggiungere livelli altissimi di frustrazione se l'interlocutore o interlocutrice (l'apertura e la chiusura mentale, come tutto, è equamente distribuita fra i sessi) ha già deciso che la fisica è solo la sua. A quel punto diventa anche inutile spiegare che ci sono scoperte nella fisica che provengono dall'osservazione di fenomeni biologici, come ad esempio il famoso primo principio della termodinamica, formulato dal medico tedesco Julius Robert von Mayer, il quale aveva notato che il sangue venoso aveva un colore più chiaro nelle persone che vivono in climi caldi. Mayer aveva concluso che la combustione dovuta alla respirazione fosse più efficiente in climi caldi e quindi producesse un sangue più pulito. Di qui arrivò a ipotizzare l'equivalenza tra calore e lavoro, fornendo qualche indicazione quantitativa sul rapporto tra le loro unità di misura (caloria e joule). Le sue conclusioni furono poi riprese da Helmholtz che era ancora un medico, ma con qualche competenza matematica in più.
Nella comunità dei biologi avviene l'opposto: il computazionale non viene percepito come un vero biologo, ma come qualcuno la cui formazione è in altri campi (tipicamente fisica, matematica o informatica) e si è "riciclato" in biologia a causa delle maggiori opportunità di finanziamento, il che effettivamente lo qualifica come una versione scientifica di un parassita.
A volte si ha l'impressione che lo strumento computazionale (il computer) sia comparso in biologia al solo scopo di distruggere un fantastico mondo di diapositive, promettendo in cambio le meraviglie della bioinformatica. Non è una novità: i nuovi strumenti tendono a causare una certa resistenza in tutte le comunità scientifiche, che restano pur sempre comunità umane!
I biologi della "vecchia scuola" avrebbero preferito adattare l'uso dei computer alle loro esigenze, piuttosto che dover ricorrere agli informatici per imparare ad usarli. E, guarda caso, i primi a riuscire ad usarli sono stati i fisici e i matematici, che quindi hanno operato quella che, a tutti gli effetti, è sembrata ai biologi un'invasione di campo perpetrata da gente che amava inserire equazioni un po' ovunque (computer inclusi) e che si stava pericolosamente sostituendo ai "veri biologi" nelle università e nei centri di ricerca, un po' come nel film "Invasione degli ultracorpi", in cui gli alieni si impossessavano dei corpi degli umani che però apparivano esattamente uguali a prima ed erano, quindi, ancora più spaventosi.
Markowetz riporta un interessante punto di vista di Hallam Stevens, l'autore di un libro sulla bioinformatica: "La biologia si è adattata al computer, non il computer alla biologia. I computer non hanno semplicemente permesso alla biologia di fare un salto di scala: hanno portato nuovi strumenti e nuovi interrogativi, come la statistica, la simulazione, la gestione dei dati, che hanno completamente trasformato il modo in cui è condotta la ricerca in biologia". Markowetz arriva addirittura ad affermare che se il botanico svedese Carl von Linné (o Carl Linnaeus) fosse vivo, oggi sarebbe un biologo computazionale. La sua idea di classificare tutte le piante e la tassonomia delle specie vegetali troverebbe senz'altro un'estensione moderna nei progetti che ricostruiscono la diversità dei genotipi e dei fenotipi delle piante.
Si trattava infatti di quello che oggi chiameremmo "un database" e nessuno ha mai messo in dubbio che il contributo di Linneo sia stato fondamentale per la botanica in particolare e per la biologia in generale.
Markowetz però va anche oltre: in realtà la biologia computazionale fa molto di più che rendere automatico il metodico lavoro di Linneo. Permette infatti di vedere la cosiddetta "big picture", il grande quadro, di estrarre dalla grande quantità di dati biologici di cui oggi disponiamo (che sono tanti perché la biologia è tanto diversificata e tanto complessa) i meccanismi principali, impossibili da comprendere per il solo cervello umano. E non perché non siamo abbastanza intelligenti, ma semplicemente perché non abbiamo la capacità di calcolo e la capacità di immagazzinare dati che può avere un computer e che sono necessari per comprendere la biologia.
Secondo Markowetz, la biologia computazionale fornisce una mappa per la biologia, una mappa che, al momento, non è ancora a livello di risoluzione di Google Street Viewer, ma somiglia un po' alle prime mappe utilizzate da Colombo, Magellano e Vasco da Gama per esplorare territori sconosciuti. Ci sono parti della mappa che non sono chiare (e sono davvero tante), ci sono zone della mappa che si presterebbero bene all'"Hic sunt leones", ma nonostante tutto, sono strumenti indispensabili per cercare di capire dove siamo e come spostarci.
La biologia computazionale è essenziale anche perché permette di formulare ipotesi non solo sul piano qualitativo, ma anche e soprattutto sul piano quantitativo. Questo è importante perché, come ben sanno i fisici, finché non ci si confronta con i numeri provenienti da un esperimento, qualunque teoria è ugualmente valida e nessun calcolo è davvero esatto. La biologia computazionale, in questo, è uno strumento come gli altri, che permette di trasformare un numero elevato di dati e/o un'idea piuttosto confusa in una domanda ben precisa alla quale gli esperimenti possono rispondere. In altre parole, non si tratta di un complemento ai dati sperimentali: spesso li dirigono.
A questo punto, mi sembra giusto raccogliere l'ultima provocazione dell'articolo di Markowetz: in biologia non si usano mai le espressioni "biologo microscopista", "biologo di colture cellulari", "biologo a singola molecola", o "biologo NMR". Sono tutti biologi! Perché mai il biologo computazionale dovrebbe essere etichettato diversamente? E perché trasformare la biologia computazionale in qualcosa di diverso da ciò che è, ovvero biologia e basta?
Si trattava infatti di quello che oggi chiameremmo "un database" e nessuno ha mai messo in dubbio che il contributo di Linneo sia stato fondamentale per la botanica in particolare e per la biologia in generale.
Markowetz però va anche oltre: in realtà la biologia computazionale fa molto di più che rendere automatico il metodico lavoro di Linneo. Permette infatti di vedere la cosiddetta "big picture", il grande quadro, di estrarre dalla grande quantità di dati biologici di cui oggi disponiamo (che sono tanti perché la biologia è tanto diversificata e tanto complessa) i meccanismi principali, impossibili da comprendere per il solo cervello umano. E non perché non siamo abbastanza intelligenti, ma semplicemente perché non abbiamo la capacità di calcolo e la capacità di immagazzinare dati che può avere un computer e che sono necessari per comprendere la biologia.
Secondo Markowetz, la biologia computazionale fornisce una mappa per la biologia, una mappa che, al momento, non è ancora a livello di risoluzione di Google Street Viewer, ma somiglia un po' alle prime mappe utilizzate da Colombo, Magellano e Vasco da Gama per esplorare territori sconosciuti. Ci sono parti della mappa che non sono chiare (e sono davvero tante), ci sono zone della mappa che si presterebbero bene all'"Hic sunt leones", ma nonostante tutto, sono strumenti indispensabili per cercare di capire dove siamo e come spostarci.
La biologia computazionale è essenziale anche perché permette di formulare ipotesi non solo sul piano qualitativo, ma anche e soprattutto sul piano quantitativo. Questo è importante perché, come ben sanno i fisici, finché non ci si confronta con i numeri provenienti da un esperimento, qualunque teoria è ugualmente valida e nessun calcolo è davvero esatto. La biologia computazionale, in questo, è uno strumento come gli altri, che permette di trasformare un numero elevato di dati e/o un'idea piuttosto confusa in una domanda ben precisa alla quale gli esperimenti possono rispondere. In altre parole, non si tratta di un complemento ai dati sperimentali: spesso li dirigono.
A questo punto, mi sembra giusto raccogliere l'ultima provocazione dell'articolo di Markowetz: in biologia non si usano mai le espressioni "biologo microscopista", "biologo di colture cellulari", "biologo a singola molecola", o "biologo NMR". Sono tutti biologi! Perché mai il biologo computazionale dovrebbe essere etichettato diversamente? E perché trasformare la biologia computazionale in qualcosa di diverso da ciò che è, ovvero biologia e basta?


Nessun commento:
Posta un commento