lunedì 11 maggio 2020

La biofisica computazionale ai tempi del Covid-19

Premessa doverosa: è il mio personalissimo punto di vista. Del resto si tratta di un blog che promette di parlare della biofisica computazionale vista da me, vista da Trento. Non ho quindi alcuna pretesa di descrivere l'oggettiva e certa situazione dello stato delle ricerche sul Covid-19 dal punto di vista della biofisica computazionale, anche perché forse qualcosa si è capita in questi mesi di lockdown: le certezze nella scienza richiedono tempi molto lunghi per tutte le verifiche necessarie. E anche quando queste verifiche sono eseguite nel migliore dei modi, ci saranno comunque altre verifiche, perché questa è la forza del metodo scientifico: non procede per certezze assolute, ma per l'evidenza sperimentale. E' un punto sul quale mi sono trovato anche a dover intervenire pubblicamente di fronte all'eventualità che i corsi universitari del prossimo anno accademico 2020/21 si svolgano interamente in remoto. Tutti stiamo apprezzando le potenzialità della didattica in remoto, ma i corsi di laurea scientifici si caratterizzano per un "saper fare" da soli e in gruppo, che trova la sua massima espressione nei corsi di laboratorio. E, per quanto fantasiose possano essere le esperienze concepite nella propria abitazione, con lanci di pirottini dagli armadi e videocamere più o meno sofisticate incorporate negli smartphone, non sostituiranno mai quel senso di laboriosa frustrazione che ogni scienziato DEVE provare quando tenta di trovare conferma alle leggi della natura con un esperimento. Perché DEVE? Perché solo così potrà rendersi conto di quanto tutte quelle eleganti teorie sarebbero né più né meno di quanto già disponibile in uno dei libri sacri delle nostre religioni, se non ci fosse la possibilità di confrontarle con l'esperienza. Esperienza umana e quindi soggetta a tutti gli errori e le incertezze che, almeno per il corso di laurea in fisica, si studiano nel primo corso di laboratorio, al primo anno. E' sempre opportuno mantenere questo riferimento, quando si parla di biofisica computazionale, un campo nel quale il confronto con gli esperimenti è particolarmente laborioso, come sa chiunque abbia messo anche solo piede in un laboratorio di biologia, biochimica o biorobe, in genere.

C'è stata, in effetti, una corsa alle simulazioni di proteine implicate nella diffusione del coronavirus responsabile della SARS-CoV-2, che a me, bambino cresciuto con i fumetti di Topolino, ha ricordato i racconti sulla corsa all'oro del Klondike del giovane zio Paperone. Più o meno prestigiosi gruppi di ricerca si sono lanciati nelle simulazioni di proteine che, fino a marzo, erano oggetto di interesse di sparuti gruppi. Abbiamo così imparato tutto sulla proteasi, sul recettore ACE2 e, soprattutto, sulla famosa proteina spike, con relative popolarizzazioni e ipersemplificazioni: il tallone di Achille del virus, la porta di accesso alle nostre cellule, il cavallo di Troia, il gancio spuntato... e chi più ne ha più ne metta. Giornalisti e scienziati (a parte i Virostar televisivi) sono spuntati ovunque con la pepita d'oro: il vaccino promettente, la molecola in corso di sperimentazione, la cura "italiana" al virus, solo per citare le testate a circolazione nazionale. I supercalcolatori in tutto il mondo sono stati praticamente dedicati in modo quasi esclusivo a ricerche correlate al virus e non potrebbe essere altrimenti quando ci troviamo di fronte a un'emergenza mondiale. Abbiamo un disperato bisogno di buone notizie e la disperazione non è mai una buona consigliera quando dobbiamo operare delle scelte: e in un mondo così interconnesso, anche soltanto dal punto di vista virtuale, facciamo delle scelte anche quando decidiamo di condividere una notizia su uno dei nostri profili social. Nella nostra inesperienza (perché usiamo i social stabilmente da circa dieci anni), dobbiamo ancora comprendere che tutto quello che condividiamo è la nostra traccia pubblica e influenza anche le scelte degli altri: se abbiamo una personalità scherzosa (e noi italiani siamo molto amati anche per questo), è giusto mostrarsi per quello che si è, senza prendersi troppo sul serio. Quando però condividiamo notizie "gonfiate" o palesemente false, dobbiamo stare attenti per due motivi: il primo, meno grave, è la nostra credibilità; il secondo, molto più grave, è che stiamo contribuendo a creare bolle di cattiva informazione che possono scatenare scelte politiche scellerate, con conseguenze nefaste sull'intera società in cui viviamo e quindi su noi stessi.
Allora facciamo un po' di sana pulizia delle informazioni che ci giungono su queste ricerche, prima di condividerle: lo farò aiutandomi con la vignetta qui accanto, presa dalla striscia quotidiana xkcd. La vignetta è in inglese: tuttavia è necessario tradurre i termini perché in Italia è stato classificato tutto come uno "studio", anche quando questo non aveva ancora passato la verifica di altri scienziati o non era stato letto se non da chi lo aveva materialmente scritto (e magari neanche da tutti gli autori). Nella vignetta la giornalista sceglie tra le varie opzioni quella corretta: secondo un nuovo "preprint" (ovvero uno studio appena scritto e pronto per essere mandato a una rivista che si occuperà di giudicarlo eventualmente degno di pubblicazione), secondo uno studio non pubblicato (il che significa che non è ancora ufficiale), secondo un nuovo articolo caricato su un server che contiene preprint ma non ha passato il processo di "revisione tra pari" (necessario per qualunque pubblicazione scientifica) e infine quella corretta, ovvero secondo un nuovo PDF. Perché studi che sono stati fatti tra marzo e aprile, al momento, sono perlopiù dei file PDF, mandati, nella migliore delle ipotesi, a riviste incaricate della loro revisione. Anche a me, come revisore, sono arrivati in questo periodo almeno cinque studi, alcuni dei quali ho dovuto declinare perché avevo altro da fare e non riuscivo a tener testa a tutto questo lavoro extra. Alcuni di questi sono stati pubblicati nel giro di quindici giorni e sono anche piuttosto dubbi: dobbiamo ricordarci che il giovane zio Paperone nel Klondike si spaccava la schiena a setacciare terreno recuperato dai letti dei fiumi, per trovare le famose pepite d'oro. Il più delle volte questi studi sono terriccio e saranno presto giustamente dimenticati.
Ancora più sarcastico però è il commento finale alla vignetta, con i benefici derivanti dall'uso del termine corretto "un PDF": 1) evita implicazioni sullo stato di pubblicazione del lavoro, che magari potrebbe essere non pubblicato (ne dubito, perché le riviste, nel dubbio, stanno decidendo di pubblicare praticamente tutto, con buona pace del metodo scientifico); 2) immediatamente pone degli interrogativi sugli autori (sono autorevoli o no?); 3) implica ancora che questo documento sia stato preparato da professionisti perché nessun essere umano sceglierebbe questo ridicolo formato per cercare di comunicare nel 2020.
Qualunque risultato derivante dalla biofisica computazionale richiede DOVEROSAMENTE il confronto con i dati sperimentali: i gruppi di ricerca seri hanno evidenziato che i risultati ottenuti al calcolatore, se pur promettenti, necessitano della validazione sperimentale. Alcune volte, purtroppo, hanno tentato di dirlo, perché i media assetati di buone notizie li hanno travolti con un gioco che ricorda molto "il telefono senza fili" in cui ciascun partecipante comunicava una parola all'orecchio del proprio vicino, finché l'ultimo della fila pronunciava una parola che risultava molto diversa dalla parola pronunciata dal primo. Fin qui però le cattive notizie che mi sono sentito di condividere sul fronte della biofisica computazionale. Veniamo ora alle buone.
Una su tutte: la ricerca non si è fermata. Il nostro campo, infatti, richiede calcolatori funzionanti ed efficienti e una buona connessione internet. Da questo punto di vista il cluster di calcolo della nostra Università di Trento purtroppo si è trovato a dover affrontare due mesi di funzionamento a intermittenza per problemi tecnici, ma se la sta cavando e sta tornando alla piena operatività. Al di fuori però delle problematiche locali contingenti, la rete della biofisica computazionale ha funzionato bene e, oserei dire, anche meglio con la condivisione di "buone pratiche" che potrebbero dare una nuova spinta alle ricerche in futuro. Con le conferenze rimandate o addirittura cancellate, tutti noi ci siamo trovati con l'unica opportunità di seguire i seminari online, i cosiddetti "webinar", stando comodamente a casa, preparandoci il tè, stirando (!), pulendo gli asparagi, spolverando, senza viaggi, scontrini per i pasti, rimborsi e spreco di soldi e carburanti. Tra tutti, segnalo i seminari organizzati dal CECAM, il centro europeo per il calcolo atomistico e molecolare. Il titolo della serie (perché è una serie!) è "Covid-19: sfide e risposte nella simulazione, nella modellistica e oltre": ogni martedì alle 15 (ora italiana) ci troviamo su un canale youtube e ascoltiamo due seminari (con una graditissima pausa caffè inclusa) brevi e puntuali di circa 20 minuti. Durante i seminari è attiva una chat in cui ci si scambia saluti (è pur sempre una comunità che era abituata a vedersi di persona) e si pongono domande per il "question time" successivo. Li ho trovati davvero interessanti e stimolanti, mi hanno dato la possibilità di vedere e salutare tanti miei colleghi, sentendomi sollevato ad ogni nuovo accesso di qualcuno che conoscevo personalmente al canale youtube (ah, ok, sta bene, dai): del resto, non è che posso star lì a mandare mail e messaggi a tutti quelli che conosco... Se conoscete l'inglese e ve li siete persi, i video sono sempre disponibili e, se volete entrare nella grande famiglia, sintonizzatevi il prossimo martedì alle 15: vi aspettiamo!
Proprio durante questi seminari, ho potuto conoscere e apprezzare lo sforzo combinato dei due consorzi Bioexcel e MolSSI per creare un portale dedicato a tutti gli studi in biofisica computazionale relativamente alle strutture proteiche e alle possibili terapie per contrastare il COVID-19. Si tratta del Covid-19 Molecular Structure and Therapeutics Hub, che ho trovato utile e innovativo, allo stesso tempo.
Utile perché, accedendo al portale, è possibile davvero fare una ricerca accurata sulle proteine coinvolte nella diffusione della Sars-CoV-2, quelle umane che contribuiscono a far entrare l'RNA virale nelle nostre cellule, quelle virali che permettono al virus di replicarsi o di agganciare nuove cellule e quelle sicuramente coinvolte ma delle quali ancora non si conosce bene la funzione: un preziosissimo atlante in continuo aggiornamento che potete ammirare qui sotto, alla data di oggi. Qui ho riportato l'immagine, ma andando sul sito e cliccando sulle singole proteine è possibile recuperare gli articoli e le informazioni relative alle strutture e alle strategie che potrebbero portare ad una terapia.

Innovativo perché, sempre esplorando l'atlante qui sopra, è possibile recuperare dati, traiettorie e studi già disponibili: naturalmente gli studi che sono stati già pubblicati e quindi hanno passato la fase della revisione tra pari sono opportunamente segnalati, in modo che ciascuno possa farsi un'idea dell'autorevolezza dello studio in base alla rivista su cui è stato pubblicato (oltre che citarlo nei suoi lavori, naturalmente). Sono però anche presenti i preprint o gli studi depositati sui server, nonché dati relativi a studi non ancora pubblicati, rilasciati a disposizione dell'intera comunità della biofisica computazionale.
L'utilità è certamente un passo avanti che potrebbe e, azzardo, dovrebbe riguardare tutti i sistemi biologici ai quali applichiamo le nostre simulazioni. La condivisione dei dati però è qualcosa che da anni si raccomanda, ma pochissimi hanno fatto per motivi diversi: paura di vedersi sottrarre una scoperta, perché magari gruppi meno forti possono trovare nei dati qualcosa che chi li ha prodotti non ha voluto/saputo/potuto vedere; una certa "stregoneria" nel produrre i dati con protocolli di simulazione che non si vogliono condividere con i gruppi concorrenti; infine, perché il sospetto c'è sempre, magari il desiderio di nascondere eventuali magagne nel protocollo di simulazione o nei parametri utilizzati per i modelli. C'è voluta un'emergenza mondiale per arrivare finalmente a questa condivisione, in modo peraltro mai immaginato: addirittura dati relativi a studi non ancora pubblicati!
Lo hanno ripetuto tutti e non pretendo quindi di essere originale: questa penosa esperienza di reclusione e solitudine potrebbe avere un lascito prezioso. Del resto, la caratteristica che ha reso noi esseri umani così prevalenti sul pianeta è proprio la capacità di adattarci ad ogni crisi, anche quelle che sono state generate da noi stessi. Sarà così anche per questa pandemia, ne sono certo: non ne usciremo migliori, ma ne usciremo più forti perché saremo stati costretti a trovare nuove risorse.

Nessun commento:

Posta un commento