In silico, trotterellando: Miti e leggende della biofisica computazionale

L'ispirazione per questa puntata del blog è un recente articolo firmato da ricercatori del Centro Riken per le Scienze Computazionali in Giappone e del blasonato ETH di Zurigo, apparso online, ma non su una vera e propria rivista scientifica. Gli articoli online non hanno passato il vaglio di ricercatori pari grado e quindi non c'è mai molto da fidarsi di quanto contengono, a meno che non provengano però da autori già noti nel campo e, naturalmente, a meno che l'intenzione degli articoli stessi non sia tanto quella di rendere pubblica una ricerca, ma magari aprire un dibattito, anche con toni umoristici, come riportano gli autori. Ora, non è immediatamente chiaro quanto possa essere divertente leggere un articolo sui miti e le leggende del calcolo ad alte prestazioni, ma il campo è popolato da personaggi che trovano divertente prenotare un tavolo da 4 persone quando ce ne sono cinque perché contano come nel linguaggio di programmazione C, ovvero partendo da zero. Non è neanche molto facile capire le domande che l'articolo pone, perché alcune sono di carattere molto tecnico. Tuttavia mi è piaciuta l'idea e mi è piaciuto il tono, per cui mi sono posto anche io la stessa domanda, ovvero: quali sono i miti e le leggende della biofisica computazionale? Naturalmente la mia lista è molto parziale e limitata alla mia esperienza sul campo, però chissà... magari in qualche futura puntata del blog mi verrà voglia di aggiornarla o di rispondere ad alcune delle domande che lancio oggi. Comincio, allora, in questo mese con tre miti e leggende, nell'ordine in cui mi sono saltati in testa.

Mito 1. Non c'è più bisogno di determinare le strutture, perché c'è AlfaFold. O anche nella variante: non c'è più bisogno di girare simulazioni in dinamica molecolare perché si può determinare la dinamica di una proteina in modo meno dispendioso usando algoritmi di apprendimento automatico (machine learning) oppure il deep learning, qualunque cosa voglia significare. Di AlfaFold ho già scritto diverse volte: si tratta di un algoritmo di apprendimento automatico che genera la struttura di una proteina (o tenta di generare la struttura di una proteina) a partire da una sequenza di amminoacidi, basandosi sulle strutture note. Il problema è che ci sono tantissime strutture ancora non note e alcune volte le strutture non possono essere determinate perché le proteine ne hanno più di una o addirittura non ne hanno nessuna in quanto intrinsecamente disordinate. AlfaFold però fornisce una struttura anche in questi casi, ovviamente sbagliando. Nelle simulazioni è pur vero che il machine learning può fornire indicazioni utilissime per analizzare i dati o addirittura generarne di nuovi quando magari si studia una proteina simile ad altre già studiate. Tuttavia sarà che io sono sempre un po' diffidente per natura, ma non mi fiderei di una macchina che funziona come una scatola nera: per carità, spesso indovina il risultato, ma resta il problema che non riesco a capirlo, mentre io voglio proprio capire perché quella proteina fa così o non fa così.

Mito 2. Le equazioni sono tutte note, quindi con le simulazioni non scopriamo niente di nuovo: se mai, abbiamo solo bisogno di computer più potenti per risolverle. Questo mito ha origini nobilissime, ovvero Paul Dirac, il quale sosteneva che le leggi per l'intera chimica e per una gran parte della fisica fossero interamente note, ma avessero il difetto di condurre a equazioni troppo difficili per poter essere risolte. Ecco, con i supercomputer e i mega-supercomputer, magari dedicati solo alla biofisica computazionale, saremo in grado di risolvere tutte quelle equazioni. Non è così: e non aggiungo un "purtroppo" perché per un fisico è ancora più interessante che non sia così. Molti fenomeni nei sistemi complessi (e la cellula lo è certamente) sono emergenti, ovvero risultano proprio dall'insieme di comportamenti miscroscopici: guardando il singolo, è difficile immaginare cosa possa succedere alla collettività. Il premio Nobel Giorgio Parisi ha studiato questo tipo di fenomeni, con splendide intuizioni sul volo degli stormi di uccelli. Per una cellula, la complessità è ad ogni livello nello spazio e nel tempo, quindi i fenomeni emergenti sono tantissimi e tutti degni di studio. E no, non è vero che non si possa scoprire qualcosa di nuovo, anzi c'è proprio tutto un mondo là da scoprire. E non ci saranno mega-supercomputer che tengano: più indagheremo, più troveremo fenomeni emergenti, più ci appassioneremo e questo lo diceva un vero mito della fisica, ovvero Richard Feynman. Non ci sarà la parola fine su queste ricerche, almeno finché ci sarà una forma di vita intelligente desiderosa di indagare la vita stessa.

Mito 3. Entro l'anno (inserire data a piacere) saremo in grado di simulare l'intera cellula a livello atomistico di dettaglio. Ogni volta che sento questa frase, mi parte un fragoroso BOOOOM nel cervello. Può anche darsi che con mega-supercomputer dedicati si riesca a simulare un'intera cellula, ma non certo a livello atomistico: ci vorrebbero un numero di atomi pari almeno a un numero di Avogadro, cioè circa 600 mila miliardi di miliardi di atomi. Al momento siamo intorno al miliardo di atomi, quindi direi che forse potremmo essere in grado di simulare un'intera cellula utilizzando modelli approssimati, ma per i modelli atomistici "ciao, ma ciao proprio", anche a voler scomodare i computer quantistici (sui quali la mitologia si è scatenata). C'è anche la variante un po' più credibile: qualunque processo biologico può essere simulato su un computer. Non è proprio vero, ma su questo sarei più possibilista: il problema è che ci sono processi complicati da descrivere, perché richiedono anche la meccanica quantistica: l'assorbimento della luce e le reazioni chimiche, per nominarne solo due. C'è però ancora un problema che resta lì: le cellule sono sistemi fuori dall'equilibrio, mentre tutte le nostre simulazioni sono pensate per sistemi in equilibrio. Forse dovremmo concentrarci su questo per cercare di capire davvero come funziona una cellula, perché una cellula raggiunge l'equilibrio solo quando è morta e questo purtroppo no, non è un mito.

Ah, però in tutto questo un vero mito l'ho trovato: le immagini che ho utilizzato in questa puntata del blog sono state generate da me giocando con l'intelligenza artificiale di DALL-E 2. Se qualcuno a 8 anni mi avesse detto che un giorno sarei stato in grado di dire a un computer di disegnare quello che volevo, avrei sicuramente sgranato gli occhi e pensato che fosse una leggenda. E chissà: magari accadrà lo stesso anche con le leggende di cui ho parlato in questa puntata.

In silico, trotterellando

sabato 11 marzo 2023

Miti e leggende della biofisica computazionale

Nessun commento:

Posta un commento