Grandi festeggiamenti nella comunità mondiale dei biofisici computazionali per il raggiungimento di un traguardo finora impensabile: la simulazione della dinamica di un intero gene (GATA4, per la precisione): 83mila basi di DNA avvolte con la famosa doppia elica intorno a 487 nucleosomi (strutture proteiche che agiscono come rocchetti attorno al quale è avvolto il DNA), per un totale di un miliardo di atomi. La simulazione è stata realizzata nei laboratori nazionali di Los Alamos, nello stato americano del Nuovo Messico, in una collaborazione che coinvolge ben 14 ricercatori (americani e giapponesi) diretta dalla biologa strutturale Karissa Sanbonmatsu. La notizia del primo miliardo di atomi è stata riportata da diversi siti divulgativi su tutti i canali social. Gli articoli sottolineavano il risultato davvero senza precedenti, ma anche le ricadute che tali studi potrebbero avere sulla nostra comprensione dei meccanismi cellulari e, in particolar modo, di come il materiale genetico sia organizzato all'interno dei nuclei cellulari. E' infatti recente la scoperta che il DNA non è certo raggomitolato a caso, ma occupa precise regioni all'interno del nucleo e la regione occupata determina anche l'eventuale sua traduzione in RNA messaggero e, in definitiva, l'attivazione di un determinato gene o una catena di eventi tra geni che devono essere espressi in successione o contemporaneamente affinché la cellula possa svolgere il suo compito. Capire quindi come è organizzato il DNA all'interno di un gene permetterebbe di controllare quindi i processi nei quali determinate sequenze di DNA vengono tradotte o meno.Fin qui tutto bene e tutto davvero interessante. I lettori di questo blog sanno però come la penso sulle cosiddette simulazioni-mostro, ovvero le simulazioni in cui è coinvolto un grandissimo numero di atomi: ne avevo già parlato a proposito del capside dell'HIV (64 milioni di atomi): qui siamo andati addirittura a incrementare di un fattore 15 quel risultato. Questa volta sarò però in controtendenza dicendo che in realtà, dopo aver letto l'articolo originale, sono davvero convinto che meritasse la pubblicazione e anche la risonanza che ha avuto. Anzitutto, come ho avuto modo di sottolineare anche in un post precedente, una gran parte dei calcoli di dinamica molecolare riguarda l'interazione elettrostatica: importantissima (è il principale linguaggio di comunicazione fra le molecole biologiche) e, allo stesso tempo, decisamente dispendiosa. Il motivo di questo costo elevato risiede nel fatto che non è possibile supporre che, ad una certa distanza, questa interazione sia debole: in effetti si tratta di una interazione a lungo raggio, attiva anche a distanze grandi. Se fosse debole oltre una certa distanza, potremmo limitarci a eseguire il calcolo soltanto sui pochi atomi che ci sono nelle immediate vicinanze di un dato atomo.
La via di uscita è ingegnosa e porta il nome del fisico tedesco, raffigurato qui a fianco: Paul Peter Ewald, morto quasi centenario nel 1985. Ewald si occupava prevalentemente di cristallografia: quando le molecole si dispongono in cristalli, si trovano ripetute periodicamente come in un reticolo (il reticolo cristallino, appunto). In queste condizioni è possibile sfruttare la diffrazione dei raggi X (ovvero raggi che interagiscono con le molecole del cristallo) per ricostruire dove questi si trovano. Il metodo è fondamentale proprio per ricostruire le strutture delle proteine: cristallizzare le proteine richiede una tale pazienza da sembrare quasi un'arte (nel caso delle proteine di membrana forse lo è). La chiave è proprio nella periodicità: infatti le strutture periodiche possono essere descritte non solo con le coordinate cartesiane alle quali ci siamo tutti affezionati durante i nostri studi di geometria analitica delle scuole superiori (mi scapperebbe un cuoricino), ma anche con una tecnica matematica nota come sviluppo in serie di Fourier che fornisce le stesse informazioni, ma in uno spazio detto spazio reciproco. Ed ecco qui il trucco del nostro simpatico Ewald: per ogni carica elettrica inseriamo una nuvola di cariche elettriche di segno opposto, distribuite con una formula facile da calcolare (la forma gaussiana, per la precisione), ma con la stessa carica totale. Se consideriamo allora il sistema della carica singola con la nuvola di cariche intorno, la somma delle cariche è zero. In questo caso, un teorema noto dell'elettrostatica (il teorema di Gauss), ci assicura che il campo elettrico oltre una certa distanza è rigorosamente nullo: ecco qua! A quella distanza l'interazione elettrostatica non c'è più, è diventata a corto raggio e non è difficile calcolarla.
Piano però: abbiamo pagato un prezzo perché quelle cariche distribuite con una nuvoletta gaussiana nella realtà non esistono. Quindi dobbiamo, come minimo, reinserirle, con le stesse nuvolette gaussiane ma con segno opposto. In questo modo l'effetto netto è nullo: abbiamo inserito cariche di segno opposto con somma zero. Tuttavia abbiamo ora una parte di interazioni a corto raggio che si possono calcolare facilmente (reticolo diretto) e una parte di interazioni dovute a cariche distribuite in tante nuvolette gaussiane.
Se prendiamo il sistema di nostro interesse e lo rappresentiamo in modo che si ripeta sempre uguale nello spazio (esattamente come in un cristallo) utilizzando le cosiddette condizioni periodiche al contorno, le nuvole gaussiane si ripeteranno nello spazio con la stessa periodicità del cristallo (reticolo reciproco). Queste sono appunto le interazioni a lungo raggio, ma per queste è possibile sfruttare lo sviluppo in serie di Fourier e calcolare la somma nello spazio reciproco. Questa operazione è in realtà dispendiosa, ma molto meno rispetto al calcolo diretto. Al momento è proprio questa l'operazione che richiede più tempo per i calcoli delle simulazioni di dinamica molecolare. Ebbene: è proprio qui che il lavoro del gruppo coordinato dalla Sanbonmatsu ha davvero meritato la pubblicazione. Infatti sono riusciti a trovare nuovi espedienti per calcolare le somme di Ewald con un'efficienza mai vista, adattando e ottimizzando il metodo per farlo funzionare su calcolatori collegati in parallelo e sulle diverse zone della simulazione, in modo da limitare al minimo indispensabile la comunicazione tra i singoli processori.
Ora sì, è possibile simulare un miliardo di atomi e seguire il destino di un intero gene: fantastico, allora vediamo cosa fa. E qui scatta la delusione: il gene non fa assolutamente nulla. Fluttua, come tutto fluttua in presenza di una temperatura. La verità è che vediamo un oggetto muoversi, ma per tempi molto brevi: hanno simulato pochi nanosecondi e hai voglia a dire che queste simulazioni permetteranno di comprendere come il DNA è organizzato all'interno dei nuclei... lo stesso articolo originale infatti si dilunga moltissimo sui metodi computazionali (di fronte ai quali posso solo inchinarmi in segno di rispetto), ma il piccolo paragrafo dedicato alle "implicazioni per la biofisica della cromatina" si limita ad affermare che ci sono tanti ioni intorno al DNA, fenomeno ben noto per il quale non serviva certo una dispendiosa simulazione da un miliardo di atomi.
Potrebbe darsi che l'analisi di una mole così incredibile di dati sia stata affidata ad un lavoro successivo e che in questo abbiano voluto sottolineare soprattutto l'avanzamento tecnico nel calcolo delle interazioni elettrostatiche, ma il problema resta: su scale temporali così brevi è molto difficile, se non impossibile, osservare un fenomeno rilevante in biologia. Ci piacerebbe poter simulare tutta la cellula a livello atomistico (il che richiederebbe molto più che miliardi di miliardi di atomi), ma non è una strada praticabile: la nostra intelligenza deve trovare metodi più efficaci per descrivere ciò che avviene al suo interno, soprattutto su scale temporali che siano biologicamente rilevanti.
Del resto, zio Paperone accumulava miliardi, ma a me è sempre stato più simpatico il povero Paperino...





Nessun commento:
Posta un commento