giovedì 11 maggio 2017

Si fa presto a dire struttura

Nel post del mese scorso, ho cercato di descrivere il problema del protein folding, ovvero come
Strutture presenti nel PDB al 2014. Evidenziate: 1. mioglobina;  
2. primi enzimi; 3. RNA di trasporto; 4. virus; 5. anticorpi; 
6. complessi DNA-proteina; 7. ribosomi; 8. chaperoni. 
una proteina riesca a ripiegarsi per raggiungere il suo stato nativo, che le consente di svolgere il compito per il quale l'evoluzione l'ha selezionata. Lo stato nativo è però la struttura di una molecola molto grande, che non può essere fotografata. Determinare queste strutture non è mai stato impresa facile e non lo è ancora oggi, nonostante le quasi 130 mila strutture note (fonte: Protein Data Bank). Nella figura qui a lato è riportata la statistica del numero di strutture presenti nella banca dati Protein Data Bank, detta anche PDB. In realtà il PDB contiene non solo strutture di proteine, ma anche complessi di proteine con acidi nucleici (DNA e RNA) e strutture di acidi nucleici (soprattutto RNA), come è possibile vedere in figura (fonte: San Diego Supercomputer Center). Ma come si ottengono queste strutture? Non riuscirei ad essere esaustivo, ma provo a descriverlo a modo mio. L'obiettivo è far capire dove può (e deve) intervenire la biofisica computazionale.

Ci sono sostanzialmente due modi per ottenere la struttura di una proteina: il primo (e il più datato) consiste nel costruire un cristallo di proteine, ovvero nel preparare una soluzione che contenga tante copie della stessa proteina e altri fattori (che possono essere anche i più disparati, includendo metalli, ioni, lipidi...) che aiutino queste proteine a disporsi in modo regolare, come le piastrelle di un pavimento. In termini tecnici, la struttura finale regolare è un cristallo, come quello qui a lato. Il cristallo viene poi esaminato mediante un fenomeno fisico di cui non discuterò, noto come diffrazione di raggi X. I raggi X producono una grande quantità di dati che vengono analizzati (ovviamente con i calcolatori), in modo da ricostruire come in un gigantesco puzzle le posizioni dei singoli atomi, esclusi quelli più leggeri, ovvero gli atomi di idrogeno. Il secondo metodo sfrutta la risonanza magnetica nucleare, un altro fenomeno fisico, più comunemente indicato con la sigla del suo acronimo inglese, NMR. Il principio fisico della NMR è esattamente lo stesso della "risonanza" che ci prescrive il medico. Le strutture NMR differiscono da quelle ottenute per diffrazione di raggi X per due motivi: 1) le condizioni in cui sono ottenute non presuppongono la formazione di cristalli; 2) è possibile anche ricostruire le posizioni degli atomi di idrogeno.
Tuttavia, entrambi i metodi soffrono di una serie di problemi. Non ho intenzione di elencarli tutti, anche perché rischio di dover scrivere un trattato più che un post, ma vorrei dare un'idea di quale possa essere il contributo della biofisica computazionale in questo ambito.
Comincio con i cristalli di proteine: come si può notare dalla figura in alto, le proteine vengono praticamente impacchettate nei cristalli.
Non so se vi è mai capitato di preparare le polpette e doverle disporle su un piatto piccolo, facendo quindi più strati come in figura. Se le polpette non sono abbastanza solide, rischiate che cambino forma, che quelle nello strato inferiore siano schiacciate o che assumano forme ben lontane da quella tonda che avete dato con le vostre mani. Con le proteine succede più o meno la stessa cosa: una singola proteina interagisce con le sue repliche, un po' come una polpetta risente delle polpette ad essa vicine. Queste interazioni possono cambiare la forma della proteina, esattamente come per le polpette. Si chiamano "effetti di prossimità" e sono responsabili del fatto che la struttura che ritroviamo sul Protein Data Bank potrebbe non essere proprio la stessa con cui la proteina si presenta all'interno della cellula e svolge la sua funzione. Il secondo problema riguarda tutti quei fattori che sono stati inseriti per fare in modo che si formasse il cristallo: questi fattori potrebbero essere del tutto artificiali nel contesto cellulare in cui la proteina funziona e andrebbero quindi eliminati. Infine, se le proteine si trovassero sotto forma di cristalli nelle nostre cellule, queste ultime non potrebbero vivere. I cristalli peraltro si formano a temperature molto basse, alle quali il nostro stesso sangue sarebbe solido...
La biofisica computazionale può curare alcuni di questi problemi, partendo dalla struttura ottenuta mediante diffrazione di raggi X e lasciando che siano le leggi della fisica a decidere come aggiustare le posizioni degli atomi in modo che la proteina si trovi in un ambiente più realistico e a temperature più adatte alla vita. Questo lavoro di rifinitura o pulizia della struttura consente di avere un primo modello di come la proteina oggetto di studio si comporta in un ambiente realistico.
Quella qui a lato è per esempio la struttura di una proteina di membrana, una specie di poro che lascia passare le molecole di acqua e che, per questo, è nota come Acquaporina. In particolare, questa è un'acquaporina 4 umana, una proteina alla quale ho lavorato negli ultimi cinque anni. Si possono notare alcune strutture simili a cilindri (sono noti come eliche alfa), alcuni fili che collegano i cilindri (detti anche turn o loop), le molecole della membrana che sono rappresentate da quei filamenti rossi ai lati della proteina (ce ne sarebbero anche davanti e dietro, ma non sono rappresentate), e l'acqua che è rappresentata con il colore azzurro, inclusa l'acqua che passa attraverso uno dei quattro canali presenti in questa struttura (il canale in oro). Per inciso, non si chiama acquaporina 4 perché ci sono quattro canali, eh? La biologia non è mica così semplice!
E per le strutture ottenute con la NMR? In quel caso, non ci sono effetti di prossimità e inoltre la proteina si trova già in una soluzione che dovrebbe essere simile a quella che è presente all'interno della cellula. Tuttavia la biofisica computazionale è ancora più necessaria! Infatti la tecnica NMR consente di ricavare soltanto le distanze tra alcuni atomi della proteina, ma non tra tutti gli atomi.
E' come se doveste cercare di ricostruire la forma della penisola italiana sapendo le distanze tra alcune delle città d'Italia, come nella tabella qui a lato, senza alcun suggerimento sul fatto che somigli a uno stivale. Queste distanze sono chiamate, in inglese, "distance restraints": in italiano tradurrei con distanze vincolate e l'analogia con la ricostruzione della mappa a partire dalle distanze chilometriche autostradali è perfetta, se non fosse che la mappa è bidimensionale, mentre la struttura di una proteina è tridimensionale, quindi ancora più complicata. Senza ottimi calcolatori e senza la fisica a dare qualche indicazione su quale atomo dovrebbe interagire con quale altro, si andrebbe davvero poco lontano. Ma non finisce qui!
Quando tutto va bene, otteniamo la struttura di una proteina o di una macromolecola biologica, in genere. Le strutture tuttavia sono modelli, non fotografie. Le bellissime immagini che ho mostrato sono il frutto di programmi di visualizzazione che, ormai, sono alla portata di tutti, nel senso che spesso sono già inglobati nei browser che utilizziamo quotidianamente per navigare in internet. Abbiamo la possibilità di ruotarle, ingrandirle, manipolarle: tutto questo ha naturalmente aggiunto tanto allo sviluppo della biologia molecolare. Da un'attentissima (ma proprio parecchio -issima) analisi di una struttura, i biologi e i biochimici sono in grado di ipotizzare i meccanismi di funzionamento della proteina. Tuttavia, devono essere davvero parecchio bravi.
Per usare un'analogia che forse non mi attirerà le loro simpatie, è un po' come cercare di comprendere come funziona il motore di una Ferrari a massimo regime guardando una sua fotografia presa a motore spento, come quella qui a lato.  Non so voi, ma io non saprei distinguerlo dal motore di una Panda, se non fosse per la scritta Ferrari. Per capire come funziona il motore di una Ferrari, bisogna almeno accenderlo, vedere come si muovono le sue parti, smontarlo pezzo per pezzo e poi rimontarlo. E' proprio questo che tentiamo di fare con la biofisica computazionale: prendiamo le strutture, che sono il frutto di un lavoro immenso, davvero immenso, che può coinvolgere tantissime persone con competenze in biologia, biochimica, fisica, informatica (e chissà quanto altro), cerchiamo di rifinirle in modo che possano rappresentare al meglio la forma con la quale la proteina si presenta nell'ambiente cellulare e, infine, lasciamo che le leggi della fisica ne descrivano i movimenti, analizzando il funzionamento delle singole parti e del tutto. E quando riusciamo a capire cosa fanno e come lo fanno, ci rendiamo conto che le nostre migliori Ferrari sono rozzi ammassi di ferraglia in confronto ai sofisticati trucchi che l'evoluzione della vita sul nostro pianeta ha saputo escogitare per perpetrare se stessa.

3 commenti: