Il momento dell’anno è quello adatto per i buoni propositi, che poi probabilmente non manterremo, ma vale comunque la pena farne anche solo per tracciare una rotta: da dove veniamo e dove andiamo con la biofisica computazionale in questo 2022? Niente di tutto quello che racconterò in questo post ha la pretesa di essere esaustivo o anche solo di fornire una previsione per ciò che accadrà in questo anno: le sorprese (belle o brutte che siano) sono sempre all’orizzonte e non è detto che le previsioni giungano a compimento durante il 2022. Un anno è, in fondo, un periodo troppo breve di fronte al progresso scientifico che va avanti da millenni, con tante strade, spesso tortuose, passi in avanti, passi indietro e ritorni inaspettati. In questo post post-capodanno ho quindi deciso di raccontarvi un po’ quali sono le sfide della biofisica computazionale in questo anno che è appena cominciato e che, speriamo, possa riportarci una qualche forma di ripresa dei contatti umani in serenità.
Comincio subito con un grande protagonista del 2021, che ha rappresentato un punto di svolta nel campo, ovvero l’annuncio che Alpha-Fold2 è in grado di fornire una predizione molto accurata della struttura di una proteina, nota la sua sequenza. Ne avevo anche parlato in un post precedente: si tratterebbe di risolvere il problema del protein folding che ha più o meno la mia età e quindi si affaccia al mezzo secolo. Il punto è: davvero abbiamo risolto il protein folding? La risposta, come spesso accade nella scienza, non è né sì né no. Non è no, perché si tratta di un passo in avanti notevolissimo, che permette ora a tutti i biofisici computazionali di disporre di una base di strutture determinate con un algoritmo che è, di gran lunga, migliore di tutti i vari modelli per omologia che finora sono stati impiegati.
Si tratta di un sistema automatico, in grado quindi di rispondere a qualunque domanda, qualunque sia la sequenza di amminoacidi di cui vogliamo determinare la struttura. Qualcosa che anche solo 20 anni fa sarebbe risultato impensabile, una specie di sogno da visionari e che ora è realtà tangibile. E però si sa: gli scienziati sono incontentabili (e meno male!) e i fisici ci trovano anche gusto nel pretendere di più. La risposta, infatti, non è neanche sì perché non è assolutamente vero che, data una sequenza qualunque, siamo in grado di predirne con certezza la struttura: ma anche volendo eliminare la parola “certezza” perché niente è poi certo al 100%, supponiamo anche di sostenere che AlphaFold2 sia in grado di predire con una ragionevole probabilità di successo la struttura corrispondente a una qualunque sequenza di amminoacidi. Questo non significa però aver risolto il problema del protein folding, perché l’algoritmo di AlphaFold2 si basa su un protocollo che prevede l’apprendimento automatico (o machine learning) basato sulle sequenze già note, non usa principi della fisica per determinare con certezza o con un calcolato margine di errore le coordinate degli atomi che compongono una struttura proteica. E finché non avremo questo tipo di certezza, o almeno una mappa di principi per orientarci nel numero infinito delle possibilità determinate da quelle sequenze, non potremo davvero dire di aver risolto il problema del protein folding.
Questa è però una caratteristica propria dell’apprendimento automatico o machine learning, una delle parole che sono più andate di moda nell’anno che ci siamo appena lasciati alle spalle. In ambito scientifico si usa spesso la parola “hype” per definire questi polveroni che si sollevano intorno a un argomento (a volte anche una parola): se c’è una cosa divertente che ho potuto constatare semplicemente invecchiando è stata la facilità con cui gli hype montano e smontano nel giro di qualche anno o decennio. Attenzione però perché questo non significa che non siano utili, tutt’altro: il fatto che per qualche anno o decennio si batta il ferro su un determinato argomento consente di esaminarne quasi tutte le implicazioni dando luogo a tantissime applicazioni, finché non si arriva quasi ad una specie di insofferenza anche solo all’udire la parola corrispondente. Indubbiamente il machine learning è stato un hype del 2021 e ha tutta l’aria di accompagnarci anche nel 2022, che ci piaccia o meno. Personalmente non ne sono un grande fan, perché a me piace imparare e mi sento un po’ invidioso nei confronti di una macchina che riesce a imparare più in fretta e meglio di me. A pensarci bene, però, non c’è solo l’invidia, ma anche il desiderio di approfittare indegnamente dei progressi del machine learning, come ad esempio sto già facendo con AlphaFold2: insomma, non mi ci voglio sporcare le mani, ma ne voglio approfittare impunemente.
Questo però ha due implicazioni: la prima è che, anche quando mi annoio tremendamente sentendo parlare di machine learning, sono costretto ad ascoltare con attenzione e anche con rispetto chi se ne sta occupando; la seconda è che dovremo rassegnarci a sentirne parlare negli anni a venire. La mia personale opinione è che il machine learning sia un modo per riassumere in una sola parola le nostre tecniche di analisi dei dati: il punto è che in biofisica la mole di dati è ormai fuori da ogni controllo, ce ne sono talmente tanti che riuscire a trovare un senso diventa un’impresa impossibile per qualunque cervello umano. Ben vengano allora queste tecniche, soprattutto se ci permetteranno di individuare quei principi primi che, al momento, ancora ci sfuggono. Il mio buon proposito per il 2022 resta quindi quello di continuare a interessarmene se non per contribuire in maniera diretta allo sviluppo di queste tecniche, per lo meno per approfittare delle loro scoperte. E cercare di dissimulare quello sbadiglio che mi prende ogni volta che sento le parole “machine learning”: del resto, con la mascherina è più facile!
Il 2021 però non ha visto solo l’hype del machine learning, ma anche quello del quantum computing, i computer quantistici. Se ne sente parlare spesso e sembrano davvero promettere una specie di Eldorado della computazione con macchine in grado di eseguire calcoli incredibili a velocità assolutamente non confrontabili con quelle dei più moderni supercalcolatori. Certo, mi piacerebbe poter vedere applicazioni del quantum computing allo studio della dinamica delle proteine, soprattutto per superare i limiti imposti dal passo temporale di integrazione delle equazioni. Sarebbe fantastico applicare il quantum computing per ottenere traiettorie di proteine o complessi di proteine che si spingano oltre gli attuali limiti dei pochi microsecondi per i modelli atomistici e dei nanosecondi per i modelli che includono fenomeni come l’assorbimento della luce o la rottura e formazione di legami chimici, fenomeni intrinsecamente quantistici. Purtroppo non è ancora così: ci sono tentativi in questa direzione anche nel nostro gruppo di ricerca qui a Trento, ma le applicazioni, al momento, sono ben lontane dalle proteine vere e proprie. Tuttavia si tratta di un altro campo in cui, prima o poi, potremmo vederne delle belle: magari nel 2022 vedremo applicazioni che suoneranno quasi ridicole in biofisica computazionale, ma da qualche parte si dovrà pur partire. Il mio buon proposito qui è mantenere un atteggiamento vigile, perché sono sicuro che qualcosa di buono arriverà, anche se forse sarò ormai vicino alla pensione…
Per quanto riguarda però le mie personali ricerche, i buoni propositi per il 2022 restano più o meno gli stessi del 2021: in particolare, vorrei continuare a occuparmi delle analisi delle traiettorie che otteniamo dalle simulazioni in dinamica molecolare. E’ fin troppo facile ormai produrre terabyte di dati relativi alle traiettorie degli atomi che compongono una proteina, ma è molto più difficile estrarre da queste le informazioni importanti. Da questo punto di vista, nel nostro gruppo di ricerca, abbiamo cercato già negli scorsi anni di trovare dei metodi affidabili e automatici per l’analisi delle traiettorie, con l’obiettivo di ricavare informazioni utili per comprendere il funzionamento delle proteine, individuando le parti meccaniche che sono responsabili di una determinata funzione. Molto resta però ancora da fare, ad esempio, per capire quali sono i nessi causali, quei movimenti che coinvolgono una regione limitata della proteina ma sono la causa di altri movimenti in regioni apparentemente lontane. Si parla spesso di funzione allosterica in questo senso e i movimenti allosterici dovrebbero lasciare una traccia nelle traiettorie di dinamica molecolare che produciamo. Tuttavia, ancora non abbiamo trovato dei metodi affidabili per individuarli con certezza e su questo il mio buon proposito è quello di guardarmi in giro, o eventualmente proporne qualcuno e chissà che non ce ne siano proprio già disponibili nel campo del machine learning. Mi annoto il buon proposito: informarmi sul machine learning per l’analisi di traiettorie, così ne unisco due in uno.
Resta poi il mio buon proposito che torna periodicamente da circa venti anni: studiare i cambiamenti conformazionali, ovvero quei movimenti che consentono alle proteine di lavorare come dei mini-robot all’interno delle nostre cellule. A livello atomistico con la dinamica molecolare è ormai possibile osservare cambiamenti conformazionali in proteine relativamente piccole, ma per proteine più grandi sono necessari livelli di approssimazione nella descrizione dei componenti della proteina (modelli a grana grossa o “coarse grained”) o nel tipo di dinamica (tecniche di campionamento avanzato). Ecco, il mio buon proposito per il 2022 è quello di cercare di ottenere un quadro più completo dei possibili metodi per lo studio dei cambiamenti conformazionali, con l’idea di trovare alcune applicazioni per le quali abbiamo già qualche dato sperimentale disponibile. Si tratta però di un buon proposito che sicuramente dovrò mantenere anche per il 2023 e per gli anni successivi, in attesa che il quantum computing magari mi permetta di evitare le approssimazioni e procedere con il calcolo diretto a livello atomistico (sì, magari).
E infine il miglior proposito per il 2022 resta sempre quello di continuare le iniziative per lo sviluppo della biofisica in generale e della biofisica computazionale in particolare, partendo da Trento e muovendomi soprattutto in ambito italiano ed europeo. C’è tanto da fare per promuovere questo campo in Italia e il nostro Paese ha davvero bisogno di aumentare le proprie ricerche in tutti gli ambiti, ma soprattutto nel campo delle biotecnologie. Questi due anni di pandemia hanno un po’ congelato un discorso che era cominciato già nel 2019, ma spero che ora si possa riprendere con un po’ di serenità: due anni di paure e restrizioni hanno dato una vera bastonata alla nostra capacità di stare insieme, di formare una comunità itinerante, ma non ci hanno portato via l’entusiasmo. Buon 2022 a tutte e a tutti.
Nessun commento:
Posta un commento