Nobel alle proteine origami

Dalla chimica alla biologia attraverso l’intelligenza artificiale

di Pierdomenico Memeo
  • Materie coinvolte: Scienze Naturali

“Quando siamo impegnati a realizzare le pieghe,
l’atto della creazione è più importante del risultato.
Quando le mani sono impegnate, il cuore è sereno.”
Akira Yoshizawa, padre dell’origami moderno



Il Premio Nobel per la chimica 2024 è stato assegnato per metà a David Baker dell’Università di Washington a Seattle “per la progettazione computazionale delle proteine” e per metà a Demis Hassabis e John M. Jumper di Google DeepMind “per la previsione della struttura delle proteine”.


 
Insieme al Premio Nobel per la fisica assegnato a John Hopfield e Geoffrey Hinton per le scoperte fondamentali che hanno reso possibile l’apprendimento automatico attraverso le reti neurali artificiali, questo segna il 2024 come l’anno dei Nobel all’intelligenza artificiale, una tecnologia che non solo sta entrando in maniera significativa nella vita di tutti i giorni, ma sta cambiando radicalmente l’approccio di tutta una serie di discipline scientifiche, come dimostra l’assegnazione di quest’anno alle ricerche sulla previsione delle forme funzionali delle proteine attraverso l’uso delle strategie di apprendimento profondo.

 

Gli origami della biologia

Le proteine sono la classe di molecole organiche che maggiormente influenza e governa le funzioni vitali: favoriscono, inibiscono, guidano e controllano le reazioni chimiche alla base della vita, e costituiscono i mattoni da costruzione dei tessuti organici.

Tutte le proteine che conosciamo coinvolte nei processi biologici sono costituite dagli stessi 20 amminoacidi (22 includendo 2 ulteriori aminoacidi particolari che compaiono solo in particolari meccanismi di traduzione proteica), molecole organiche che si possono combinare tra loro per formare lunghe catene ripiegate. È difficile dare una stima del numero di proteine esistenti, ma al momento la cifra si attesta sui 200 milioni di proteine, divise in circa 500 famiglie.

Ma la particolarità delle proteine non si esaurisce qui: quando gli amminoacidi si uniscono, le relazioni elettromagnetiche tra gli atomi che le compongono si modificano a causa delle rispettive interazioni, piegando la struttura della sequenza di amminoacidi per creare una determinata forma tridimensionale, che è strettamente legata al loro funzionamento. Una proteina la cui forma tridimensionale è alterata o degradata si dice denaturata, e perde la sua funzionalità.

Per risalire alla forma effettiva delle proteine si utilizzava una tecnica chiamata cristallografia a raggi X (essa stessa vincitrice del Premio Nobel per la chimica nel 1962), nella quale un raggio incidente di raggi X viene diffratto dalla struttura cristallina di una molecola e utilizzato per ricostruire un'immagine tridimensionale di questa (è famosa ad esempio l’immagine della struttura del DNA ottenuta da Rosalind Franklin che ha permesso di comprendere la forma a doppia elica della catena di nucleotidi).

Per questo, fin dagli anni Settanta, i ricercatori hanno tentato a lungo di prevedere la struttura tridimensionale delle proteine a partire dalla loro sequenza di amminoacidi, ma questo si era rivelato pressoché impossibile. La facoltà di trovare le possibili combinazioni di amminoacidi per realizzare le proteine era un compito che richiedeva un’elevata capacità di calcolo, che è divenuto possibile solo con le nuove generazioni di elaboratori e di programmi di calcolo numerico.
Nobel alle proteine origami - Figura 1

Una proteina è costituita da una lunga catena di amminoacidi che può essere composta da un numero di amminoacidi che va da poche decine a diverse migliaia - ©Johan Jarnestad/The Royal Swedish Academy of Sciences

L’architetto delle proteine

Nel 2003, David Baker, biochimico computazionale dell'Università di Washington a Seattle, è riuscito a progettare e creare una nuova proteina, differente da qualsiasi altra identificata precedentemente.

Il suo metodo si basa su un programma di calcolo numerico chiamato Rosetta (come la stele egizia che aveva portato alla traduzione dei geroglifici) sviluppato inizialmente per lo scopo opposto, ossia prendere una sequenza di amminoacidi e calcolare con una buona approssimazione la sua struttura tridimensionale. Pur non essendo perfetto, il programma aveva dato a Baker un’altra idea: l’algoritmo può infatti essere usato al contrario, invece di introdurre come input la sequenza di amminoacidi e restituire la struttura tridimensionale, il programma è in grado di prendere una struttura proteica, associata a una funzione specifica, e ricavare delle ipotesi per la catena di amminoacidi che avrebbero dato la struttura scelta sulla base di specifiche interazioni chimiche e similitudini evolutive (se una sequenza specifica compare in diverse specie, è ragionevole ipotizzare che se le ritroviamo altrove, codifichi anche lì strutture simili).

Il suo gruppo di ricerca progettò quindi una proteina con una struttura interamente nuova, e utilizzò Rosetta per calcolare la sequenza di amminoacidi iniziale: il programma cercava all’interno di un database, che comprendeva tutte le strutture delle proteine conosciute all’epoca, una serie di frammenti che avevano delle somiglianze con la struttura desiderata, ricavando la porzione di sequenza degli amminoacidi relativa ad essi, e infine ottimizzando queste porzioni per ricavare la catena completa. Ricreata in laboratorio, la proteina reale (chiamata Top7 e composta da 93 amminoacidi) risultò avere quasi esattamente la struttura desiderata. È l’inizio dell’epoca della progettazione proteica.

Da allora, il suo gruppo e molti altri che ne hanno seguito le orme hanno continuato a inventare nuove proteine una dopo l’altra, le quali hanno trovato applicazioni in ambito biomedico (come farmaci e vaccini) ma anche biotecnologico, per la realizzazione di nanomateriali e sensori microscopici.
Nobel alle proteine origami - Figura 2

Alcune proteine sviluppate utilizzando il programma Rosetta di Baker - ©Terezia Kovalova/The Royal Swedish Academy of Sciences

I maestri delle pieghe

Ma se la progettazione di nuove proteine a partire da quelle note era diventata realtà, restavano ancora milioni di proteine conosciute di cui non si sapeva l’effettiva struttura tridimensionale. La cristallografia X delle proteine, infatti, è un processo estremamente lento e meticoloso, perché è molto difficile stabilire quali sono le giuste condizioni per la formazione dei cristalli da analizzare, e spesso centinaia (a volte migliaia) di tentativi dovevano essere eseguiti prima di ottenere un risultato, rendendo la compilazione dei cataloghi di strutture proteiche un lavoro mastodontico.

Questa situazione cambiò radicalmente nel 2020, quando Demis Hassabis, neuroscienziato britannico, fondatore di DeepMind, un’azienda di ricerca informatica acquisita da Google nel 2016, e John Michael Jumper, chimico teorico statunitense, presentarono un modello di intelligenza artificiale chiamato AlphaFold2, studiato per ricavare il modo in cui le sequenze di amminoacidi si ripiegavano, permettendo quindi di prevedere la forma di tutte le proteine al momento conosciute.

Se c’è una cosa su cui i sistemi di intelligenza artificiale sono imbattibili, infatti, è di analizzare un’immensa mole di dati per trovare all’interno associazioni e ripetizioni per ricavare i loro schemi di base. Il programma era quindi stato addestrato su tutte le sequenze di amminoacidi note, e sulle forme proteiche al momento conosciute, alla ricerca di indizi per ricavare altre strutture.

Il modello prevede un approccio evolutivo: una volta presa in carico la sequenza di amminoacidi della proteina sconosciuta, il programma cerca al suo interno porzioni di catena associate a strutture proteiche simili e note; poi analizza queste porzioni (spesso appartenenti a proteine di specie diverse) e indaga quali parti sono state preservate durante il percorso evolutivo, alla ricerca di schemi ricorrenti. Nella fase successiva, AlphaFold2 esplora quali amminoacidi possono interagire tra loro nella struttura tridimensionale della proteina, ricostruendo come sono cambiate le interazioni durante il percorso evolutivo. Il modello ipotizza di conseguenza una struttura proteica e, utilizzando un processo di iterazione, perfeziona la sequenza finale di amminoacidi per arrivare a una struttura tridimensionale stabile. Dopo un numero limitato di ripetizioni (in genere tre), il sistema converge verso una risposta finale con un’elevata probabilità di essere corretta. Ciò che fino a quel momento avrebbe comportato un lavoro di anni, poteva essere risolto in pochi minuti.

Grazie a questo lavoro rivoluzionario, il programma è stato utilizzato in un numero incalcolabile di applicazioni nello studio delle proteine, dalla lotta alla resistenza dei batteri agli antibiotici, alla creazione di enzimi che possono degradare ed eliminare la plastica dall’ambiente. AlphaFold2 è stato anche utilizzato per prevedere con estrema rapidità la struttura delle proteine di SARS-CoV-2, il virus responsabile della COVID-19, permettendo di iniziare a lavorare sulla produzione di terapie antivirali e vaccini in grado di contrastare l’infezione.

Le potenzialità di questi nuovi strumenti sono inoltre destinate a rafforzarsi a vicenda: la possibilità di progettare nuove proteine attraverso metodi computazionali è aumentata esponenzialmente grazie alle capacità di previsione dell’intelligenza artificiale, rendendo estremamente più efficiente e produttivo il lavoro del gruppo di Baker e altri. Con l’introduzione di AlphaFold3 all’inizio di quest’anno, il modello inoltre non è più limitato alle proteine a singola catena, ma può anche prevedere la struttura di complessi proteici più ampi, accoppiati a molecole di DNA o RNA e altre modifiche specifiche. Infine, l’apertura dei servizi AlphaFold ai laboratori impegnati in ricerche non commerciali conferma la direzione di una maggiore e più ampia collaborazione per la creazione di nuove applicazioni scientifiche e mediche.
Nobel alle proteine origami - Figura 3

Strutture di alcune proteine ottenute utilizzando AlphaFold2 - ©Terezia Kovalova/The Royal Swedish Academy of Sciences

L’intelligenza artificiale al servizio della scienza

Quest’anno, se il Premio Nobel per la fisica è stato assegnato alle basi dell’intelligenza artificiale, quello per la chimica è stato attribuito ad una delle sue applicazioni più promettenti nel campo della ricerca scientifica. Una volta sostanzialmente risolti i problemi di previsione delle strutture e delle funzioni proteiche e di costruzione di nuove proteine, i campi di applicazione risultano praticamente illimitati.

Il lavoro del team di AlphaFold2 ha permesso di creare enormi cataloghi di strutture proteiche ricavate con il loro modello, aumentando il numero di strutture proteiche conosciute di diversi ordini di grandezza in un tempo rapidissimo; d’altra parte, la possibilità di progettare da zero nuove proteine ha aperto campi finora inesplorati della biologia sintetica.

In definitiva, i Premi Nobel per la chimica di quest’anno mostrano come le discipline scientifiche sono sempre più interconnesse, in un mondo dove le scoperte della fisica pongono le basi per lo sviluppo dell’intelligenza artificiale, che a sua volta fornisce gli strumenti per rivoluzionare la nostra comprensione della biochimica. La ricerca scientifica si alimenta così dei risultati di tutte le discipline, aprendo non solo nuove frontiere nella spiegazione dei fenomeni della natura, ma stimolando una nuova consapevolezza nella comprensione dei processi stessi della scienza.

 

Proposta di attività per la classe:
La zona grigia

L’attività si propone di studiare l’interconnessione tra le discipline scientifiche e di riflettere come la rigida divisione in categorie dei Premi Nobel sia una (necessaria ma limitante) semplificazione.

Per questo, è indicata anche come attività interdisciplinare con i docenti di Matematica, Fisica, Scienze, Informatica, Diritto, Economia, e altre materie.

Dall’elenco dei Premi Nobel nelle varie discipline, ogni studente e studentessa seleziona un vincitore o una vincitrice che abbia ricevuto il premio per una scoperta o invenzione che possa essere considerata al confine o nell’intersezione tra due o più discipline scientifiche (come è successo anche quest’anno), sul quale preparerà una breve presentazione orale raccontando la storia della persona vincitrice, la motivazione del premio, e una riflessione sugli ambiti e sulle applicazioni della scoperta o invenzione in diversi campi della ricerca scientifica.

Elenco dei vincitori del Premio Nobel per la chimica
Elenco dei vincitori del Premio Nobel per la fisica
Elenco dei vincitori del Premio Nobel per la medicina
Elenco dei vincitori del Premio Nobel per l’economia

 

Sitografia

Highlights


  • Il Premio Nobel per la chimica 2024 è stato assegnato a David Baker “per la progettazione computazionale delle proteine” e a Demis Hassabis e John M. Jumper “per la previsione della struttura delle proteine”

  • Il premio sottolinea l’importanza della chimica computazionale e dell’intelligenza artificiale nella comprensione della natura complessa delle strutture biochimiche

  • I premi Nobel di quest’anno mostrano come le discipline scientifiche siano intimamente collegate tra loro e le scoperte di una abbiano un impatto significativo nelle applicazioni delle altre.

  • I microRNA bloccano la traduzione dell'mRNA in proteina, influenzando la specializzazione cellulare

  • La loro importanza clinica è legata a malattie come il cancro, offrendo nuove opportunità terapeutiche


 

Credits

Immagine di copertina
David Baker, Demis Hassabis e John Jumper.
Niklas Elmehed © Nobel Prize Outreach