Un nuovo capitolo nella biologia computazionale si è aperto con l’annuncio di Evo 2, un modello di intelligenza artificiale sviluppato congiuntamente dall’Arc Institute e da NVIDIA. Presentato il 19 febbraio 2025, Evo 2 rappresenta un balzo avanti nella comprensione e nella manipolazione del codice genetico, con potenzialità transformative per la medicina, l’agricoltura e la bioingegneria.
Il modello è stato addestrato su un’enorme quantità di dati: 9,3 trilioni di coppie di basi di DNA, raccolte da oltre 128.000 specie che coprono tutti i domini della vita, dai batteri agli esseri umani. Questa vastità di informazioni consente a Evo 2 non solo di analizzare i genomi esistenti, ma anche di progettare sequenze di DNA sintetiche da zero, come cromosomi di lievito o genomi batterici minimi. Un aspetto particolarmente impressionante è la sua capacità di predire mutazioni responsabili di malattie, anche in regioni non codificanti del DNA, aprendo la strada a progressi nella medicina di precisione.
Un elemento chiave di questa innovazione è la sua natura open-source. Evo 2 è stato rilasciato con i parametri del modello, il codice di addestramento, il codice di inferenza e l’ampio dataset OpenGenome2, rendendo accessibili a ricercatori di tutto il mondo gli strumenti per progettare genomi. Questo approccio potrebbe abbattere barriere nell’innovazione biotecnologica, favorendo lo sviluppo di nuove terapie geniche, organismi ottimizzati per l’agricoltura o persino forme di vita sintetiche.
Il progetto si inserisce nel contesto di una rapida evoluzione dell’intelligenza artificiale applicata alla biologia, seguendo le orme di modelli come AlphaFold, ma spingendosi oltre verso la progettazione generativa. Tuttavia, questa potenza porta con sé interrogativi etici e di sicurezza: la possibilità di “ricrivere il codice della vita” solleva preoccupazioni su potenziali abusi, come la creazione di organismi pericolosi o l’impatto ecologico non previsto.
In sintesi, Evo 2 segna l’inizio di un’era in cui la biologia diventa sempre più una disciplina computazionale, con implicazioni profonde per la salute umana e l’ambiente. Sebbene le sue potenzialità siano enormi, il suo sviluppo responsabile sarà cruciale per massimizzarne i benefici e minimizzarne i rischi.
Approfondimenti
1- https://x.com/nvidiahealth/status/1892269481642090928?s=46
2- https://x.com/kimmonismus/status/1892324279091450094?s=46
3- https://x.com/stanfordhai/status/1892365090411991165?s=46