L’intelligenza artificiale incontra CRISPR

Il machine-learning può arricchire la cassetta degli attrezzi biotecnologici progettando proteine mai viste in natura

OpenCRISPR, credit Profluent

L’evoluzione naturale ha avuto quattro miliardi di anni per sperimentare con la materia vivente. Ora anche l’intelligenza artificiale (AI) è stata messa al lavoro per ampliare il catalogo delle molecole possibili e desiderabili. I cosiddetti “sistemi linguistici” non servono più soltanto a produrre testi o immagini come nel caso di ChatGPT o Midjourney. Possono essere istruiti e impiegati per progettare nuove proteine, e dunque anche nuove forbici genetiche di tipo CRISPR. Il primo strumento inventato dall’AI per correggere il DNA ha debuttato la scorsa settimana su bioRxiv. Si chiama OpenCRISPR, è stato messo a punto da una company californiana (Profluent) ed è già a disposizione della comunità scientifica. Ma vale la pena notare che l’“open sourcing” riguarda lo strumento biotech, non il programma che l’ha generato.

OpenCRISPR non è ancora diventato protagonista di una pubblicazione in piena regola, di quelle soggette alla revisione dei pari. Per il momento dobbiamo accontentarci di una bozza di lavoro (pre-print), ma la notizia dell’incontro tra i due filoni scientifici più caldi del momento – intelligenza artificiale ed editing genomico – non poteva non solleticare l’interesse dei media, a cominciare dal New York Times.

Gli appassionati di CRISPR sanno che questa piattaforma biotecnologica si ispira a un sistema naturale presente nella maggioranza di batteri e archeobatteri. Questi microrganismi hanno sviluppato delle proteine dette Cas capaci di riconoscere le sequenze bersaglio e tagliarle. A loro servono per fare a pezzi il materiale genetico dei virus nemici (i fagi), mentre noi le abbiamo riadattate per correggere i difetti genetici e modificare il DNA a scopo di ricerca. Poiché i microrganismi sono tantissimi, anche i modelli di forbici sono assai numerosi e variegati.

Per migliorare le prestazioni di proteine e organismi, ampliando le combinazioni generate in natura dall’evoluzione darwiniana, nel corso dei decenni biochimici e genetisti hanno imparato a produrre mutazioni in modi via via più ingegnosi, a combinare elementi diversi in proteine chimeriche, a dirigere i processi evolutivi in provetta. Ma per il futuro molta fiducia è riposta anche nella potenza del machine-learning. L’AI della Profluent, in particolare, è stata allenata su una vasta collezione di genomi microbici, allo scopo di trovare e valutare somiglianze e differenze in tutti i modelli di Cas noti. Da questo lavoro sono emerse nuove possibili versioni di CRISPR mai trovate in natura.

Fra tutte è stato scelto un prototipo che differisce per centinaia di mutazioni dalle proteine Cas naturali ma (secondo gli autori) è in grado di funzionare nelle cellule umane facendo un editing di buona qualità. Non c’è da aspettarsi che l’ultimo arrivato prenda da un giorno all’altro il posto del modello standard di CRISPR, perché la Cas9 usata da Jennifer Doudna ed Emmanuelle Charpentier nell’esperimento premiato con il Nobel è molto rodata e affidabile. Ma le intelligenze artificiali imparano in fretta a superare sé stesse, e c’è chi è pronto a scommettere che prima o poi sforneranno qualche super-strumento biotech in grado di conquistare i laboratori.

Ovviamente CRISPR è solo uno dei filoni a cui si può applicare il design delle proteine ai tempi dell’intelligenza artificiale. Anticorpi, vettori, farmaci: tutto o quasi può diventare pane per i denti del machine-learning. Il collo di bottiglia, probabilmente, sarà mettere alla prova nel mondo reale tutte le proposte virtuali. Come ha dichiarato a Nature Ken Yang (Microsoft Research, Cambridge), uno specialista di AI può generare abbastanza varianti di design da tenere cento biologi occupati per mesi. Un’altra considerazione è che l’addestramento sul campionario di diversità molecolare esistente per ora limita inevitabilmente la fantasia dell’intelligenza artificiale. Per inventare qualcosa di radicalmente nuovo serviranno conoscenze migliori sui nessi fra struttura e funzioni delle proteine, ma anche in questo campo stiamo facendo passi da gigante, proprio grazie ai modelli AI come AlphaFold di Google DeepMind.

Lascia un commento