Per la prima volta dopo vent’anni è stato sequenziato l’intero genoma umano. L’impresa è iniziata più di vent’anni fa con il celebre Human Genome Project, un’iniziativa che aveva lasciato, però, alcune lacune soprattutto a causa della mancanza di prospettive verosimili per un sequenziamento completo e delle tecnologie disponibili. L’8% mancante rappresentava aree particolarmente difficili da “decifrare”. Le nuove tecniche di sequenziamento (con un’accuratezza prima impensabile) e l’utilizzo di algoritmi hanno permesso oggi di individuare gli errori del passato e di dare un senso a zone molto ripetitive di DNA che avevano a lungo sfidato la ricerca.
A riuscire nell’impresa è stato il gruppo internazionale Telomere to Telomere (T2T). L’annuncio è stato fatto sulla rivista scientifica Science, con la pubblicazione di uno speciale di sei paper sulla prima sequenza completa del genoma umano.
Il DNA sequenziato oggi sarà la base per una migliore comprensione futura del codice genetico, degli effetti delle mutazioni (specialmente quelle relative alle zone che sono rimaste sconosciute per vent’anni) e dell’evoluzione della specie. Il team che ha lavorato al progetto è composto da un centinaio di scienziati da tutto il mondo guidati dal Senior Investigator del Computational and Statistical Genomics Branch del National Human Genome Research Institute (NHGRI) Adam Phillippy e dall’Assistant Professor nel Dipartimento di Ingegneria biomolecolare dell’Università della California Karen Miga.
Le buone notizie, tuttavia, non finiscono qui. Perché il consorzio T2T si è ora unito allo Human Pangenome Reference, dando seguito alla collaborazione internazionale. Il prossimo obiettivo è creare un “pangenoma umano di riferimento” basato sulle sequenze complete di 350 individui che rappresenti in maniera più affidabile la diversità umana e le sue infinite sfaccettature.
Il nuovo genoma appena pubblicato (CHM13) andrà a completare quello di riferimento umano standard noto come “Genome Reference Consortium build 38” (GRCh38), che ha avuto le sue origini proprio nello Humane Genome Project. Si tratta però di un modello e quello realizzato da T2T è a tutti gli effetti un perfezionamento del precedente. Anche a questa versione infatti manca qualcosa: il cromosoma Y, di cui la linea CHM13 è priva dato che lo spermatozoo che ha fecondato l’ovocita preso in esame dagli scienziati era portatore del cromosoma X. Inoltre, la linea cellulare presenta un’anomalia: ogni coppia di cromosomi è composta da due copie identiche, caratteristica non esistente in natura.
Conoscere il 100% del genoma umano consentirà agli scienziati di capire in che modo il DNA cambia a seconda delle persone e se le variazioni genetiche giocano o meno un ruolo determinante nello sviluppo di malattie. Negli ultimi anni le acquisizioni scientifiche nel campo della genetica hanno visto l’introduzione sul mercato e lo sviluppo rapido di nuovi sistemi per il sequenziamento del genoma denominati Next Generation Sequencing (NGS). Gli NGS possono leggere le sequenze di DNA in parallelo, riducendo sia i costi che i tempi di attesa. Di certo si tratta di progressi che porteranno a una conoscenza più approfondita dell’origine e dell’evoluzione delle malattie e a una svolta radicale per il mondo della medicina.
Ora che siamo in possesso del sequenziamento completo del genoma umano, il compito della comunità scientifica sarà quello di continuare a indagare il suo funzionamento: come i genomi si differenzino gli uni dagli altri nelle diverse popolazioni del mondo, come queste diversità influenzino il nostro stato di salute e come la conoscenza di questi meccanismi possa essere usata per migliorare e personalizzare i percorsi di cura e le diagnosi.
La velocità di sequenziamento attualmente disponibile permette di condurre ricerche su larga scala, compresa l’analisi del genoma per individuare le associazioni genotipo-fenotipo. Nascono così gli studi di associazione genome wide (GWAS, Genome Wide Association Studies), in cui vengono ricercate quelle variazioni da individuo a individuo, che sono associate al fenotipo malattia in maniera più complessa rispetto, ad esempio, alla classica ereditarietà mendeliana (cioè la trasmissione di quei caratteri genetici codificati ciascuno da un singolo gene). Nella maggior parte dei casi, però, si tratta di una relazione causale che necessita di altri fattori per dare luogo alla malattia, come concomitanti alterazioni in altri geni o concause ambientali e comportamentali. È opportuno quindi parlare di una predisposizione su base genetica alla malattia, piuttosto che di una causa certa.
Molte delle malattie croniche che sono tutti i giorni sotto gli occhi del clinico, dal diabete alle malattie cardiovascolari, possono essere associate a polimorfismi del DNA identificati proprio attraverso studi GWAS. È evidente che per poter associare caratteristiche genetiche a una patologia, è necessario avere un campione corposo di cui si abbia una caratterizzazione molecolare ben precisa ottenuta attraverso il sequenziamento.
Proprio a questo scopo nel 2006 è nata la UK Biobank. Si tratta del più grande progetto di ricerca sanitaria a lungo termine mai avviato. Nel Regno Unito da più di 10 anni tramite l’iniziativa vengono monitorati i dati biologici, sanitari e sullo stile di vita di 500.000 volontari, un numero tanto elevato da garantire significatività anche per malattie non comuni. I volontari forniscono regolarmente campioni di sangue, urina e saliva nonché informazioni dettagliate sul loro stile di vita che vengono poi collegate ai loro dati sanitari e genetici per fornire una comprensione più profonda di come le malattie subentrino nella vita delle persone. I dati sono poi anonimizzati e resi accessibili ai ricercatori di tutto il mondo che li utilizzano per migliorare la conoscenza di malattie comuni o meno, come cancro, malattie cardiache e ictus. Lo scopo è proprio quello di riuscire a fornire un pool di dati genetici e sanitari estremamente dettagliati con il fine ultimo di cambiare radicalmente l’approccio alla salute.
Anche in campo oncologico il sequenziamento ha potenzialità estremamente rilevanti per la clinica. Pensiamo, ad esempio, all’eterogeneità di un tumore: le cellule che lo compongono sono differenti tra loro dal punto di vista fenotipico, proprio perché diverse tra loro a livello molecolare. Il fenotipo “risposta alla terapia” o quello “aggressività” dipendono da mutazioni del DNA o da alterazioni dell’espressione genica che possono essere identificate attraverso le tecniche di sequenziamento di terza generazione, capaci di descrivere le sottopopolazioni che compongono un medesimo tumore attraverso la caratterizzazione molecolare cellula per cellula.
Quali sono quindi le prospettive future? Non è più così utopico pensare di avere a disposizione il genoma del singolo paziente. In questo modo è possibile ottenere il quadro molecolare della patologia ma anche individuare precocemente la predisposizione a sviluppare una certa malattia e calibrare la terapia. La medicina personalizzata è inevitabilmente nelle migliori prospettive di sviluppo dell’assistenza sanitaria. E l’interdisciplinarietà sembra esserne la chiave: la biologia ha incontrato l’informatica e l’ingegneria per fornire risposte sempre più accurate. Quanto più veloci, a basso costo e automatizzate diventeranno le tecniche di sequenziamento, tanto più la diagnostica molecolare e la medicina personalizzata prenderanno spazio nella pratica clinica, portando i risultati della ricerca nella vita dei pazienti.