Dal 1990, momento iniziale del Progetto Genoma Umano (HGP, Human Genome Project), è nata la necessità di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i geni del genoma umano, al fine di comprendere la funzione dei geni appartenenti al genere umano. Il progetto, essendo terminato nel 2003, ha richiesto ben 13 anni di lavoro per l’ottenimento di una mappa completa del genoma degli esseri umani.

medicine-163707_1280.jpg

Grazie alle nuove tecnologie di sequenziamento di Next Generation Sequencing (NGS), interi genomi di esseri umani, di microrganismi o di piante possono essere sequenziati nell’ordine di pochi giorni. Si tratta di tecnologie estremamente avanzate ed automatizzate  che stanno rivoluzionando le possibilità e gli orizzonti applicativi in moltissimi settori. Con l’introduzione delle NGS si è ottenuto quindi un notevole aumento delle capacità di sequenziamento, basti pensare che il lavoro di sequenziamento del genoma umano durato 30 anni si può ottenere oggi in laboratorio in un giorno, in parallelo ad una riduzione dei costi.

 1280px-Illumina_logo.svg.png   Tecnologia di NGS

Nella tecnologia Illumina avviene il sequenziamento di un frammento di DNA (400 bp), o di un gene, o di un genoma di nostro interesse. Il sistema si può riassumere in 3 punti ben delineati:

  1. Preparazione della library
  2. Generazione dei cluster
  3. Sequenziamento

1. Preparazione della library

La preparazione della library è fondamentale per un sequenziamento ottimale. Il DNA di nostro interesse viene estratto dal campione, disposto in provetta e frammentato per sonicazione. Successivamente si aggiungono in provetta deossi-ribonucleotidi trifosfato (dATP) e una TAQ polimerasi modificata (privata dell’attività esonucleasica). La DNA polimerasi mutata ripara le estremità frammentate, le fosforila e successivamente fa protrudere alle estremità 3′ del nostro frammento delle adenine (A). Intanto in un’altra provetta si prepara una soluzione contenente degli adattatori molecolari (molecole di DNA a doppio filamento) di sequenza nota con delle timine (T) spaiate al 5′. Le due soluzioni si miscelano e i nostri adattatori molecolari andranno ad ibridarsi  attraverso un legame fosforico con le A sulle estremità del filamento. In questo modo si otterrà un DNA a doppio filamento di cui si conosce la sequenza delle estremità. Per la generazione dei cluster, inoltre, la library deve avere regioni di legame P5 e P7 che interagiscono con gli oligonucleotidi immobilizzati sulla Flow cell (vetrino su cui avverrà il sequenziamento).

DNA_Processing_Preparation.png

2. Generazione dei cluster

La generazione dei cluster è il processo in base al quale ciascun frammento della libreria viene clonato in migliaia di copie identiche. Questa fase avviene sulla Flow cell, un vetrino dotato di canali fluidici o corsie nelle quali avviene la chimica di sequenziamento. Sul vetrino ci sono delle piccole sequenze di DNA immobilizzate (pochi oligonucleotidi, figura A), la cui sequenza è complementare a quella degli adattatori molecolari generati nella fase di preparazione della library.

Oligonucleotide_chains_in_Flow_Cell (1)Figura A.

Il DNA di interesse viene denaturato e si fa fluire la soluzione (contenente il DNA a singolo filamento)  nei canali fluidici della flow cell. In questo modo, il DNA si ibrida con i dNTP immobilizzati (Figura 1). Una volta ricreate le condizioni ottimali, si avvia la reazione di PCR (fornendo dNTP) e viene sintetizzato il filamento complementare da una DNA polimerasi già presente sul vetrino e che lega covalentemente i primer per la reazione. Il filamento complementare viene sintetizzato sugli oligonucleotidi fissati grazie al 3’OH libero. Alla fine di questa fase si saranno formati DNA a doppio filamento. I DNA vengono denaturati per permettere la formazione dei ponti (figura 2) e il DNA originale viene lavato via trattenendo il filamento “reverse”.

Le molecole di DNA a singolo filamento si curvano per permettere all’adattatore molecolare dell’altra estremità di trovare la sequenza  complementare sul vetrino (annealing, figura 2). La polimerasi sintetizza il filamento complementare (figura 4), il DNA a ponte viene denaturato e risolto in due DNA a singolo filamento: “reverse-strand” e “forward strand” (figura 5). Tale processo viene ripetuto diverse volte producendo tante molecole di DNA (cloni) a singolo filamento secondo un andamento esponenziale.

Cluster_Generation.png

Per preparare i frammenti al sequenziamento si esegue la linearizzazione aggiungendo un bloccante al 3’OH per evitare una ulteriore amplificazione per PCR. Otterremo quindi infine tantissimi cluster clonali sulla flow cell. Per l’ottenimento di una densità di cluster ottimale si esegue la quantificazione della library prima del sequenziamento.

3. Sequenziamento – Sequencing by sinthesis (SBS)

Il sequenziamento avviene per uno strand alla volta, altrimenti si avrebbe troppo rumore di fondo. Si bloccano i cluster per selezionare quelli da sequenziare, quindi alcuni frammenti avranno un bloccante sul 3’OH e altri no (per esempio si può iniziare il sequenziamento con i cluster “forward” bloccando i “reverse”).

Sequencing_by_synthesis_Reversible_terminators.pngSi aggiunge un primer di sequenziamento che si appaia nella regione tra il primer a monte e l’inserto. A questo punto parte la reazione di sequenziamento; vengono forniti i dNTP per la reazione e la polimerasi aggiunge un dNTP fluorescente in direzione 3’OH.  Dato che il dNTP aggiunto porta con sè un marcatore fluorescente, la polimerasi non può aggiungere un ulteriore nucleotide. Con l’aggiunta di un tampone, il marcatore si libera ed emette un segnale fluorescente che viene riconosciuto da un apposito sistema di rilevazione. Viene quindi aggiunta una base alla volta e ad ogni aggiunta si ha la rilevazione di un segnale di una lunghezza d’onda univoca (da quì il nome sequencing by sinthesis), che permette di identificare la base che è appena stata sequenziata. Il frammento viene sequenziato prima in un verso e poi in un altro e poi sovrapposti per poter determinare la sequenza corretta.

microarray_and_sequencing_flow_cell.svg_-1.png

 

 

Le immagini sono state utilizzate dalle fonti: en.wikipedia.org, commons.wikimedia.org.