Genomica e trascrittomica

Negli ultimi anni, gli enormi progressi nella biologia, medicina e nelle tecnologie hanno creato le basi per la comprensione delle informazioni contenute nel nostro DNA, il genoma.

In particolare le nuove tecnologie di sequenziamento, Next Generation Sequencing (NGS), ci consentono finalmente per la prima volta di accedere alla sequenza di DNA in un modo semplice ed efficace, fornendo una valutazione personale delle informazioni genetiche di ogni individuo. Mentre la maggior parte delle differenze nella sequenza di DNA tra persone diverse sono innocue, alcuni cambiamenti possono determinare l’insorgenza di patologie o aumentare la probabilità personale di rischio. Alcune malattie sono causate direttamente da un difetto genetico, mentre altre, più complesse, si possono sviluppare dall’interazione tra predisposizione genetica e fattori ambientali (dieta, stile di vita, l’esposizione a particolari sostanze, ecc). L’avvento di queste tecnologie ha determinato un rapida intensificazione della portata e velocità di completamento dei progetti di sequenziamento del genoma. Con la grande quantità di dati sul DNA umano generato dal Human Genome Project e da altre ricerche genomiche, scienziati e medici hanno strumenti più potenti per studiare il ruolo che più fattori genetici insieme con l’ambiente giocano in malattie molto complesse. Le tecnologie avanzate per la genomica, disponibili presso il Laboratorio di Genomica, sono concentrate intorno al sequenziamento di nuova generazione (NGS) utilizzando le piattaforme dell’ Illumina (Nextseq500) e della Thermo Fisher (Ion Proton). Il laboratorio è focalizzato sull’esecuzione di una serie di analisi genetiche, e sull’ottimizzazione e sviluppo di protocolli scientifici in modo da soddisfare una serie di applicazioni. .
STRUMENTAZIONI
  •   Next Generation Sequencing – questa nuova tecnologia permette il sequenziamento completo del genoma, esoma e trascrittoma, in poche ore per ottenere informazioni sullo stato alterato o normale associato alla malattia. L’FPS dispone di due diverse piattaforme NGS disponibili, un Illumina NextSeq 500 e un sistema della Life Technologies, Ion ProtonTM.
  • Genetic Analyzer – sequenziamento Sanger e l’analisi dei frammenti viene condotta con il Genetic Analyzer 3500 (Thermo Fisher), uno strumento di sequenziamento a 8 capillari specificamente progettato per sequenziare frammenti di DNA piu’ corti di 100bp. L’analizzatore è utilizzato per una varietà di applicazioni diverse: convalida NGS, genotipizzazione di SNP, perdita di eterozigosi, analisi conformazionale (SSCP), analisi dei microsatelliti, analisi di frammenti.
  • Digital Droplet PCR system – il QX100TM (Biorad) è usato per la quantificazione del DNA o RNA. Le principali applicazioni sono: variazione del numero di copie, identificazione di sequenze rare, analisi di espressione genica, analisi di miRNA, analisi di singole molecole, rilevazione di patogeni, analisi di librerie per la tecnologia NGS.
  • Real Time PCR e strumentazioni di PCR standard – la ™ Real-Time PCR Detection System CFX96 touch offre una PCR quantitativa a 5 canali. MAcchine per la PCR ella Eppendorf e Biorad sono a disposizione per eseguire reazioni di amplificazione PCR standard.
  • Estrattore di acidi nucleici – uno strumento di ricerca Maxwell® 16 MDx offre l’estrazione automatizzata di DNA e RNA da più tipi di campioni. Sono disponibili metodi preprogrammati per volumi di eluizione sia standard (SEV) di 200μl-400μl che volumi di eluizione bassi (LEV) come 25μl.
  • Quantificazione di DNA / RNA – il Qubit (Thermo Fisher) e il Tape Station Bioanalyzer (Agilent) vengono utilizzati per misurare la concentrazione di DNA e RNA, e per il controllo della qualità dei campioni prima dell’analisi NGS.
  • Microdissezione Laser – un sistema di microdissezione laser basato su un microscopio semi-confocale viene utilizzato per l’isolamento accurato delle cellule o delle regioni di tessuto d’interesse. Tale isolamento è necessario per ottenere il profilo molecolare di specifiche cellule dai campioni di tessuto tumorale spesso altamente eterogeneo. DNA, RNA, protein e lipidi possono quindi essere isolati e analizzati. Il sistema è costituito da un microscopio apotome 2 Axio Observer Z1 dotato di un sistema di microdissezione laser Palm Robomover (entrambi Zeiss).
  • ChemiDoc™ Imaging System – è usato per l’imaging dei gel di DNA / RNA o Western Blot. È progettato per chemiluminescenza, e per la visualizzazione immediata di proteine senza colorazione del gel e verifica istantanea di trasferimento proteine.

Il Laboratorio di Genomica e Trascrittomica comprende anche una CELL FACILITY completamente attrezzata per la caratterizzazione tramite studi funzionali dei risultati di NGS o di proteomica. La strumentazione specifica comprende:

  • Zeiss Microscope Stage Incubator – sistema di incubazione con controllo della temperatura e della CO2 per l’imaging cellulare in vivo mantenendo le condizioni fisiologiche con microscopio semi-confocale..
  • LUNA™ Automated Cell Counter
  • Flow cytometry – un CyFlow Cube Sorter (Partec) permette una rapida analisi di popolazioni cellulari, misurando il volume, la morfologia, la fluorescenza. La funzione associata di “sorter” permette di isolare specifici sottogruppi di cellule (con caratteristiche morfologiche e fluorescenti definite) da popolazioni cellulari eterogenee.
  • Metabolic flux analyzer – il ruolo del metabolismo nei processi cellulari e fisiologici è ben definito, infattie esistono molte malattie, ora, legate alla disfunzione o riprogrammazione metabolica. Il Seahorse (Agilent) consente la quantificazione della bioenergetica cellulare misurando il flusso della respirazione mitocondriale e la glicolisi in cellule vive. Il sistema Seahorse permette la manipolazione delle cellule durante i test, per studiare come le cellule rispondono a specifici stimoli.
  • IVTech-bioreactors – sistemi di colture cellulari avanzate possono essere utilizzati per eseguire modelli dinamici 3D in-vitro, seguendo i protocolli standard. Provvisto di un modulo base, LB1, un bioreattore a flusso unico trasparente che può essere utilizzato per simulare tessuti metabolici, quali fegato e di un’unità più avanzata, LB2, che può essere utilizzata per simulare barriere fisiologiche, come nel polmone, pelle, epiteli intestinale in doppio flusso. Progettato per lo sviluppo di modelli di tessuti fisiologicamente complicati e per la riduzione e il perfezionamento dei test sugli animali. Tutti i nostri dispositivi consentono in situ -imaging dal vivo e possono essere collegati tra loro per simulare sistemi multi-organo.
APPLICAZIONI

Piccole e grandi quantità di materiale di partenza:

  • Analisi di DNA seq (intero genoma, intero esoma, CNV analisi) e RNA-Seq (intero trascrittoma) su tessuti freschi congelati, tessuti FFPE, liquidi biologici e campioni di colture cellulari.
  • Analisi di DNA seq (intero esoma e CNV) e RNA-Seq (intero trascrittoma) su campioni microdissecati freschi e FPPE. Possiamo lavorare su poche decine fino ad alcune centinaia di cellule per esperimento. I tessuti FFPE e i campioni fissati sono sempre stati campioni molto impegnativi da trattare. Fortunatamente, le moderne tecnologie hanno reso sempre più possibile lavorare con questo tipo di materiale, unico per il suo grande potenziale. Più impegnativi sono i campioni microdissecati freschi e fissati. La microdissezione consente la raccolta di cellule specifiche e omogenee consentendo il superamento del problema dell’eterogeneità dei tessuti. In particolare, molti tumori solidi sono caratterizzati dall’eterogeneità all’interno delle popolazioni cellulari. L’eterogeneità inter-tumorale e intra-tumorale viene rilevata quotidianamente dai patologi e può avere importanti conseguenze per gli approcci di medicina personalizzata. Nel nostro laboratorio, abbiamo sviluppato metodi di sequenziamento di nuova generazione che permettono l’indagine dell’intero esoma e dell’intero profilo trascrittomico di piccole quantità di materiale degradato di partenza. I nostri protocolli sono basati sulla tecnologia di amplificazione Ampli1 / SMARTer e sui protocolli Illumina / Ion Proton che abbiamo modificato con attenzione.
  • Pannelli di geni per analisi mutazionale e di espressione genica, utilizzando la tecnologia NGS e arrays commerciali.
  • Analisi molecolari con Digital PCR.
BIOINFORMATICA

Pipeline per l’analisi dei dati di RNA-Seq

Gli obiettivi principali dell’analisi dei dati RNA-Seq sono la valutazione dell’espressione genica e dell’espressione differenziale, l’analisi di trascritti alternativi, l’espressione allele specifica, l’analisi mutazionale, il rilevamento di trascritti di fusione e l’RNA editing. Ogni tipo di analisi di RNA-Seq richiede una serie di analisi a passaggi differenti ma esistono tuttavia passaggi comuni. Nel nostro istituto usiamo tecniche di RNA-Seq per confrontare condizioni diverse (migliore vs prognosi peggiore) o risposte diverse a trattamenti terapeutici
  • Nella nostra pipeline di analisi dei dati, eseguiamo il controllo di qualità (QC) dei dati grezzi come primo passo della workflow di analisi. Usiamo un software come FastQC per valutare la qualità. Inoltre, valutiamo l’eventuale contaminazione dovuta a microorganismi (batteri, funghi, virus) applicando il software FastqScreen.
  • La seconda fase della pipeline è l’allineamento. Attualmente, usiamo come mapper, il software Star. Questo allineatore utilizza il genoma come riferimento ed è uno “spliced aligner”. Con questo tipo di approccio aumenta la probabilità di identificare nuovi trascritti.
  • Per la ricostruzione del trascrittoma, usiamo un approccio “reference-guided”, che risulta particolarmente vantaggioso quando le informazioni di annotazione del genoma sono ben note, come ad esempio per l’uomo e per il topo. Tale approccio è utilizzato nel software “Cufflinks”, che usiamo in maniera preferenziale. “Cufflinks” è anche in grado di quantificare l’espressione di isoforme geniche.
  • L’espressione genica differenziale viene eseguita utilizzando “Cuffdiff”, un software incluso nella più ampia suite costituita da “Cufflinks”, e utilizza un metodo di rilevamento basato sui trascritti.
  • L’esplorazione e la visualizzazione dei dati viene eseguita utilizzando il pacchetto R, “cummeRbund, in grado di convertire ed analizzare i file generati da “Cuffdiff”, mettendo in relazione geni, trascritti, siti di inizio trascrizione e regioni codificanti. È possibile generare numerosi grafici comunemente usati per le analisi di RNA-seq.
Recentemente abbiamo introdotto l’utilizzo di SeqMonk, uno strumento in grado di visualizzare e analizzare i dati di sequenza già allineati. È possibile calcolare i conteggi grezzi di espressione per ciascun campione e produrre una matrice di dati per le analisi successive. L’analisi dell’espressione differenziale viene eseguita con “EdgeR”, un tool eseguito in R.   Implementazione di Pipeline per l’analisi dei dati di DNA-seq Per analizzare i dati provenienti da esperimenti genomici di NGS (genoma, esoma e analisi basate su pannelli di geni) usiamo, SeqMule, uno script pienamente personalizzabile che in grado di eseguire la maggior parte dei software open source comunemente usati per l’analisi mutazionale. Abbiamo introdotto questa suite di software per analizzare i dati provenienti dal sequenziatore Illumina (NextSeq500). Il primo passo di questo tipo di analisi consiste nel controllo di qualità (QC) e nell’allineamento delle reads generate dalla macchina. Anche in questo caso utilizziamo FastQC per valutare la qualità dei dati. L’allineamento viene poi eseguito da BWA-MEM, che costituisce la scelta preferenziale per le pipelines di analisi mutazionale. Gli altri step sono:  
  • Marcatura dei duplicati. Viene effettuata con Picard che marca i duplicati di PCR, che potrebbero generare dei bias nella stima delle frequenze alleliche delle varianti.
  • Riallineamento locale e ricalibrazione della qualità delle basi. Utilizziamo “Genome Analysis Toolkit” (GATK) realigner” e “GATK recalibration” che aiutano a correggere i disallineamenti e i bias sistematici, riducendo i falsi positivi durante la chiamata delle varianti.
  • Chiamata delle varianti. Eseguita utilizzando Samtools, GATK e FreeBayes. Questi software rilevano entrambi SNPs e indels ed i risultati sono successivamente scritti in un file (variant call format,VCF) per ciascuno dei tre tools. Inoltre un file VCF di consenso riporta tutte le varianti condivise da i tre software.
  • Annotazione e filtraggio delle varianti. Questa fase viene eseguita utilizzando diversi software come Wannovar, Enlis Genome Research e Illumina Variant Studio (Illumina BaseSpace).
Tutte le pipeline e tutti i software richiesti sono installati e implementati in tre workstation Dell PowerEdge con 32 cpu cores, 128 GB di RAM e 16 TB di spazio di archiviazione. Il Laboratorio di Genomica e Trascrittomica è diretto da Chiara Maria Mazzanti.