Von der Zytogenetik zur Zytogenomik: „Eine für alle“ gibt es nicht!

Jahrzehntelang stellte die konventionelle Chromosomenanalyse als Hauptwerkzeug der Zytogenetik die einzige Methode dar, das komplette Genom eines Menschen auf Strukturveränderungen hin zu analysieren, allerdings lediglich auf einem grobstrukturellen Niveau von mehreren Millionen Basenpaaren. Die Revolution im Bereich der DNA-Sequenzierungstechnologien (Next Generation Sequencing) sowie neuere Technologien der Genomkartierung (optische Kartierung) ermöglichen es nun, das komplette Genom eines Menschen im Bereich einzelner Basenpaare auf Veränderungen zu analysieren und somit den Schritt von der Zytogenetik zur Zytogenomik zu vollziehen.

Schlüsselwörter: Zytogenomik, Strukturvarianten, Chromosomenanalyse, NGS, optische Kartierung

Im Jahr 2021 feiert eine Technik ihren 50. Geburtstag, die bis heute das Routineverfahren in der Zytogenetik darstellt: die G-Bänderung mittels Giemsa-Trypsin-Färbung (GTG-Bänderung) [1]. Bei dieser Technik der klassischen Chromosomenanalyse werden auf einem Objektträger fixierte Chromosomen im Metaphasenstadium des Zellteilungszyklus mit der Protease Trypsin behandelt, mit dem Farbstoff Giemsa angefärbt und anschließend im Lichtmikroskop analysiert. Das Ergebnis dieser Behandlung ist ein Muster heller, negativer und dunkler, positiver G-Banden, das für jedes der 23 menschlichen Chromosomenpaare charakteristisch ist und eine eindeutige Identifizierung einzelner Chromosomen ermöglicht. Ziel der Zytogenetik ist es, den Chromosomensatz eines Menschen auf Veränderungen seiner Zahl (numerische Aberrationen) und seiner Bandenabfolge (strukturelle Aberrationen) zu analysieren. Während numerische Aberrationen wie ein fehlendes (Monosomie, z. B. Ullrich-Turner-Syndrom) oder ein zusätzliches Chromosom (Trisomie, z. B. Down-Syndrom) problemlos nachzuweisen sind, können strukturelle Veränderungen eine große Herausforderung darstellen. Einen Überblick der Strukturvarianten (SVs) gibt Abb. 1. 

Da es sich bei Metaphasechromosomen um stark verkürzte DNA-Moleküle handelt, können strukturelle Veränderungen unterhalb von 4–6 Megabasenpaaren (Mb) nicht nachgewiesen werden. Stehen auf der Vorteilsseite der klassischen Chromosomenanalyse die Analyse des vollständigen Genoms eines Menschen auf dem Niveau einer einzelnen Zelle zu vergleichsweise geringen Kosten, so stehen auf der Nachteilsseite die Notwendigkeit lebender, teilungsfähiger Zellen und das geringe Auflösungsvermögen [2] (siehe Tab. 1). 

Molekulare Zytogenetik

Einen ersten wichtigen Schritt zur Verbesserung des Auflösungsvermögens stellte die seit Mitte der 1980er-Jahre in der Routinediagnostik eingeführte Fluo­reszenz-in-situ-Hybridisierung (FISH) dar [3]. Bei dieser Technik werden mithilfe fluoro­chrommarkierter, 50–200 Kilo­basenpaare (kb) großer DNA-Fragmente („Sonden“) die komplementären Regionen im Genom untersucht. Je nach verwendeter Sonde können somit Kopienzahlvarianten (Copy Number Variants, CNVs) in Form von Mikroduplikationen oder -deletionen wie dem DiGeorge-Syndrom (Deletion 22q11.2) deutlich unterhalb des mikroskopischen Auflösungsvermögens mit sehr hoher Zuverlässigkeit nachgewiesen und balancierte SVs genauer charakterisert werden. Neben dem verbesserten Auflösungsvermögen im Bereich der verwendeten Sondengröße bietet die FISH-Technik den großen Vorteil, nicht nur mitotische Zellen (Metaphase-FISH), sondern auch Zellkerne (Interphase-FISH) analysieren zu können. Dies ermöglicht u. a. die Analyse histologischer Schnittpräparate in der Onkologie oder von nativen Zellen in der Pränataldiagnostik (z. B. als pränataler Schnelltest zum Nachweis der häufigsten Trisomien). Ein großer Nachteil der FISH- gegenüber der Chromosomenanalyse besteht jedoch in der Notwendigkeit einer Verdachtsdiagnose, da die FISH-Analyse im Gegensatz zur Chromosomenanalyse keine genomweite Screeningmethode, sondern eine Zieldiagnostik darstellt.
Die nächste signifikante Verbesserung war die Einführung der chromosomalen Mikroarray-Analyse (CMA), die auf dem Prinzip der komparativen genomischen Hybridisierung (CGH) beruht [4]. Bei diesem Verfahren wird die DNA zweier Genome – in der Regel Patienten- und normale Referenz-DNA – mit unterschiedlichen Fluorochromen markiert und in einem 1 : 1-Verhältnis vermischt. Diese Mischung wird auf einen Objektträger pipettiert, auf dem mehrere Zehntausende, 40–60 Basenpaar (bp) lange DNA-Sequenzen in einem gitterförmigen Raster („Array“) immobilisiert vorliegen, die über das gesamte Genom verteilte Einzelkopiesequenzen repräsentieren. Die beiden Genome der DNA-Mischung konkurrieren um die Bindung an den immobilisierten DNA-Sequenzen. Mittels Laser werden anschließend die Intensitäten der beiden Fluorochrome berechnet und der log2-Wert des Signalintensitätsquotienten bestimmt. In balancierten genomischen Bereichen beträgt dieser Quotient 0 (log2-Wert des Verhältnisses 2 : 2), in einem Bereich mit Signalverlust (entsprechend einer Deletion) hingegen -1 und in einem Bereich mit Signalzugewinn (entsprechend einer Duplikation) +0,55. In Abhängigkeit von der verwendeten Plattform ermöglicht die CMA ein Auflösungsvermögen von bis zu 10 kb und somit ein 100–1.000fach höheres Auflösungsvermögen als die klassische Chromosomenanalyse. Die Einführung der CMA führte zur Entdeckung zahlreicher neuer Mikrodeletions- und Mikroduplikationssyndrome [Übersicht in 5] und stellt bis dato die wichtigste genetische Analysetechnik bei Patienten aus der Indikationsgruppe Intelligenzminderung/Entwicklungsverzögerung/angeborene Fehlbildungen (IM/ER/AF) dar mit einer Detektionsrate von ca. 15–20 %. Das große Manko der CMA liegt im fehlenden Nachweis balancierter Varianten. So erfolgreich die CMA bei der Detektion klinisch relevanter CNVs war, so zeigte sich sehr schnell, dass man die Komplexität des menschlichen Genoms deutlich unterschätzt hatte. Ausdruck fand dies in Form sogenannter Varianten unklarer Signifikanz (VUS), die hinsichtlich ihrer klinischen Relevanz für den Phänotyp des Patienten nicht eindeutig interpretierbar waren. 

Zytogenomik

Die molekulargenetische Diagnostik hatte seit Einführung der DNA-Sequenzierungstechnik nach der Sanger-Methode (1. Sequenzierungsgeneration) gegenüber der Zytogenetik den großen Vorteil eines maximalen Auflösungsvermögens auf dem Ein-Basenpaar-Niveau. Diesem gewaltigen Vorteil stand wie im Falle der FISH-Analyse die Notwendigkeit einer Verdachtsdiagnose gegenüber. Zudem handelte es sich bei der Sanger-Sequenzierung um eine aufwendige Methode, die nur bedingt automatisierbar war. 
Dies änderte sich ab Mitte der 2000er-Jahre mit der Entwicklung der Next Generation Sequencing (NGS)-Technologien [Übersicht in 6], die zu stark reduzierten Kosten und einem hohen Maß an Automatisierbarkeit auf Hochdurchsatzbasis führten und wahlweise die indikationsbezogene Analyse einzelner Gensätze (Paneldiagnostik), aller aminosäurekodierenden Abschnitte (Exons) im Genom (Whole Exome Sequencing, WES) oder des kompletten Genoms (Whole Genome Sequencing, WGS) ermöglichen. Die Techniken dieser 2. Sequenzierungsgeneration beruhen auf dem Prinzip der massiven parallelen Sequenzierung (MPS). Hierbei wird die isolierte DNA in kleine Fragmente zerlegt, nach Größenfraktionierung amplifiziert und abschließend sequenziert. Dadurch entstehen 75–250 bp große DNA-Fragmente, die als „Short Reads“ bezeichnet werden. Mithilfe ausgeklügelter bioinformatorischer Programme werden diese Short Reads wie bei einem Puzzle zu einer kontinuierlichen Genomsequenz zusammengefügt (Assembly) und durch Sequenzvergleich mit der humanen Genomreferenz (HGR) zur entsprechenden chromosomalen Lokalisation kartiert (Align­ment). Dieses bioinformatorisch erstellte virtuelle Patientengenom/-exom wird zum Abschluss seiner funktionellen Bedeutung zugeordnet (Annotation). Durch den direkten Abgleich der Patienten- mit der HGR-Sequenz können im nächsten Schritt Sequenzvariationen nachgewiesen werden, die entweder einzelne Basenpaare (single nucleotide variants, SNVs), bis zu 50 Basenpaare (Insertionen/Deletionen, kurz: Indels) oder mehr als 50 Basenpaare betreffen (Strukturvarianten, siehe Abb. 1) [7, 8]. Mit der Einführung der short read-basierten Sequenziertechniken in die Routinediagnostik seit Mitte der 2010er-Jahre konnte die Zahl geklärter Fälle aus der IM/ER/AF-Patientengruppe um weitere 15–40 % verbessert werden.
So erfolgreich Short-Read-Techniken bei der Detektion von SNVs, Indels und kleinen CNVs bis ca. 1 kb sind, so sehr leidet diese Technik beim Nachweis größerer CNVs und v. a. balancierter SVs sowohl an einer geringen Sensitivität von 30–70 % als auch an einer sehr hohen Falsch-Positiv-Rate von bis zu 85 %. Um diese Nachteile zu überbrücken, wurden in den letzten Jahren Long-Read-Techniken mit Read-Längen von 10–100 kb bis zu 2 Mb entwickelt (3. Sequenzierungsgeneration) [9, 10]. Kommerzialisiert wurden die unterschiedlichen Ansätze von den Firmen Pacific Biosciences (PacBio) in Form der Single Molecule Real Time (SMRT)-Sequenzierung und Oxford Nanopore Technology (ONT) in Form von spannungssensitiven Proteinporen. 
Long-Read-Techniken detektieren ca. drei- bis viermal mehr SVs im Vergleich zu Short-Read-Techniken, v. a. im Bereich von 50–1.000 bp. Zu den Nachteilen gehören momentan noch sehr hohe Sequenzierkos­ten und eine hohe Sequenzierfehlerrate von 8–20 %, die wiederum eine sehr hohe Falsch-Positiv-Rate bei SNVs bedingt. 
Um die Nachteile der Short-Read-Sequenziertechniken bzgl. der größeren SVs zu überkommen, wurde neben den Sequenziertechniken der 3. Generation mit der optischen Genomkartierung (Optical Mapping, OM) eine Methode entwickelt, die nicht auf Sequenzierung beruht [11]. Bei diesem Verfahren wird auf der Basis ultra-hochmolekularer DNA im Bereich von 100 kb bis zu 2 Mb-großer DNA-Fragmente durch Fluoreszenzmarkierung einer über 500.000x im einfachen, haploiden Genom vorliegenden Erkennungssequenz ein personenspezifisches Bandenmuster erzeugt (im Vergleich zu 400–600 Banden nach konventioneller Chromosomenanalyse). Auf der Basis dieses Bandenmusters kann die reale Organisation eines individuellen Genoms (De-Novo-Assembly) konstruiert werden, wohingegen Short-
Read-basierte Techniken nur eine virtuelle, sehr lückenhafte Genomrekonstruktion zulassen. Durch den Vergleich zwischen dem individuellen Bandenmuster mit dem Bandenmuster der HGR können sehr effektiv CNVs ab einer Größe von 5–10 kb und vor allem balancierte SVs mit hoher Verlässlichkeit nachgewiesen werden. Der große Nachteil der OM gegenüber den NGS-Techniken liegt naturgemäß in der fehlenden Sequenzinformation sowie in der begrenzten Auflösung.
Alle modernen Methoden der Zytogenomik haben ein Problem gemeinsam, das sich bereits mit dem Aufkommen der Mikroarray-Analysen abzeichnete: Mit zunehmender Auflösung steigt die Zahl der nachgewiesenen Sequenzvarianten signifkant an und mit ihr die Zahl der Varianten unklarer klinischer Signifikanz. So konnten Chaisson et al. [12] in einem umfassenden Vergleich der verschiedenen technologischen Plattformen über 800.000 Indels und über 27.000 SVs pro Genom nachweisen; das Problem des Variantennachweises im diagnostischen Rahmen hat sich in ein Problem der Varianteninterpretation gewandelt.
Eine weitere Schlussfolgerung: Trotz der Revolution der Sequenziertechniken gibt es nach wie vor nicht die „one for all“-Methode. Jede Technik hat ihre spezifischen Vor- und Nachteile, und nur eine sinnvolle Kombination der unterschiedlichen Techniken in Form einer Stufendiagnostik unter Berücksichtigung der klinischen Informationen wird in Zukunft eine umfassende, aber auch kos­tengünstige zytogenomische Diagnostik gewährleisten.

Autor
Dipl.-Biol. Uwe Heinrich
Abteilungsleiter Zytogenetik
MVZ Martinsried GmbH
Aus der Rubrik