Einzelzell-Epigenomik des Immunsystems
Die Einzelzell-Epigenomik hat sich in den letzten Jahren als Methodik etabliert, mit der verschiedene Ebenen der epigenetischen Regulation in einzelnen Zellen untersucht werden können, um unvoreingenommene Analysen von Zellidentität und -funktion zu ermöglichen. Durch die integrierte Analyse mehrerer solcher epigenetischer Regulationsebenen in einzelnen Zellen können sowohl die zelluläre Heterogenität als auch die molekularen Mechanismen, die das Genom mit dessen Funktion verbinden, mit beispielloser Auflösung untersucht werden. Diese vielschichtigen Informationen bieten Einblicke in die Geschichte einer Zelle und ihr zukünftiges Potenzial in Hinblick auf Entwicklung, Homöostase und Krankheit.
Schlüsselwörter: Epigenomik, Einzelzellanalyse, Sequenzierung
Einleitung
Die Epigenomik behandelt die komplexen Mechanismen, die die Aktivität der Gene einer Zelle regulieren. Während jede Zelle eines Individuums im Wesentlichen das gleiche Genom enthält, bestimmt das Epigenom der Zelle, welche Bereiche des Genoms aktiv sind, und entscheidet somit über die funktionelle Diversifizierung in verschiedene Zelltypen und Zustände. Zudem kann jede einzelne Zelle dynamisch mit epigenomischen Veränderungen auf externe Faktoren wie Umwelt, Ernährung oder Stress reagieren [1]. Auf Grundlage dieser Erkenntnisse wurden neue Technologien entwickelt, die es uns heute ermöglichen, verschiedene Mechanismen epigenetischer Regulation in Tausenden von einzelnen Zellen in einem Experiment zu erfassen und somit erlauben, Zellentwicklung, -differenzierung oder -aktivierung mit einer zuvor unmöglichen Auflösung zu studieren. Des Weiteren können erstmals Fragen zu zellulärer Heterogenität, stochastischem versus determiniertem Zellverhalten, sowie zu Einflüssen der Zell-Zell-Kommunikation mit Einzelzellauflösung in nicht reduktionistischen Systemen direkt ex vivo untersucht werden. Die Anwendung solcher Methoden auf Patientenmaterial eröffnet zudem völlig neue Möglichkeiten für die Identifizierung von Biomarkern und therapeutischen Zielstrukturen.
Wir stellen hier die neuesten methodischen Entwicklungen der Einzelzell-Epigenomik vor. Für ausführlichere Literatur verweisen wir auf ein von uns kürzlich verfasstes Buchkapitel, welches auch die analytischen Herausforderungen dieses neuartigen Datentypus thematisiert (akzeptiertes Kapitel im Lehrbuch „Epigenetics of the Immune System“,
Elsevier 2019).
Einzelzell-Epigenomik-Technologien
Epigenomische Regulation ist äußerst komplex, setzt sich aus vielen Komponenten zusammen und erfordert unterschiedlichste Methoden, um DNA-Modifikationen, Protein-DNA-Interaktionen, oder Chromatinstruktur und Chromosomenkonformation in Gänze zu erfassen (Abb. 1).
Daher zielen neueste Technologien darauf ab, mehrere dieser Ebenen gleichzeitig in einzelnen Zellen zu bestimmen.
DNA-Modifikationen
Chemische Modifikationen genomischer Nukleotide, wie Methylierung (5mC) oder Hydroxymethylierung (5hmC) von Cytosinresten, sind an der epigenomischen Regulation diverser biologischer Prozesse beteiligt. Derartige Veränderungen können mittels Bisulfit-Sequenzierung (BS-seq) [2] erfasst werden. Auf Einzelzellebene wurde die Analyse der Methylierung erstmalig mittels der „single-cell reduced-representation bisulfite sequencing”-Methode (scRRBS-seq) durchgeführt [2], wobei diese noch keine vollständige Abdeckung des Genoms erlaubte. Das sogenannte „multiplexed scRRBS-seq“ (MscRRBS-seq) stellte eine Weiterentwicklung dar, bei der kritische experimentelle Schritte durch Markierung einzelner Zellen mit Barcodes in Zellgemischen durchgeführt werden konnten, was in Anbetracht der geringen Mengen biologischen Ausgangsmaterials eine deutliche Effizienzsteigerung ermöglichte [3]. Die erweiterte Abdeckung des Genoms wurde unter anderem durch den sogenannten „post bisulfit adapter tagging“ (PBAT)-Ansatz erzielt, bei dem der Bisulfit-Umwandlungsschritt vor der Bibliotheksherstellung durchgeführt wird [4]. Auch Cytosin-Hydroxymethylierungen können inzwischen mithilfe eines von der Glukosylierung abhängigen DNA-Aufschlusses auf Einzelzellebene (scAba-seq) erfasst werden [5].
Protein-DNA Interaktion
Chromatin-Immun-Präzipitation (ChIP) gekoppelt mit Sequenzierung (ChIP-seq) ist die Methode der Wahl zur Identifikation von Histonmodifikationen. Durch Kombination von Mikrofluidik und genomischem „Barcoding“ konnte diese Methode auf die Einzelzellanalyse angepasst werden [6]; trotz geringer Sensitivität pro Zelle ermöglicht sie, intrazelluläre Heterogenität dieser Modifikationen zu messen. Zur Analyse der Bindung von Transkriptionsfaktoren an gewisse Regionen der DNA wurde die „single-cell DNA adenine methyltransferase identification using sequencing“-Methode (scDamID-seq) entwickelt [7]. Dabei werden Zellen mit einem Fusionsgen transfiziert, welches für einen Transkriptionsfaktor und das Dam-Gen aus Escherichia coli (E. coli) kodiert. Bei Expression methyliert das Dam-Protein Adenosine in der Nachbarschaft der Bindungsstelle des Transkriptionsfaktors, welche nachfolgend durch das methylierungsempfindliche Restriktionsenzym DpnI geschnitten und mittels Ligation von Sequenzierungsadaptern messbar gemacht werden.
Chromatinstruktur
Die fortgeschrittenste Technologie der Einzelzell-Epigenomik erfasst die Chromatinstruktur, sprich die Struktur der Nukleosomen im Genom und somit die Zugänglichkeit der DNA. Von offenen Chromatinstrukturen spricht man, wenn die Nukleosomen einen derart großen Abstand aufweisen, dass regulatorische Elemente, Promotoren oder Gen-kodierende Sequenzen zugänglich sind und von anderen Proteinen gebunden werden können. Offenes Chromatin lässt indirekt Rückschlüsse auf die aktive Nutzung einer genomischen Region zu. Die erste Methode zur Erfassung offener Chromatinstrukturen, die sogenannte sciATAC-seq-Methode [8], basiert auf dem „assay for transposase-accessible Chromatin using sequencing“ (ATAC-seq) [9], bei dem eine Tn5-Transposase verwendet wird, um DNA zu fragmentieren und zeitgleich Adaptersequenzen einzufügen – erweitert durch eine kombinatorische Kodierungsstrategie, die als „single combinatorial indexing“ (sci) ATAC bezeichnet wurde. Bei diesem Ansatz werden Zellkerne mit individuellen Kombinationen aus DNA-Barcodes markiert, indem sie in Pools in mehreren aufeinanderfolgenden Runden markiert und durchmischt werden (split-pool barcoding) [8]. ATAC-seq wurde außerdem mittels Mikrofluidik für die Einzelzellanalyse angepasst [10] und ist mittlerweile für die Hochdurchsatzanalyse Tausender Zellen anwendbar [11, 12]. Eine weitere Entwicklung stellt das „transposome hypersensitive site sequencing“ (THS-seq) [13] dar, welches eine erhöhte Sensitivität für die Erfassung offener Chromatinstrukturen als die ATAC-seq basierten Verfahren aufweisen soll. Weitere Alternativen zu den Transposase-basierten Methoden sind solche Ansätze, bei denen sowohl das Methylom als auch die Positionierung der Nukleosomen (nucleosome occupancy and methylome sequencing, NOME-seq) gemessen werden. Auch diese Methode wurde inzwischen für die Analyse einzelner Zellen weiterentwickelt [14] und kann durchaus als Multi-Omics-Methode angesehen werden, da nicht nur offene Chromatinstrukturen, sondern auch die funktionelle Aktivität der zugängigen DNA in Form von Methylierung in einem Verfahren erfasst werden.
Chromosomenkonformation
Die räumliche Anordnung der Chromosomen im Zellkern ist ein entscheidender Faktor für die Funktionalität des Genoms. Entsprechend der Positionierung der Chromosomenabschnitte können offene oder geschlossene Regionen geschaffen, sowie entfernte regulatorische Regionen in die Nähe ihrer Zielgene gebracht werden. Diese räumliche Verteilung trägt zu dem Zelltyp-spezifischen Epigenom bei. Zusätzlich können innerhalb der Zelltyp-Grenzen einzelne Gene durch Einflüsse aus dem Mikromilieu der Zelle epigenetisch reguliert werden. Um diese dreidimensionalen Prozesse zu erfassen, wurden zahlreiche Verfahren entwickelt, von denen einige bereits auf Einzelzellebene anwendbar sind. Hervorzuheben ist hier zurzeit die sogenannte „single-cell combinatorial indexed chromosome conformation capture using sequencing“ (sci-HiC-seq)-Methode, bei der alle Verfahrensschritte mithilfe kombinatorischer Zellmarkierung für die Einzelzellanalytik angepasst wurden [15]. So kann die Chromosomenkonformation prinzipiell bereits für Tausende von Zellen parallel gemessen werden.
Einzelzell-Multi-Omics
Die gleichzeitige Erfassung unterschiedlicher epigenetischer Regulationsmechanismen oder epigenetischer Parameter gemeinsam mit Transkriptomdaten verspricht eine fundamentale Vertiefung unseres Verständnisses der Genregulation in einzelnen Zellen [16]. Ein Beispiel ist die oben bereits erwähnte scNOME-seq-Methode [14]. Aber auch von anderen Kombinationen wurde bereits berichtet, z. B. von DNA-Methylom und Transkriptom (scM&T-seq) [17], Genom und Transkriptom (G&T-seq) [18], Protein-DNA-Interaktion und Transkriptom (scDam&T-seq) [19], und sogar von einer Kombination aus Methylom, Genom und Transkriptom („single-cell nucleosome, methylation and transcription sequencing“, scNMT-seq) [20]. Auch die Messung der Chromatinstruktur mittels scATAC-seq wurde bereits mit scRNA-seq gekoppelt [21]. Auch wenn alle diese Multi-Omics-Ansätze auf Einzelzellebene bislang hoch explorativ sind, und einige der Methoden zunächst durch weitere Arbeitsgruppen validiert werden müssen, ist davon auszugehen, dass Einzelzell-Multi-Omics-Verfahren in den nächsten Jahren zum Standardrepertoire in der Epigenomik zählen werden.
Einzelzell-Epigenomik des Immunsystems
Epigenetische Untersuchung einzelner Immunzellen abseits von Omics-Technologien wird seit einiger Zeit zur Untersuchung immunologischer Fragestellungen verwendet. Allerdings gaben diese Einzelzellverfahren noch keine genomische Auflösung und somit keine Genlokus-spezifischen Informationen. Beispiele hierfür sind die durchflusszytometrische Messung von Transkriptionsfaktoren wie FOXP3 bei regulatorischen T-Zellen [22], die Messung globaler DNA-Methylierung [23] oder von Histonmodifikationen [24].
Da epigenomische Prozesse insbesondere bei der Differenzierung von Zellen eine wesentliche Rolle spielen, ist es nicht verwunderlich, dass die Entwicklung von Immunzellen während der Hämatopoese ein erstes Anwendungsfeld von Einzelzell-Epigenomik war. Die kombinierte Analyse von Einzelzell-Transkriptomen und genomweiten Histonmodifikationen muriner Knochenmarkzellen ließ darauf schließen, dass die Zelltypzugehörigkeit der Zellen des myeloiden Kompartiments bereits sehr früh in der Myelopoese festgelegt wird [25, 26]. Für die murinen hämatopoetischen Stammzellen konnte mithilfe von Einzelzell-Multi-Omics-Analysen aufgezeigt werden, dass dieses Stammzell-Kompartiment viel heterogener als bisher angenommen ist und eine klar gegliederte Hierarchie von Funktionalitäten aufweist, die epigenetisch gesteuert sind [27].
Hierbei ermöglichte sogenanntes Lineage-Tracing klonale Beziehungen und die zelluläre Heterogenität während der Differenzierungsprozesse der Hämatopoese auf Einzelzellebene zu erfassen [28, 29]. Die Messung offener Chromatinstrukturen wurde genutzt, um die zeitlichen Abläufe der Entwicklungsstufen in der menschlichen Hämatopoese auf Einzelzellebene zu beschreiben [30]. Mittels einer verbesserten scATAC-seq-Methode (dsciATAC-seq) wurden hierfür inzwischen bereits mehr als 135.000 epigenomische Profile aus menschlichem Knochenmark etabliert [11]. Darüber hinaus wurde Einzelzell-Epigenomik bereits erfolgreich verwendet, um die unterschiedlichen Immunzellen im peripheren Blut zu definieren [31]. In der Tat konnte die Identität der Zellen durch epigenomische Analysen genauer definiert werden, als dies mithilfe der Einzelzell-Transkriptomik möglich ist. Von großem Interesse wird es sein, beide Methoden zu verbinden und zu vergleichen. Auch die Kombination von Einzelzell-Genomanalytik mit der Erfassung der offenen Chromatinstrukturen einzelner B-Zellen hat zu unerwarteten Ergebnissen geführt. So konnte gezeigt werden, dass die Anzahl der somatischen Mutationen bei B-Zellen von Neugeborenen weniger als 500 pro Zelle betrug, während die Zahl bei Hundertjährigen auf mehr als 3.000 anstieg [32]. Dabei kam es insbesondere in aktiven Chromatinregionen zur Anreicherung von Mutationen, was im Zusammenhang mit vermehrtem Auftreten von B-Zell-Leukämien und Funktionsverlust der B-Zellen im Alter stehen könnte. Insgesamt nimmt die Variabilität der Chromatinmodifikationen auf Einzelzellebene mit dem Alter zu, wobei Zwillingsstudien zeigen konnten, dass die Variabilität auf Umwelteinflüsse und nicht auf genetische Einflüsse zurückzuführen ist [24]. All diese Beispiele zeigen auf, wie Einzelzell-Epigenomik Biologie erfasst, die uns zuvor nicht zugänglich war.
Fazit
Einzelzell-Epigenomik wird unsere Sichtweise auf zelluläre Vorgänge deutlich erweitern. Die schiere Komplexität wird durch die Vielzahl unterschiedlicher Technologien reflektiert, die für einzelne Aspekte der Einzelzell-Epigenomik notwendig sind (Abb. 1). Zwei weitere Dimensionen, die in den nächsten Jahren vermehrt Einzug in die Einzelzell-Epigenomik halten werden, ist die Analyse in Raum und Zeit, sprich die epigenetische Analyse einzelner Zellen in ihrem jeweiligen Zellverband in vivo über die Zeit. Großen Raum werden auch neue oder verbesserte Computer-gestützte Analyseverfahren einnehmen, um die Einzelzell-Epigenomik in vielen Projekten erfolgreich einsetzen zu können. Die Bedeutung dieser neuen wissenschaftlichen Disziplin für die Beantwortung wichtiger immunologischer Fragestellungen ist immens, und so wird es sicherlich in Zukunft notwendig sein, Schwerpunkte zu entwickeln, die sich diesem neuen Forschungsgebiet widmen.