Grundlagen und molekulare Mechanismen der Genetik und Epigenetik
Der Körper eines erwachsenen Menschen besteht aus bis zu 100 Trillionen Zellen, die alle identische Kopien des Erbguts aus Desoxyribonukleinsäure (DNA) besitzen. Dessen Bausteine bestehen aus vier verschiedenen Nukleotiden, die jeweils aus einem Phosphatrest, dem Zucker Desoxyribose und einer von vier Basen [Adenin (A), Thymin (T), Guanin (G) und Cytosin (C)] zusammengesetzt sind. Durch die Basenpaarung von A und T sowie G und C können sich zwei komplementäre Polynukleotidstränge ausbilden, die die Form einer Doppelhelix annehmen.
Auch wenn ein beträchtlicher Teil der ca. 3 Milliarden DNA-Basenpaare (bp) fortwährend in Ribonukleinsäure (RNA)-Moleküle abgeschrieben („transkribiert“) wird, zeigen aktuelle Untersuchungen, dass nur ein Bruchteil des Genoms (ca. 3–5%) auch zu funktionellen RNA-Molekülen transkribiert wird. Eine Studie von Pertea und Kollegen identifizierte beim Menschen insgesamt 42.611 dieser Baupläne („Gene“), von denen 20.352 möglicherweise Anleitungen zur Herstellung („Translation“) von Eiweißmolekülen („Proteinen“) und 22.259 nicht-proteinkodierend sind (ncRNA, „non-coding RNA“) [1]. Während Proteine als universelle Bau- und Betriebsstoffe essentiell für das Funktionieren einer Zelle sind, kommen den nicht-proteinkodierenden RNA-Molekülen meistens strukturelle oder regulatorische Aufgaben zu.
Obwohl jede Zelle somit theoretisch in der Lage ist, mehr als 20.000 verschiedene Proteine herzustellen, spiegelt diese Zahl nicht die der tatsächlich vorkommenden Proteine wider. Einerseits kann die Anzahl an Anleitungen zur Herstellung von Proteinen, die Boten-RNA („Messenger-RNA“; mRNA), mittels des Prozesses des alternativen Spleißens durch unterschiedliche Zusammensetzung von mRNA-Teilstücken und Kombinationen dieser noch beträchtlich erhöht werden, sodass unterschiedliche Varianten eines Proteins mit möglicherweise auch unterschiedlichen Funktionen hergestellt werden können. Andererseits besteht ein so komplexer Organismus wie der Mensch aus mannigfaltigen Organen, Geweben und ca. 270 Zelltypen unterschiedlichster Funktionalität, sodass es Regulationsmechanismen der Genexpression gibt, die dafür sorgen, dass trotz der gleichen genetischen Ausstattung jeder Zelle in den verschiedenen Zellarten nur ein Bruchteil dieser Gene abgelesen und in Proteine übersetzt wird. Dies kann beispielsweise durch die gewebespezifische Aktivität von Transkriptionsfaktoren erreicht werden, aber auch durch vererbbare chemische Markierungen, auf die später eingegangen wird.
Damit der 3 Milliarden bp-lange DNA-Strang eines Genoms in den ca. 5–15 µm großen Zellkern einer menschlichen Zelle passt, muss die DNA komprimiert werden, da sie entfaltet eine Länge von ca. 2 Metern hätte. Dieses wird unter anderem dadurch erreicht, dass die DNA zu Chromosomen verpackt wird, die während der Lebensdauer einer Zelle in verschiedenen Stadien vorliegen. Das aktiv transkribierte Euchromatin liegt in gelockerter Form in der Zelle vor, während das inaktive Heterochromatin stark zusammengeknäult vorliegt. Die negativ geladene DNA ist in den Chromosomen mit basischen Histon-Proteinen (die viele positiv-geladene Aminosäuren besitzen) assoziiert, die die Nukleosomen bilden. Diese sind aus vier unterschiedlichen Histonmolekülen aufgebaut (H2A, H2B, H3 und H4), von denen je zwei Kopien in einem Nukleosom vorkommen, und die fundamentale, sich wiederholende Einheit des Chromatins darstellen. Um dieses „Histon-Oktamer“ ist die DNA 1,65-mal herumgewickelt, was einer DNA-Länge von 146 bp entspricht. Die Linker-DNA verbindet benachbarte Nukleosomen, wobei das Linker-Histon H1 die DNA direkt neben Nukleosomen bindet und die nächsthöhere Verpackungseinheit der DNA erlaubt, die sogenannte Perlenkettenstruktur. Über mehrere Zwischenstufen wird die DNA weiter zu einer Superhelix kondensiert, wobei das Chromosom schließlich den Endzustand darstellt, vergleichbar mit einem sehr langen Faden, der zu einem Wollknäuel aufgewickelt wird. In den meisten Körperzellen des Menschen (Ausnahme: Keimzellen) liegen die 23 Chromosomen als doppelter Chromosomensatz vor. Bevor sich eine Zelle teilt, verdoppelt sich das gesamte Erbgut, und zwei Kopien jedes Chromosoms werden anschließend an die entstandene Tochterzelle weitervererbt. Vorhandene oder während der Replikation des Erbguts entstehende Veränderungen der Basenabfolge („Mutationen“) im Genom von Keimzellen werden dabei an die Nachkömmlinge weitergegeben.
Vereinfacht wiedergegeben besagt eine der Annahmen in Charles Darwins Evolutionstheorie [2], dass diejenigen Individuen, die zufällig für die vorhandenen Umweltbedingungen besser angepasst sind als andere, einen Selektionsvorteil haben und häufiger überleben. Weitere wichtige Entdeckungen späterer Forscher(generationen) flossen in die Entwicklung der synthetischen Evolutionstheorie in der 1930er- und 1940er-Jahren ein (zusammengefasst z. B. bei [3]) und führten zu der Ansicht, dass nur die Sequenz der Gene (also ihre Basenabfolge) dafür notwendig, und Mutationen für eine positive oder negative Selektion verantwortlich sind. Im Laufe der letzten Jahrzehnte setzte sich allerdings die Erkenntnis durch, dass bestimmte biologische Merkmale („Phänotypen“) nicht nur durch Unterschiede in der primären DNA-Sequenz vererbt werden können, sondern dass die unterschiedliche Aktivität ein- und desselben Erbfaktors ebenfalls zur Entstehung von Phänotypen führen kann. Ebenso weiß man seit Jahren, dass auch Umwelteinflüsse ihre Spuren im Erbgut hinterlassen können – in Form sogenannter epigenetischer Veränderungen. Diese Modifizierungen verändern am Genom nicht primär die DNA-Sequenz, sondern deren chemische Struktur und/oder deren Verpackung, was zu einer Änderung der Genexpression führen kann. Bestimmte epigenetische Modifikationen werden auch bei einer Zellteilung kopiert, sodass epigenetische Informationen des Eltern-Genoms stabil an die Nachkommen-Generationen weitervererbt werden. Diese Befunde könnten auch mindestens teilweise Jean Baptiste Lamarck rehabilitieren, der in seiner Transformationslehre die Überzeugung vertrat, dass Lebewesen erworbene Eigenschaften an ihre Nachkommen weitergeben können [4]. Als wichtigste epigenetische Modifikationen wird im Folgenden kurz auf Histon-Modifizierungen und die DNA-Methylierung sowie auf die Bedeutung von nicht-kodierenden RNAs (ncRNAs) als direkte und indirekte Modulatoren der epigenetischen Regulation eingegangen.
Regulation der Genaktivität durch Histon-Modifizierungen
Die aminoterminalen Schwanzregionen der Histonstränge ragen aus dem Nukleosom heraus und sind Ziel von vielfältigen, post-translationalen Modifizierungen. Diese umfassen Phosphorylierungen an zahlreichen Serin- und Histidin-Resten sowie Methylierungen undAcetylierungen von Lysin- und Arginin-Resten unterschiedlichen Ausmaßes. Zusätzlich findet man das Anheften der regulatorischen Polypeptide Ubiquitin und SUMO an Lysinreste oder Citrullinierungen, d. h. die Umwandlung der Aminosäure Arginin zu L-Citrullin (Überblick in [5]; Abb. 1a).