Einsatz der Bioinformatik in der Onkologie

Analytik zellfreier Tumor-DNA beim Lungen- und Ovarialkarzinom

Die Hochdurchsatzsequenzierung (NGS) ist bei der Mutationssuche in Tumorgeweben und zirkulierender DNA zu einem unverzichtbaren Werkzeug der onkologischen Diagnostik geworden. Am Beispiel der EGFR- und BRCA1-Gene wird die Unterstützung durch bioinformatische Software und Datenbanken illustriert.

Schlüsselwörter: Bioinformatik, Onkologie, Liquid Biopsy, NSCLC, EGFR, BRCA1

Die Befunde der onkologischen Diagnostik basieren zunehmend auf genomischen Sequenzdaten, die aus Tumorgewebe und zunehmend auch aus zirkulierender Tumor-DNA (ctDNA) im Rahmen der sog. Liquid Biopsy gewonnen werden. Moderne Hochdurchsatzgeräte können im Routinebetrieb mehrere Patientenproben parallel bearbeiten; als Ergebnis erhält man pro Patient typischerweise Abermillionen Buchstaben (A, C, G, T), aufgeteilt auf Tausende von Teilsequenzen, die aus zahlreichen pa­rallelen Lesezyklen gewonnen wurden.

Über die bioinformatischen Herausforderungen bei der Datenauswertung sprach Prof. Florian Haller, Leiter der Dia­gnostischen Molekularpathologie am Universitätsklinikum Erlangen, bei der 16. Jahrestagung der Sektion Molekulare Diagnostik der DGKL e. V. am 18. Mai 2017 in Tutzing. Er gliederte die Aufgabe in mehrere Teilschritte: Es gilt, die „Reads" den gesuchten Genen zuzuordnen (Annotation), Abweichungen von den in Datenbanken gespeicherten Referenzgenomen festzustellen (Variant Call), Lesefehler im Rahmen der Qualitätskontrolle auszuschließen, und zu beurteilen, ob es sich um klinisch relevante oder unbedeutende Varianten handelt.

Abb. 1: Validierung einer primären EGFR-Deletion im Exon 19 (links) und einer sekundären, resistenzvermittelnden EGFR-Punktmutation (T790M, rechts). Der "Track Viewer" (Qiagen) zeigt eine gute Abdeckung bei einer Allelfrequenz von < 6% bzw. < 2% in zellfreier DNA.

Aus dem Vortrag wurde deutlich, dass man nicht Informatik studiert haben muss, um diese komplexen Aufgaben zu bewältigen, denn es gibt mächtige Software­pakete, die einen Großteil der Arbeit automatisieren; aber ein ungestörtes Verhältnis zu Datenlisten, Datenbanken und statistischen Auswertungen sollte man schon mitbringen.

Abb. 2: Klinische Zuordnung einer 1-bp-Deletion im BRCA1-Gen aus Tumorgewebe. Diese ist in der Datenbank ClinVar annotiert (Pfeil), fehlt aber beispielsweise in der Datenbank „1000 Genomes Project“ (Bildquellen: F. Haller 2017).

Die beiden Abbildungen illustrieren den beschriebenen Auswerteprozess am Beispiel der EGFR- und BRCA1-Gene. Beim nicht-kleinzelligen Lungenkarzinom (NSCLC) kommt der Liquid Biopsy große Bedeutung zu, da unter gezielter Therapie rasch resistenzvermittelnde Mutationen auftreten können, die engmaschig überwacht werden müssen. Die Software erkennt durch Vergleich vieler parallel sequenzierter DNA-Fragmente in der zirkulierenden DNA sowohl den aus dem Tumor stammenden Anteil mit primärer EGFR-Deletion als auch eine nachträglich aufgetretene Punktmutation, die einen Therapiewechsel nahelegt (Abb. 1).

Im zweiten Fall findet die Software in einigen Reads aus einem Ovarialkarzinom eine sehr seltene 1-bp-Deletion im BRCA1-Gen. Hier kommt es darauf an, verschiedene Datenbanken zu vergleichen, um diese Punktmutation klinisch bewerten zu können.

Prof. Dr. med. Georg Hoffmann

Mitglied der Redaktion