Die Hochdurchsatzsequenzierung (NGS) ist bei der Mutationssuche in Tumorgeweben und zirkulierender DNA zu einem unverzichtbaren Werkzeug der onkologischen Diagnostik geworden. Am Beispiel der EGFR- und BRCA1-Gene wird die Unterstützung durch bioinformatische Software und Datenbanken illustriert.
Schlüsselwörter: Bioinformatik, Onkologie, Liquid Biopsy, NSCLC, EGFR, BRCA1
Die Befunde der onkologischen Diagnostik basieren zunehmend auf genomischen Sequenzdaten, die aus Tumorgewebe und zunehmend auch aus zirkulierender Tumor-DNA (ctDNA) im Rahmen der sog. Liquid Biopsy gewonnen werden. Moderne Hochdurchsatzgeräte können im Routinebetrieb mehrere Patientenproben parallel bearbeiten; als Ergebnis erhält man pro Patient typischerweise Abermillionen Buchstaben (A, C, G, T), aufgeteilt auf Tausende von Teilsequenzen, die aus zahlreichen parallelen Lesezyklen gewonnen wurden.
Über die bioinformatischen Herausforderungen bei der Datenauswertung sprach Prof. Florian Haller, Leiter der Diagnostischen Molekularpathologie am Universitätsklinikum Erlangen, bei der 16. Jahrestagung der Sektion Molekulare Diagnostik der DGKL e. V. am 18. Mai 2017 in Tutzing. Er gliederte die Aufgabe in mehrere Teilschritte: Es gilt, die „Reads" den gesuchten Genen zuzuordnen (Annotation), Abweichungen von den in Datenbanken gespeicherten Referenzgenomen festzustellen (Variant Call), Lesefehler im Rahmen der Qualitätskontrolle auszuschließen, und zu beurteilen, ob es sich um klinisch relevante oder unbedeutende Varianten handelt.