Die bioinformatische Analyse von bakteriellen Gesamtgenomdaten
DOI: https://doi.org/10.47184/td.2022.03.04 Für die Auswertung der Daten, die durch die Hochdurchsatzsequenzierung von Bakterien oder Viren gewonnen werden, benötigt man spezifische bioinformatische Softwarelösungen, kompetentes Personal, eine passende IT-Infrastruktur und ein Konzept für die Datenspeicherung und -sicherheit. Am Forschungszentrum Borstel werden Next-Generation-Sequencing-Verfahren für die hochauflösende Charakterisierung von Erregergenomen und Transkriptomen aus dem Mycobacterium tuberculosis Komplex eingesetzt.
NGS, MTBK, Cloud, Qualitätskontrolle, MLST-Schema, Resistenzvorhersage
Seit einigen Jahren wird die Hochdurchsatzsequenzierung (engl.: next generation sequencing; NGS) vermehrt zur detaillierten Charakterisierung von bakteriellen oder viralen Pathogenen eigesetzt. Ein eindrucksvolles Beispiel ist die Nachverfolgung verschiedener Varianten von Sars-CoV-2, die nur durch die weltweit vorgenommene Sequenzierung des viralen Genoms möglich wurde. Die durch die NGS-Verfahren erzeugten Daten bestehen aus Millionen kurzer Sequenzabschnitte, sogenannter Reads. Bei der Auswertung muss aus diesen Sequenzabschnitten das Erregergenom rekonstruiert werden, wofür spezifische, bioinformatische Softwarelösungen notwendig sind.
Generelle Anforderungen
Für die Implementierung einer bioinformatischen Analyse sind die Kompetenz des Personals, die Auswahl geeigneter Software, die Bereitstellung der nötigen IT-Infrastruktur und ein grundlegendes Konzept zur Speicherung und Sicherheit der Daten entscheidend (Abb. 1).