Inhaltszusammenfassung:
Die Einführung von modernen Sequenziermethoden eröffnete der klassischen Genetik eine Vielzahl an interessanten Möglichkeiten um Proben effizienter und detaillierter zu untersuchen.
Technische Weiterentwicklung, hohe Durchsatzraten sowie geringe Beschaffungs- und Betriebskosten erlauben es Wissenschaftlern heute beispielsweise die Genomsequenzen von mehreren Bakterien in einer Probe gleichzeitig zu untersuchen oder das Erbgut von bereits ausgestorbenen Organismen zu analysieren.
Im ersten Teil dieser Arbeit präsentieren wir aktuelle Methoden um, so genannte, Metagenome effizient zu untersuchen. Ein wichtiger Schritt der Analyse ist die Sequenzabschnitte der Probe mit bekannten Funktionen oder Organismen in Verbindung zu bringen. Die aktuell verwendeten Methoden sind entweder relativ langsam oder berechnen nicht alle notwendigen Details wie z.B. Sequenzalignments, die für eine detaillierte Analyse notwendig sind. In diesem Kontext präsentieren wir einen neuen Ansatz der im Gegensatz zu bisherigen Methoden schneller ist und dabei gleichzeitig Sequenzalignments zur Verfügung stellt.
Bei Methoden die auf Referenzdatenbanken basieren ist die Zusammensetzung der Datenbank, sowie die Verknüpfung von Datenbankeinträgen zu Organismen oder Funktionen ein weiteres wichtiges Detail der Analyse. Wir untersuchen deshalb wie gut die oft verwendeten NCBI-NR Datenbank existierende Organismen und Funktionen abdeckt. Zur Verbesserung schlagen wir eine neue Methode zur Verknüpfung von Datenbankeinträgen mit Organismen und Funktionen vor. Die Evaluierung mit einem in-vitro simulierten Datensatz zeigt, dass wir mit der neuen Methode mehr und spezifischer Datenbankeinträge zu Organismen und Funktionen zuordnen können.
Eine weitere generelle Herausforderung stellen die stetig wachsenden Daten- und Probenmengen dar. Die komplexe, aus mehreren Schritten bestehende Analyse sollte möglichst effizient und reproduziert durchzuführen sein. Ein effizientes Zusammenspiel in interdisziplinäre Projekte sowie mit externen Kollaborationspartnern benötigt oft, dass Zwischenergebnisse sowie komplette Analysen einfach und wirksam geteilt werden. In diesem Zusammenhang stellen wir eine lokale Instanz des Workflow-Management-Systems Galaxy vor, die ihm Rahmen dieser Arbeit aufgesetzt, angepasst und verwendet wurde.
Der zweite Teil der Arbeit behandelt die Analyse von altertümlichen Proben. Altertümliche Proben bieten die einmalige Möglichkeit einen Einblick ist die Evolution, sowie die Verbreitung von bereits ausgestorbenen Bakterienstämmen zu erhalten. In dieser Arbeit untersuchen wir mehrere Proben bei denen verschiedene Indizien an den Überresten eine Infektion mit M. tuberculosis vermuten lassen.
Zur Identifizierung von potentiellen Proben mit genug Ausgangmaterial wurde eine Whole-Genome-Shotgun Sequenzierung durchgeführt. Zusätzlich wurde ein weiterer Selektionsprozess angewandt, bei dem die Proben erst auf vier bestimmte Gene angereichert und im Anschluss sequenziert wurden.
In der abschließenden Analyse wurden die Proben vor dem Sequenzieren für komplette Genome angereichert, da die altertümlichen Proben oft nur gering Menge an DNA verfügen. In dem letzten Teil dieser Arbeit diskutieren wir die Konstruktion des Anreicherungschips, sowie die darauf folgende Analyse.