Whole genome analysis of Arabidopsis thaliana using Next Generation Sequencing

DSpace Repository


Dateien:

URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-56685
http://hdl.handle.net/10900/49537
Dokumentart: Dissertation
Date: 2010
Language: English
Faculty: 7 Mathematisch-Naturwissenschaftliche Fakultät
Department: Informatik
Advisor: Weigel, Detlef (Prof. Dr.)
Day of Oral Examination: 2011-03-16
DDC Classifikation: 500 - Natural sciences and mathematics
Keywords: Genom , Genanalyse , Genommutation , Ackerschmalwand
Other Keywords:
Next Generation Sequencing
License: Publishing license including print on demand
Order a printed copy: Print-on-Demand
Show full item record

Inhaltszusammenfassung:

Gegen Ende des Jahres 2010 ist es schon zum Allgemeinplatz geworden, dass Next Generation Sequencing (NGS) die Biologie revolutioniert hat. Doch das ändert nichts an der Tatsache, dass seit der Einführung von NGS die Kosten für Genom-Sequenzierungen drastisch gesunken sind. Schon bald werden auch kleine Labore in der Lage sein jedes Genom von jeder beliebigen Art zu sequenzieren. Aber obwohl das Sequenzieren von Genomen billig ist, sind die resultierenden Sequenzen allein nicht hilfreich. Es bedarf schon einer ganzen Armee an vornehmlich neuen Methoden, um mit den Anforderung, die NGS Daten mit sich bringen zu Rande zu kommen. In dieser Arbeit präsentiere ich Auszüge aus den Bemühungen aus den letzten vier Jahren, in denen wir versucht haben NGS Technologien für Pflanzengenom-Sequenzierungen nutzbar zu machen. Zuerst beschreibe ich, wie wir NGS Daten gleichzeitig, und trotzdem effizient, gegen mehrere Referenzsequenzen aligniert haben und warum so ein Vorgehen das Ergebnis von Genom-Sequenzierung verbessert. Danach zeige ich, wie man unbekannte DNA Regionen mit Hilfe von Homologie-basiertem Assembly rekonstruieren kann. Und zum Schluss fasse ich zusammen, wie wir unsere Methoden verändert haben, um genomische Modifikationen, die phänotypische Veränderungen zur Folge hatten, Ding fest zu machen.

Abstract:

As-of the end of 2010 it has become commonplace that Next Generation Sequencing NGS) has revolutionized biology. Despite this it remains true that the advent of NGS reduced the costs of whole-genome sequencing tremendously. Soon even small labs will be able to afford sequencing of every genome of every species they like. Nonetheless sequencing of genomes might be cheap, resultant sequence reads alone are mostly not informative. It requires an army of new methods to handle the requirements that Next Generation Sequencing data brings along. In this thesis I present parts our efforts of the last four years to implement NGS technologies in plant whole-genome sequencing. First, I will outline how NGS read alignments against multiple reference sequences simultaneously can be performed efficiently and how this affects the outcome of whole-genome sequencing. Afterwards I will show how reference sequence guided assembly can further improve the reconstruction of genomic sequences. And finally I will summarize how we adapted our computational methods to plant genetics to pinpoint genomic disruptions that were causal for previously identified phenotypes.

This item appears in the following Collection(s)