Maximum Likelihood Phylodynamic Analysis

DSpace Repositorium (Manakin basiert)

Zur Kurzanzeige

dc.contributor.advisor Neher, Richard (Prof. Dr.)
dc.contributor.author Sagulenko, Pavel
dc.date.accessioned 2018-07-02T10:40:53Z
dc.date.available 2018-07-02T10:40:53Z
dc.date.issued 2018-07-02
dc.identifier.other 507425006 de_DE
dc.identifier.uri http://hdl.handle.net/10900/82928
dc.identifier.uri http://nbn-resolving.de/urn:nbn:de:bsz:21-dspace-829288 de_DE
dc.identifier.uri http://dx.doi.org/10.15496/publikation-24319
dc.description.abstract The number of genome sequences available for different pathogens has in- creased dramatically over the last couple of years. Existing traditional meth- ods for phylodynamic analysis scale poorly with the number of sequences. Therefore, efficient heuristics are needed to cope with the growing data sets available today. In this work, an approximate maximum-likelihood framework for phy- lodynamic analysis is developed. Its main purpose has been to estimate divergence times in large sequence alignments of rapidly evolving organ- isms. In addition, it provides a functionality to estimate ancestral states, infer evolution models, re-root trees to maximize temporal signals, and es- timate molecular clock phylogenies and population size histories. The run time for most of the developed algorithms scales linearly with dataset size. The basic application fields for the framework are studies for epidemiology and pathogen evolution, including dating cross-species transmissions, dat- ing introductions into geographic regions, and studying the time course of pathogen population sizes. In the second part of this work, I present an inference scheme for evo- lutionary models with substitution rate heterogeneity among sites. These types of models can not only result in a better approximation of the phylo- genetic reconstruction, but also predict the evolutionary forces acting along protein or DNA sequences. en
dc.description.abstract Die Anzahl der verfügbaren Genomsequenzen für verschiedene Pathogene hat in den letzten Jahren ausserordentlich zugenommen. Bestehende tradi- tionelle Methoden für die phylodynamische Analyse sind nicht effizient für eine große Anzahl von Sequenzen. Um mit den heute verfügbaren Daten- sätzen umzugehen, sind effiziente Heuristiken notwendig. In dieser Arbeit wird ein annähender Maximum-Likelihood Ansatz zur phylodynamischen Analyse entwickelt. Der Hauptzweck dieses Ansatzes war es die Divergenzzeiten in grossen Sequenz Alignments von schnell evolvierenden Organismen zu schätzen. Ausserdem bietet er die Funktion ancestrale Zustände zu schätzen, Evolutionsmodelle abzuleiten, Bäume neu zu wurzeln, um zeitliche Signale zu maximieren, sowie um Phylogenien der molekularen Uhr und die Geschichte von Populationsgrössen abzuschätzen. Die Laufzeit der meisten entwickelten Algorithmen verhält sich dabei linear zur Grösse des Datensatzes. Grundsätzliche Anwendungsfelder für diesen Ansatz sind epidemologische Studien sowie solche, die sich mit der Evolu- tion von Pathogenen beschäftigen. Dies beinhaltet das Datieren von Trans- missionen über Speziesgrenzen hinweg, wie auch das des Eintretens in ge- ographiche Regionen, sowie die Untersuchung von Populationsgrössen von Pathogenen. Im zweiten Teil dieser Arbeit stelle ich die Interferenzschemata der Evo- lutionsmodelle vor, die sich in der Substitutionrate ihrer Sites unterschei- den. Diese Art von Modell kann nicht nur bessere Ergebnisse bezüglich der Annäherung der phylogenetischen Rekonstruktion hervorbringen, son- dern auch die evolutionären Kräfte vorhersagen, die auf Protein- oder DNA- Sequenzen einwirken. de_DE
dc.language.iso en de_DE
dc.publisher Universität Tübingen de_DE
dc.rights ubt-podok de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en en
dc.subject.classification Bioinformatik , Populationsgenetik , Phylogenetik de_DE
dc.subject.ddc 000 de_DE
dc.subject.ddc 004 de_DE
dc.subject.ddc 500 de_DE
dc.subject.ddc 570 de_DE
dc.subject.other Bioinformatics en
dc.subject.other Population Genetics en
dc.subject.other Phylogenetics en
dc.subject.other Virus evolution en
dc.subject.other Divergence times en
dc.title Maximum Likelihood Phylodynamic Analysis en
dc.type PhDThesis de_DE
dcterms.dateAccepted 2018-01-29
utue.publikation.fachbereich Biologie de_DE
utue.publikation.fakultaet 7 Mathematisch-Naturwissenschaftliche Fakultät de_DE

Dateien:

Das Dokument erscheint in:

Zur Kurzanzeige