Linear mixed models for genome-wide association studies

Lippert, Christoph

Publikationsdienste
→
TOBIAS-lib - Publikationen und Dissertationen
→
7 Mathematisch-Naturwissenschaftliche Fakultät
→
Dokumentanzeige

dc.contributor.advisor	Borgwardt, Karsten (Prof. Dr.)	de_DE
dc.contributor.author	Lippert, Christoph	de_DE
dc.date.accessioned	2014-01-30	de_DE
dc.date.accessioned	2014-03-18T10:28:32Z
dc.date.available	2014-01-30	de_DE
dc.date.available	2014-03-18T10:28:32Z
dc.date.issued	2013	de_DE
dc.identifier.other	400288826	de_DE
dc.identifier.uri	http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-71797	de_DE
dc.identifier.uri	http://hdl.handle.net/10900/50003
dc.identifier.uri	http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-500038	de_DE
dc.identifier.uri	http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-500031	de_DE
dc.description.abstract	Genome-wide association studies aim at uncovering genetic loci that regulate a phenotype of interest by performing statistical tests for association between observed genetic variants and the phenotype. However, confounding factors like population structure, family relatedness, and cryptic relatedness often lead to false positive findings, if not accounted for in the analysis. Linear mixed models are among the richest class of models used today for genome-wide association studies, and in contrast to other methods have been shown to be capable of to capture all of these forms of relatedness simultaneously, without knowledge of which are present and without the need to tease them apart. Despite their benefits the use of linear mixed models so far has been limited to smaller studies, due to the large computational burden. In this thesis, we investigate linear mixed models for genome-wide association studies and present new algorithms to scale up linear mixed model computations that thereby enable their use for the analysis of extremely large genome-wide association studies for the first time. Besides algorithmic contributions we also present improvements to the statistical modeling part, that lead to an increase in power and better calibration over the traditional use of linear mixed models. Based on these improvements, we investigate association tests for single as well as multiple genetic variants and a phenotype. Finally, we conclude by with a multivariate version of the linear mixed model that allows simultaneous analysis of multiple related traits.	en
dc.description.abstract	Das Ziel von genomweiten Assoziationsstudien ist es, genetische Loci zu finden, die einen Phänotyp regulieren, indem man statistische Tests zwischen gemessenen genetischen Varianten und dem Phänotyp durchführt. Allerdings ziehen Störgrößen, wie Populationsstruktur, Verwandtschaftsverhältnisse innerhalb Familien, oder unbekannte Verwandtschaften zwischen scheinbar unverwandten Individuen, wenn diese nicht in Betracht gezogen werden, die Gefahr von falsch positiven Ergebnissen in der Studie nach sich. Lineare gemischte Modelle gehören zu den komplexesten Modellen, die heutzutage in genomweiten Assoziationsstudien angewandt werden, da diese, im Gegensatz zu anderen Korrekturmethoden, in der Lage sind für all diese Störgrößen aufzukommen, ohne das explizite Wissen, welche davon vorkommen, und ohne diese auseinanderzudröseln zu müssen. Trotz der klaren Vorteile durch die Anwendung von linearen gemischten Modellen, war diese wegen des hohen Rechenaufwandes bisher auf kleinere Datensätze beschränkt. Diese Arbeit setzt sich mit linearen gemischten Modellen für genomweite Assoziationsstudien auseinander und stellt neue Algorithmen vor, die lineare gemischte Modelle hochskalieren und somit mit zum ersten mal die Analyse von extrem großen Datensätzen mit diesen Modellen ermöglichen. Neben diesen algorithmischen Beiträgen werden auch Verbesserungen auf der Seite der statistischen Modellierung von genomweiten Assoziationsstudien vorgestellt, welche im Vergleich zur traditionellen Anwendung von linearen gemischten Modellen zu mehr statistischer Power bei gleichzeitig besserer Kontrolle des Typ 1 Fehlers führen. Aufbauend auf diese Verbesserungen werden Assoziationstests von einzelnen als auch von mehreren genetischen Varianten vorgestellt und analysiert. Zum Abschluss der Arbeit wird eine multivariate Version von linearen gemischten Modellen zur Analyse von mehreren verwandten Phänotypen vorgestellt.	de_DE
dc.language.iso	en	de_DE
dc.publisher	Universität Tübingen	de_DE
dc.rights	ubt-podok	de_DE
dc.rights.uri	http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de	de_DE
dc.rights.uri	http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en	en
dc.subject.classification	Bioinformatik , Maschinelles Lernen , Genetik , Statistik	de_DE
dc.subject.ddc	570	de_DE
dc.subject.other	Genomweite Assoziationsstudien , Lineare gemischte Modelle	de_DE
dc.subject.other	Machine learning , Bioinformatics , Genetics , Statistics , genome-wide association studies , linear mixed models	en
dc.title	Linear mixed models for genome-wide association studies	en
dc.title	Lineare gemischte Modelle für genomweite Assoziationsstudien	de_DE
dc.type	PhDThesis	de_DE
dcterms.dateAccepted	2013-11-29	de_DE
utue.publikation.fachbereich	Informatik	de_DE
utue.publikation.fakultaet	7 Mathematisch-Naturwissenschaftliche Fakultät	de_DE
dcterms.DCMIType	Text	de_DE
utue.publikation.typ	doctoralThesis	de_DE
utue.opus.id	7179	de_DE
thesis.grantor	7 Mathematisch-Naturwissenschaftliche Fakultät	de_DE

Dateien:	thesis_komplett.pdf 10.1 MB PDF

Das Dokument erscheint in:

7 Mathematisch-Naturwissenschaftliche Fakultät [5190]

Zur Kurzanzeige

Veröffentlichen

Stöbern

Gesamter Bestand
Diese Sammlung

Mein Benutzerkonto

Einloggen

Linear mixed models for genome-wide association studies

DSpace Repositorium (Manakin basiert)

Das Dokument erscheint in:

Stöbern

Gesamter Bestand

Diese Sammlung

Mein Benutzerkonto