Analysis and Visualization of Gene Expression Data

DSpace Repositorium (Manakin basiert)

Zur Kurzanzeige

dc.contributor.advisor Nieselt, Kay (Dr.) de_DE
dc.contributor.author Symons, Stephan Hermann Georg de_DE
dc.date.accessioned 2012-03-08 de_DE
dc.date.accessioned 2014-03-18T10:24:10Z
dc.date.available 2012-03-08 de_DE
dc.date.available 2014-03-18T10:24:10Z
dc.date.issued 2011 de_DE
dc.identifier.other 360585116 de_DE
dc.identifier.uri http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-60819 de_DE
dc.identifier.uri http://hdl.handle.net/10900/49643
dc.description.abstract Today, gene expression data is acquired with increasing speed with increasing quality and depth. High throughput technologies like DNA microarrays and next generation sequencing technologies have led to a rising pace of new discoveries in the biomedical field. These technologies are complemented by high throughput pipelines for proteomics and metabolomics profiling. Altogether, vast amounts of primary measured data, complementary data from other omics and meta information from many sources is available for researchers. This data needs to be jointly analyzed and visualized in context of external data and meta information. In this thesis, new tools and concepts are introduced for the purpose of visualizing gene expression data in the context of meta information and complementary data from other "omics" experiments. First, the application of generic visualization tools to resequencing microarrays, which are used for finding mutations in single genes is discussed. For this final step of gene expression analysis, an application called ResqMi, ("Resequencing using Microarrays") is presented that allows to use generic and adapted visualization tools on resequencing microarrays, in order to improve quality control, data analysis and revision of problematic base calls. The focus of this work is on the visualization of gene expression data. Here, new tools for the visualization of gene expression data in the context of meta information from processing results and external sources, like functional annotations are introduced. For the visualization of clustered gene expression data, profile logos extend the concept of sequence logos to expression data. Chromograms and tag clouds, tools for visualizing different properties of collections of nominal data are applied in combination in order to explore temporal, spatial and other patters in annotations of gene expression data. Furthermore, enhanced tabular views of summarized gene annotations and genes ranked by statistical values are discussed for comparative visualization of textual and numeric meta data. Graph based visualizations of gene expression and meta data are more generic and investigated in greater detail. Most tools for visualizing biological pathways do not make full use of gene expression or meta information data. Here, a variety of ways to include gene expression data into biological network visualizations is investigated and implemented, based both on the node rendering and the layout of the graph. This allows dense, high dimensional visualizations. Specialized tools that are optimized for working with pathways in KEGG and BioPax formats, are presented as well as MGV (the Mayday Graph Viewer), a general tool for visualizing a wide range of biological networks that offers a full range of options within a rich, extensible user interface. Options for integration and creation of network data, data organization and analysis within the graph framework are investigated. MGV furthermore incorporates tools for integrating data from several datasets, which allows to combine multiple "omics" data in one visualization. With dynamic groups that can contain nodes with data from all sources, cross dataset analyses can be performed. Further applications include the integration of metabolomics data, clustering comparisons and the visualization of gene models. en
dc.description.abstract Die heutigen Methoden der Genexpressionsanalyse erlauben die Datenerfassung mit zunehmender Geschwindigkeit und Qualität. Hochdurchsatzverfahren wie DNA-Microarrays und Sequenzierungsverfahren der zweiten Generation haben zahlreiche neue Entdeckungen ermöglicht. Zusammen mit Ergebnissen aus Verfahren der Proteom- und Metabolomanalyse stehen große Datenmengen zur Verfügung, zusätzlich ergänzt durch viele Annotationen und Metadaten. Im Rahmen von Genexpressionsstudien müssen diese Daten oft mit visuellen Methoden untersucht und analysiert werden. In dieser Arbeit werden dazu neue Methoden und Konzepte für die Visualisierung von Genexpressionsdaten im Kontext von Metainformationen und Ergebnissen anderer Technologien vorgestellt. Zunächst werden Standardvisualisierungsmethoden für Resequenzierungs-Microarrays diskutiert. Zum Zwecke der Anwendung von generischen und angepassten Visualisierungsmethoden auf entsprechende Daten wird das Programm ResqMi ("Resequencing using Microarrays") vorgestellt. ResqMi bietet neue Möglichkeiten für die Qualitätskontrolle, Analyse und Nachbearbeitung der Daten. Der Fokus dieser Arbeit liegt auf der Visualisierung von Genexpressionsdaten. Zunächst werden einige Visualisierungsmethoden für Genexpressionsdaten im Kontext von Metainformationen aus Prozessierungsergebnissen und externen Quellen - etwa Funktionsannotationen - vorgestellt. Zur Darstellung von geclusterten Genexpressionsprofilen werden Profillogos verwendet, die das Konzept der Sequenzlogos für die Darstellung von Expressionsdaten erweitern. Chromogramme und Tag Clouds, Visualisierungstools für verschiedene Aspekte von nominalen Daten, werden hier kombiniert genutzt, um Muster in Annotationen von Genexpressionsdaten zu finden. Außerdem werden zur Visualisierung von nominalen und ordinalen Metainformationen geeignete erweiterte tabellenartige Ansichten verwendet: die Term Pyramid bzw. Probe Rank Plots. Die graphenbasierte Visualisierung von Genexpressionsdaten ist generischer und bietet viele zusätzliche Möglichkeiten und wird im Weiteren näher verfolgt. Viele Anwendungen für die Visualisierung biologischer Pathways nutzen nicht alle Möglichkeiten für die Darstellung von Genexpressions- und Metadaten. Hier werden verschiedene Möglichkeiten zur Einbeziehung von Genexpressionsdaten in die Darstellung biologischer Daten untersucht. Sowohl spezielle Anwendungen für die Darstellung biologischer Pathways (in KEGG- und BioPax-Format) als auch MGV ("Mayday Graph Viewer") werden vorgestellt. MGV ist ein generisches Tool, das die Visualisierung vieler verschiedener biologischer Netzwerke mit vielen Optionen innerhalb einer mächtigen Oberfläche ermöglicht. Verschiedene Strategien für die Erzeugung, Strukturierung und Analyse innerhalb dieses Programmes werden vorgestellt. Außerdem wird die Integration von Daten aus unterschiedlichen Studien und Technologien in MGV untersucht. Dynamische Gruppen von Knoten, die mit Daten aus verschiedenen Quellen angereichert sind, sind die Ausgangsbasis für datensatzübergreifende Analysen. Weitere Anwendungen umfassen unter anderem die Analyse von Metabolomik-Daten, der Vergleich von Clusterings und die Visualisierung von Genmodellen. de_DE
dc.language.iso en de_DE
dc.publisher Universität Tübingen de_DE
dc.rights ubt-podno de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=de de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_ohne_pod.php?la=en en
dc.subject.classification Bioinformatik , Visualisierung , Genexpression de_DE
dc.subject.ddc 004 de_DE
dc.subject.other Visuelle Analytik , Biologische Netzwerke de_DE
dc.subject.other Bioinformatics , Gene Expression Analysis , Visualization , Biological Networks , Visual Analytics en
dc.title Analysis and Visualization of Gene Expression Data en
dc.title Analyse und Visualisierung von Genexpressionsdaten de_DE
dc.type PhDThesis de_DE
dcterms.dateAccepted 2011-11-30 de_DE
utue.publikation.fachbereich Informatik de_DE
utue.publikation.fakultaet 7 Mathematisch-Naturwissenschaftliche Fakultät de_DE
dcterms.DCMIType Text de_DE
utue.publikation.typ doctoralThesis de_DE
utue.opus.id 6081 de_DE
thesis.grantor 7 Mathematisch-Naturwissenschaftliche Fakultät de_DE

Dateien:

Das Dokument erscheint in:

Zur Kurzanzeige