Development of Homology Modeling Techniques

DSpace Repository


Dateien:
Aufrufstatistik

URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-27895
http://hdl.handle.net/10900/49021
Dokumentart: Dissertation
Date: 2006
Language: English
Faculty: 7 Mathematisch-Naturwissenschaftliche Fakultät
Department: Informatik
Advisor: Lupas, Andrei (Prof.)
Day of Oral Examination: 2006-12-21
DDC Classifikation: 004 - Data processing and computer science
Keywords: Bioinformatik , Strukturanalyse , Anwendungssoftware
Other Keywords: Strukturbiologie , Homologiemodellierung
Bioinformatics , Structural biology , homology modeling
License: Publishing license including print on demand
Order a printed copy: Print-on-Demand
Show full item record

Inhaltszusammenfassung:

Im Rahmen dieser Arbeit beschäftigte ich mich mit rechnerbasierten Methoden zur Analyse von Proteinstrukturen und deren Modellierung. Proteine werden nach Vorlage ihrer Sequenz, des Gens, in der Zelle hergestellt und bilden räumliche Strukturen aus, die Bedingung sind für die Ausübung biologischer Funktion durch das Protein. Ausgehend von der Proteinsequenz, basiert die rechnergestützte Strukturvorhersage für ein Protein auf der Suche nach signifikanten Homologien zu anderen Proteinen mit bekannter Struktur. Da die direkte experimentelle Untersuchung von Proteinen, z.B. deren Strukturbestimmung, sehr aufwändig ist, bieten Vorhersagemethoden, die auf Homologie basieren, praktische Alternativen. Sequenzanalysemethoden der Bioinformatik helfen uns Homologien zwischen Proteinen zu bestimmen, d.h. evolutionäre Beziehungen nachzuvollziehen, die auf gemeinsame Abstammung schliessen lassen. Falls Proteine ähnliche Sequenzen aufweisen, dann sind ihre Faltungen im Allgemeinen auch ähnlich. Dieser Zusammenhang findet direkte Anwendung in der rechnergestützten Strukturvorhersage von homologen Proteinen. Die Struktur von Proteinen kann nicht als starr angesehen werden, sondern befindet sich in einem Zustand von mehreren bestimmten Konformationen. Solche Konformationszustände können mit der biologischen Funktion zusammenhängen und auch von aussen beeinflusst sein, z.B. dem Vorhandensein eines Liganden. Sequenzanalysen können keine Konformationsänderungen identifizieren. Deshalb lassen heute existierende Strukturvorhersagemethoden, die ausschliesslich auf Sequenzvergleichen aufbauen, alternative Konformationszustände einer Proteinfamilie ausser Acht. Am Beispiel der Modellierung von Aminotransferasen wird aufgezeigt, dass die Qualität der Modelle deutlich verbessert werden kann, wenn den unterschiedlichen Konformationen dieses Proteins Rechnung getragen wird. Auch in Zukunft wird die Anzahl experimentell gelöster Strukturen weiter ansteigen, jedoch werden nur wenige neue Faltungen definieren. Die meisten neu gelösten Strukturen werden homolog zu schon bekannten sein, können aber dadurch neue Konformationszustände aufzeigen. Aus diesem Grund muss der vergleichenden Proteinstrukturanalyse, wie sie in dieser Arbeit beschrieben wird, wachsende Bedeutung beigemessen werden. Die vorliegende Arbeit ist in drei Teile gegliedert. Im ersten Teil wird die rechnerische Umgebung MolTalk beschrieben. Ein Vergleich mit anderen Programmierbibliotheken ähnlicher Ausrichtung ergab, dass MolTalk in Hinsicht auf Geschwindigkeit und Speichernutzung für die Interpretation von Strukturdaten im PDB-Format deutliche Vortei-le besitzt. Beide Eigenschaften sind Grundvoraussetzungen für die auf MolTalk aufbauenden Anwendungen: die Strukturdatenbank MTDB und die relationale Sequenz-zu-Struktur-Suchmethode MBSIS. Am Ende des ersten Teils, wird der Strukturanalyse-Webserver iMolTalk vorgestellt. Die neuartige Integration von Strukturanalysen, Homologiemodellierung und Datenbankzugriff in einem interaktiven Webserver machen iMolTalk zu einem einzigartigen und wertvollen Dienst, der viele Wissenschaftler in der Molekularbiologie anspricht, die sich mit Makromolekülen und deren Strukturen beschäftigen. Im zweiten Teil wird auf die Auswahl von Templaten in der Homologiemodellierung eingegangen. Zuerst wird PDBalert vorgestellt, ein Softwareagent, der regelmässig die Neueinträge der PDB gegen Sequenzen und Modelle von iMolTalk-Benutzern vergleicht. Danach folgt eine Beschreibung der Evaluation von möglichen Templaten, welche zwar homolog sind, aber die verschiedene Konformationen des gleichen Proteins darstellen und deshalb nicht durch Sequenzvergleiche nachweisbar sind. Mit Protopolis entwickelte ich eine Anwendung für die vergleichende Proteinstrukturanalyse. Homologe Strukturen werden dabei zueinander verglichen und gemäss der berechneten Strukturähnlichkeit gruppiert. Überlagerungen von Strukturen solcher Gruppen können anschliessend visualisiert werden, um mögliche Konformationszustände zu identifizieren. Im dritten Teil wird die Homologiemodellierung ausgeweitet auf die Modellierung von Proteinkomplexen mittels einer Kombination von abgeleiteten strukturellen Randbedingungen und Protein-Protein Docking. Als eine biologisch wichtige Anwendung dieses Ansatzes wird die Modellierung von Ringstrukturen von AAA+ Proteinen vorgestellt. Das Ableiten von strukturellen Randbedingungen von bekannten Ringstrukturen bildete dabei die Basis der Multimermodellierung. In weiteren Schritten wurden diese dann im Docking der Monomere angewendet. Dies führte zu Strukturmodellen von Oligomeren, welche die biologische Funktion von AAA+ Proteinen besser erklären können. Für das Strukturmodell des Apoptosoms schlagen wir eine Umordnung von Domänen im Ring vor, konsistent mit den abgeleiteten Strukturbedingungen.

Abstract:

The focus of this thesis was on computer-aided protein structure analysis and homology modeling. Proteins are produced in the cell according to their sequences, which are encoded in their genes. Moreover, biological function of proteins depends on their structure. Computer-aided structure prediction is based on statistically significant homology detection applying sequence comparison between a model protein and proteins with known structure. As the direct study of proteins in vitro and in vivo requires laborious experiments, prediction methods relying on homology offer practical alternatives. In this context, bioinformatics methods for sequence analysis can identify homologies between related proteins, which have evolved from a common ancestor. The more structures were solved experimentally, the more it became apparent that proteins with similar sequences predominantly share similar structural architectures (folds). An immediate application thereof is computer-aided modeling of protein structures by homology. Protein structure cannot be regarded as a rigid object, rather it exists in one defined conformational state that is related to biological function and can depend on external effects, e.g. the presence of a ligand. Because there is no signal for conformational changes at the level of sequence, sequence analyses fail to detect them. Consequently, today's structure prediction methods, which rely on sequence homology detection for modeling, may overlook alternative conformational states in a protein family. As shown in this work for the remodeling of aminotransferases, information about protein conformation can lead to better homology models. In the future, even more protein structures will be solved experimentally, yet only a few will show new and unrelated folds. Therefore, the majority of new structural data will be redundant with respect to sequence. As a result, comparative structural analyses in homology modeling, as introduced in this work, will gain in importance. This thesis consists of three parts. In the first part, the computational environment MolTalk is introduced. In a comparison to other programming libraries, which serve similar tasks, MolTalk was shown to be very fast in loading and interpreting PDB-formatted files and its memory requirements were medium. These properties are key for the structural database system MTDB and the relational sequence-to-structure system MBSIS. At the end of this first part, our structure analysis web-server iMolTalk is presented. The novel integration of structural analyses, homology modeling and database access make iMolTalk a unique and valuable service to scientists in molecular biology, who work on macromolecules and their structures. In the second part, template selection in homology modeling is addressed in more detail. First, I describe PDBalert, a software agent, which periodically compares sequences and models of iMolTalk users against the released structures from PDB and reports new homologies by e-mail. Second, the problem of evaluating putative templates is addressed. Although these templates are homologous, they might represent different conformations, which cannot be detected by sequence comparison. As an application for comparative structural analysis I developed Protopolis, which exhaustively compares homologous structural chains and clusters them according to structural similarity. The resulting groups can then be superimposed and visualized to identify possible conformational states. The third part extends homology modeling to multimer modeling using a combination of derived structural restraints and protein-protein docking. As a biological important application the modeling of ring assemblies of AAA+ proteins is presented. The derivation of structural restraints from known ring structures forms the basis of the multimer modeling. Subsequently, they are applied in the docking of the monomers. This leads to oligomer models that can better explain biological function of AAA+ proteins. For the apoptosome, we propose a reorientation of domains in the ring consistent with the derived structural restraints.

This item appears in the following Collection(s)