Substrate specificity prediction of enzymes and its applications to nonribosomal peptide synthetases

Rausch, Christian

Publikationsdienste
→
TOBIAS-lib - Publikationen und Dissertationen
→
7 Mathematisch-Naturwissenschaftliche Fakultät
→
Dokumentanzeige

dc.contributor.advisor	Huson, Daniel H. (Prof. Dr.)	de_DE
dc.contributor.author	Rausch, Christian	de_DE
dc.date.accessioned	2007-10-12	de_DE
dc.date.accessioned	2014-03-18T10:17:45Z
dc.date.available	2007-10-12	de_DE
dc.date.available	2014-03-18T10:17:45Z
dc.date.issued	2007	de_DE
dc.identifier.other	275782689	de_DE
dc.identifier.uri	http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-30427	de_DE
dc.identifier.uri	http://hdl.handle.net/10900/49083
dc.identifier.uri	http://nbn-resolving.org/urn:nbn:de:bsz:21-dspace-490831	de_DE
dc.description.abstract	Nonribosomal peptides (NRPs) and polyketides (PKs) are a diverse group of natural products comprising molecules with antibiotic, antitumoral, anti-inflammatory, immunosuppressing, metal chelating and other interesting properties. The steady demand for novel drugs and the increasing number of uncharacterized protein sequences issued from genome projects call for better methods to automatically detect novel NRP synthetases (NRPSs) and PK synthases (PKSs) in the protein databases, and to predict the composition of their products efficiently. Besides the search for novel biologically active molecules, research also tries to obtain tailored products by the rational manipulation of known NRPS/PKS biosynthesis clusters. This strategy will become more efficient, as we are better able to predict positions to be mutated or segments to be recombined in these enzymes. In this thesis, we develop and establish methods that are helpful for both strategies: predicting new and manipulating known products. To detect NRPSs and PKSs efficiently in protein sequences, we use a search strategy with profile Hidden Markov Models (pHHMs) that requires the simultaneous occurrence of certain enzymatic domains specific for these enzymes. We present a new machine learning (Support Vector Machine)-based strategy to predict which building blocks (mainly amino acids) are selected for incorporation by so-called Adenylation (A) domains in NRPSs. Thus, it becomes possible to infer the composition of the synthesized product. This new method is implemented in the program NRPSpredictor and is freely accessible via www-ab.informatik.uni-tuebingen.de/software/NRPSpredictor. The NRPS Condensation (C) domains catalyze the bond formation between the amino acids (that were previously selected by the A domains) and may produce different product geometries according to their functional variant (subtype). In a comprehensive evolutionary study of these subtypes, we reveal characteristic sequence motifs and positions in which the unequal variants differ. We make available some pHHMs, which facilitate the automated prediction of the functional C domain subtypes. The determined subtype-specific positions will be helpful for the directed mutagenesis to turn one subtype into another with the goal of obtaining novel products. Moreover, we explore possibilities of structural bioinformatics using molecular modeling and docking simulations to predict the specificity of A domains. These simulations also allow for the study of directed point-mutations in these domains. The methods introduced in this work are applicable to predicting the specificities of functional subtypes of other enzymes under certain conditions; in particular, a sufficiently high sequence similarity between the different groups is required to be able to determine homologous positions via a multiple sequence alignment.	en
dc.description.abstract	Nichtribosomal synthetisierte Peptide (NRP) und Polyketide (PK) stellen eine vielfältige Gruppe von Naturstoffen dar, zu der Antibiotika, Arzneimittel gegen Krebs, Entzündungshemmer, Immunosuppressiva, Metallkomplexbildner und andere Moleküle mit interessanten Eigenschaften gehören. Die ständige Nachfrage nach neuen Wirkstoffen und die wachsende Anzahl noch nicht erforschter Protein-Sequenzen aus Genom-Projekten verlangen nach besseren Methoden, um neuartige NRP-Synthetasen (NRPS) und PK-Synthasen (PKS) automatisiert in den Protein-Datenbanken aufzuspüren und die Zusammensetzung ihrer Produkte effizient vorherzusagen. Neben der Suche nach neuartigen biologisch aktiven Molekülen ist man auch bestrebt, durch die gezielte Modifikation bekannter NRPS/PKS Biosynthese-Cluster maßgeschneiderte Produkte zu entwerfen. Diese Strategie ist umso effizienter, je besser Positionen bzw. Segmente in den Enzymen vorhergesagt werden können, die mutiert bzw. rekombiniert werden müssen, um neue Substanzen zu erhalten. In dieser Arbeit wurden Methoden entwickelt und etabliert, die diese beiden Ansätze unterstützen: Eine effiziente Suchstrategie mit Profile Hidden Markov Models (pHMMs) wird genutzt, die das gleichzeitige Auftreten bestimmter enzymatischer Domänen fordert, und es so erlaubt, NRPS und PKS in Protein-Sequenzen sicher aufzufinden. Eine neue, auf maschinellem Lernen (Stützvektormaschinen) beruhende Strategie wurde entwickelt, mit der vorhergesagt werden kann, welche Bausteine (in der Regel Aminosäuren) in NRPS von Adenylierungsdomänen ausgewählt werden, um im Folgenden in das Produkt eingebaut zu werden. Dadurch wird es möglich, auf die Zusammensetzung des synthetisierten Produkts zu schließen. Diese neue Methode wurde in dem Programm NRPSpredictor implementiert und steht kostenlos über www-ab.informatik.uni-tuebingen.de/software/NRPSpredictor zur Verfügung. Die NRPS Kondensationsdomänen verbinden die von den Adenylierungsdomänen ausgewählten Aminosäuren durch Ausbildung einer Peptidbindung zu einem Peptidstrang und erzeugen je nach ihrer funktionellen Variante (Subtyp) unterschiedliche Produktgeometrien. In einer umfassenden Studie der evolutionären Beziehungen dieser Subtypen wurden charakteristische Sequenz-Motive und -Positionen aufgedeckt, in denen sich die verschiedenen Varianten unterscheiden. Eine automatisierte Vorhersage der funktionellen Subtypen der Kondensationsdomäne wird durch die erstellten pHMMs ermöglicht. Die ermittelten subtypspezifischen Positionen sind hilfreich für die gezielte Einführung von Mutationen, um einen Subtyp in einen anderen zu überführen mit der Absicht, neuartige Produkte zu erhalten. Desweiteren wurden die Möglichkeiten der Strukturbioinformatik untersucht und Molecular Modeling und Docking Simulationen durchgeführt, um die Spezifität von Adenylierungsdomänen sowie die Auswirkungen gezielter Punkt-Mutationen auf die Bindungspräferenzen der Adenylierungsdomänen vorherzusagen. Die in dieser Arbeit eingeführten Methoden sind nutzbar für die Vorhersage der Spezifitäten bzw. der funktionellen Subtypen anderer Enzyme unter bestimmten Voraussetzungen, insbesondere genügend hoher Sequenzähnlichkeit zwischen den verschiedenen Gruppen, so dass über multiple Sequenz-Alignments homologe Positionen ermittelt werden können.	de_DE
dc.language.iso	en	de_DE
dc.publisher	Universität Tübingen	de_DE
dc.rights	ubt-podok	de_DE
dc.rights.uri	http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de	de_DE
dc.rights.uri	http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en	en
dc.subject.classification	Spezifität , Substrat <Chemie> , Peptidantibiotikum , Enzym , Maschinelles Lernen	de_DE
dc.subject.ddc	004	de_DE
dc.subject.other	Stützvektormaschinen , Funktionsvorhersage	de_DE
dc.subject.other	Peptide antibiotics , Machine learning , Support vector machines , Function prediction	en
dc.title	Substrate specificity prediction of enzymes and its applications to nonribosomal peptide synthetases	en
dc.title	Substrat-Spezifitätsvorhersage von Enzymen und Anwendung bei nichtribosomalen Peptid-Synthetasen	de_DE
dc.type	PhDThesis	de_DE
dc.date.updated	2007-11-26	de_DE
dcterms.dateAccepted	2007-07-19	de_DE
utue.publikation.fachbereich	Informatik	de_DE
utue.publikation.fakultaet	7 Mathematisch-Naturwissenschaftliche Fakultät	de_DE
dcterms.DCMIType	Text	de_DE
utue.publikation.typ	doctoralThesis	de_DE
utue.opus.id	3042	de_DE
thesis.grantor	17 Fakultät für Informations- und Kognitionswissenschaften	de_DE

Dateien:	Christian_RAUSCH_Dissertation.pdf 4.66 MB PDF

Das Dokument erscheint in:

7 Mathematisch-Naturwissenschaftliche Fakultät [5108]

Zur Kurzanzeige

Veröffentlichen

Stöbern

Gesamter Bestand
Diese Sammlung

Mein Benutzerkonto

Einloggen

Substrate specificity prediction of enzymes and its applications to nonribosomal peptide synthetases

DSpace Repositorium (Manakin basiert)

Das Dokument erscheint in:

Stöbern

Gesamter Bestand

Diese Sammlung

Mein Benutzerkonto