Cancer, the multifactorial disease, resulting in uncontrolled growth of malignant cells, is the second most frequent cause of death worldwide. Despite enormous growth in knowledge on cancer pathology, efficient medication still remains elusive.
In recent years, global profiling approaches are increasingly important tools to study complex biological problems, such as cancer. One emerging profiling technology is proteomics, the continuously growing research branch of (bio)analytical chemistry that studies the entire set of proteins in a biological system, their modifications and interactions. However, a variety of computational and technological challenges in proteomics are still limiting the broad application of the technology in cancer research.
This thesis contributes in three major topics to new methodological approaches for the analysis of proteomics data and to novel insights of the effects of therapeutical treatment in cancer cells.
In the first research part, a new method to analyze 2D-Polyacrylamid Gel Electrophoresis (PAGE) proteomics data is introduced. Although the DIGE (Difference Gel Eletrophoresis) technology greatly influenced the quality of 2D-PAGE experiments through the fluorescent labeling of different samples and their common separation in the same 2D gel, the technology is still accompanied with major challenges. In this thesis we provide a solution to one of the major problems, the accurate and automated mapping of protein spots from different DIGE gels. We implemented a novel scoring method and applied a graph-theoretical approach to solve the assignment problem and to ultimately find the protein spots with reproducible regulation on different gels.
The second research section presents a new method for the integration of several database search engines for improved peptide identification. Database search for peptide identification belongs to the cornerstones in the processing of shotgun proteomics data. The underlying algorithms from different search engines produce results that overlap in parts and disagree in others. Here we present a new computational framework that combines results from several search algorithms and thereby shows significant gain in peptide identification rates. Our method relies on the normalization of single engine scores and on a weighted, average-like method to combine the identification results from different engines to a common consensus score. This new approach to peptide identification yields up to 63 % more identifications as the single engines alone.
In the last research section we present the application of quantitative shotgun proteomics to an important aspect of cancer research, the study of the influence of kinase inhibitors to the global protein expression. Dynamic quantitation of protein expression after kinase inhibitor treatment using SILAC (Stable Isotope Labeling by Amino Acids in Cell culture) opened new insights to the quantitative and dynamic effects of the two multi-kinase inhibitors, sorafenib and LY294002, on the whole proteome. In these experiments, we were able to identify and quantify more than 5,400 proteins and to investigate the protein expression levels at five different time points, revealing unprecedented insights to the kinetic behavior of the proteome as a function of length of treatment. We could show that for both inhibitors several clusters of proteins show similar regulation following inhibitor treatment. We confirm the known regulation of the mTor pathway by the LY294003 inhibitor and we speculate about the influence of LY294002 to DNA replication. Furthermore, the investigations on the kinetic effects of sorafenib treatment revealed known mechanisms, such as the influence to the Rho and Ras mediated cell cycle progression, but opened also new and interesting hypothesis, such as sorafenib's contribution to autophagy induction.
Large scale proteomics datasets provide a wealth of information and new ways to study biological systems on a system-wide level.
Krebs, die multifaktorielle Krankheit bei der sich pathologisch veränderte Zellen unkontrolliert teilen, ist weltweit die zweithäufigste Todesursache. Trotz des enormen Zuwachses an Wissen über die Entstehung von Krebs, bleiben effiziente Therapiemethoden bislang aus. Globale Profilierungsmethoden haben sich als sehr vielversprechende Ansätze für die Untersuchung von komplexen biologischen Problemen, wie Krebs, erwiesen. Eine dieser neuen Methoden ist die Proteomik, der stetig wachsenden Zweig der (bio)analytischen Chemie, welcher die Gesamtheit der Proteine eines biologischen Systems, sowie ihre Modifikationen und Interaktionen erforscht. Eine Vielzahl von bioinformatischen und technologischen Herausforderungen in der Proteomik verhindern jedoch immer noch den breiten Einsatz dieser Technologie in der Krebsforschung. Im Rahmen dieser Dissertation tragen wir zu drei wichtigen Themengebiete der Proteomik und ihrer Anwendung in der Krebsforschung bei. Wir entwickelten neue methodische Ansätze für die Analyse von proteomischen Daten und wendeten proteomische Methoden an, um ein besseres Verständnis zum Mechanismus von therapeutischen Substanzen in Tumorzellen zu gewinnen.
In dem ersten Teil der Forschungsarbeiten stellen wir eine neue Methode für die Analyse von 2D Gel basierten Daten vor. Obwohl die DIGE Technologie durch die Floureszenzmarkierung von verschiedenen Proben und deren gemeinsame Trennung auf einem Gel, einen erheblichen Beitrag zur Verbesserung der Qualität von 2D Gel Experimenten gemacht hat, gibt es nach wie vor noch erhebliche Herausforderungen in der DIGE basierten Proteomanalytik. Diese Dissertation präsentiert eine neue Lösung für eines der größten Probleme der DIGE basierten Proteomik, der akkurate und automatisierte Abgleich von Proteinspots auf verschiedenen DIGE Gelen. Die Implementierung einer neuen Scoring-Methode und die Anwendung von graph-theoretischen Ansätzen zur Lösung des Zuordnungsproblems erlauben das schnelle Finden von Proteinspots, welche auf verschiedenen Gelen reproduzierbar reguliert sind.
Das zweite Kapitel der Forschungsarbeiten behandelt eine neue Methode zur Integration von mehreren Datenbanksuchmaschinen zur Verbesserung von
Peptididentifizierungsraten. Datenbanksuchen zur Identifizierung von Peptiden gehören zu den Eckpfeilern der Datenprozessierung in der Massenspektrometrie-basierten Proteomik. Die verschiedenen Algorithmen, die den unterschiedlichen Suchmaschinen zu Grunde liegen, annotieren einen Teil der Spektren mit den gleichen Sequenzen, aber schlagen oft
unterschiedliche Peptide für einen anderen Teil der Spektren vor. Hier präsentieren wir einen neuen algorithmischen Ansatz, der die Ergebnisse verschiedener Suchmaschinen integriert und dabei einen signifikanten Zuwachs an identifizierten Peptiden erzielt. Unsere Methode beruht auf der Normalisierung der Suchresultate der einzelnen Suchmaschinen und wendet dann ein neues, gewichtetes, dem Durchschnitt ähnliches Maß an, um die verschiedenen Suchresultate zu einem gemeinsamen Konsensus-Score
zu verbinden. Dabei konnten wir im Vergleich zu den einzelnen Suchmaschinen bis zu 63 % mehr Peptide identifizieren.
In dem folgenden Kapitel präsentieren wir eine Anwendung von Methoden der Massenspektrometrie-basierten Proteomik zu einer wichtigen Fragestellungen in der Krebsforschung. Hierbei wurde die dynamische Veränderung der Proteinexpression in Tumorzellen nach Behandlung mit Kinase-Inhibitoren analysiert. Mit Hilfe der SILAC-Methode wurde die Wirkung der zwei Multi-Kinase-Inhibitoren Sorafenib und LY294002 in humanen Melanomzellen untersucht. In diesen Experimenten gelang es mehr
als 5400 Proteine zu identifizieren und zu quantifizieren. Mit unseren experimentellen Untersuchungen in fünf verschiedenen Zeitpunkten erzielten wir eine bisher noch nie dargelegte Einsicht in die Proteinexpressionsdynamik als Funktion der Inhibitionsdauer. Mit Methoden der Clusteranalyse konnten wir zeigen, dass beide Inhibitoren verschiedene Cluster von Proteinen bilden, die in gleicher Weise reguliert sind. Für die Behandlung mit LY294002 konnten wir die bekannte m-Tor Inhibition bestätigen und neue Hypothesen über den Einfluß des Inhibitors auf die DNA Replikation formulieren. In ähnlicher Weise konnten wir durch die Untersuchungen zur Expressionskinetik nach der Behandlung mit Sorafenib bekannte Mechanismen, wie den Einfluß auf die Ras vermittelte Proliferation betätigen, aber unser Datensatz erlaubt auch neue Hypothesen und ermöglicht neue Einblicke, wie den Einfluß von Sorafenib auf die Induktion der Autophagie.
Umfassende proteomische Datensätze bieten eine Fülle an Informationen und neue Wege ein biologisches System als Ganzes zu verstehen.