A Finite-State Approach to Shallow Parsing and Grammatical Functions Annotation of German

DSpace Repository


URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-27580
Dokumentart: PhDThesis
Date: 2005
Language: English
Faculty: 5 Philosophische Fakultät
Department: Allgemeine u. vergleichende Sprachwissenschaft
Advisor: Hinrichs, Erhard W. (Prof. Dr.)
Day of Oral Examination: 2005-02-16
DDC Classifikation: 400 - Language and Linguistics
Keywords: Syntaktische Analyse , Deskriptive Grammatik , Endlicher Automat , Linguistische Datenverarbeitung , Automatische Sprachanalyse
Other Keywords: Chunks , topologische Felder , grammatische Funktionen , Parser , endliche Automaten
chunks , topological fields , grammatical functions , parser , finite-state approach
License: http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en
Order a printed copy: Print-on-Demand
Show full item record


Die vorliegende Arbeit beschreibt einen mehrstufigen Parser, der grammatische Funktionen auf der Grundlage von flachen Annotationsstrukturen, die aus Chunks, topologischen Feldern und (Teil-)Sätzen bestehen, erkennt. Da grammatische Funktionen im Deutschen sehr eng mit dem Kasus verbunden sind, spielt die Zuweisung und Disambiguierung von morphologischen Informationen eine entscheidende Rolle als Schritt hin zu einer Annotation von grammatischen Funktionen. Alle Bauteile des Parsers bauen auf endlichen Automaten auf, um eine leistungsstarke Annotation sicherzustellen. Alle Stufen der Annotation sind robust; sie können mit unerwarteten Eingaben (aus dem Quelltext) ebenso umgehen wie mit fehlgeschlagenen Weitergaben aus den einzelnen Zwischenstufen. Unsere umfangreiche Evaluation des Parsers zeigt seine Wettbewerbsfähigkeit mit anderen Ansätzen. Sie gibt weiterhin Einblick in die allgemeinen Schwierigkeiten des Parsens der deutschen Sprache.


We describe an incremental parser which annotates grammatical functions in German on top of a shallow annotation structure consisting of chunks, topological fields and clauses. Since grammatical functions in German are strongly associated with case, the assignment and disambiguation of morphological information plays a crucial role as a step towards the annotation of grammatical functions. All components of the parser system rely on finite-state methods to ensure efficient annotation. All stages of the annotation are robust so that they can deal with unexpected input from the source text or failing intermediate annotation components. Our extensive evaluation of the parser shows its competitiveness with other approaches and also gives insights into the general problems of parsing the German language.

This item appears in the following Collection(s)