Repräsentanz und Data Mining - Konzepte und Methoden der digitalen bodenkundlichen Kartierung

DSpace Repository


Dateien:

URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-40991
http://hdl.handle.net/10900/49316
Dokumentart: Dissertation
Date: 2009
Language: German
Faculty: 7 Mathematisch-Naturwissenschaftliche Fakultät
Department: Geographie, Geoökologie, Geowissenschaft
Advisor: Scholten, Thomas (Prof. Dr.)
Day of Oral Examination: 2009-07-23
DDC Classifikation: 550 - Earth sciences
Keywords: Data Mining , Bodenkartierung
Other Keywords: Bodenlandschaftsmodellierung , Repräsentanz , Landschaftssegmentierung
Soil landscape modeling , Representativity , Segmentation
License: Publishing license excluding print on demand
Show full item record

Inhaltszusammenfassung:

Im Rahmen dieser Arbeit, die im Sonderforschungsbereich 299 (Landnutzungskonzepte für periphere Regionen) der deutschen Forschungsgemeinschaft angesiedelt ist, wurden Methoden und Konzepte entwickelt, die eine repräsentative Beprobung und hochauflösende Regionalisierung von Bodeneigenschaften in großen Landschaftsräumen (> 1000 km2) ermöglichen. Der Hauptschwerpunkt lag dabei auf der Entwicklung einer mehrstufigen Beprobungsstrategie in Kombination mit speziellen Verfahren aus dem Bereich des Data Mining zur Regionalisierung von Bodeneigenschaften und Bodenformen. Untersuchungsräume waren das Einzugsgebiet der Nidda in Hessen, der Pfälzer Wald in Rheinland Pfalz und eine Region innerhalb der Republik Niger. Im Rahmen der mehrstufigen Beprobungsstrategie wurde das Nidda-Einzugsgebiet im ersten Arbeitsschritt (Manuskript 1) in homogene, nicht fragmentierte Teilräume untergliedert. Die als Grundlage für die Segmentierung vorliegende Bodenkarte 1:50.000 (HLUG) wurde mit Hilfe einer moving-window-basierten Häufigkeitsanalyse ausgewertet und im Anschluss durch eine räumliche k-means Clusteranalyse klassifiziert. Die Anzahl der Cluster, wie auch die Größe des moving-window, wurden semi-automatisch ermittelt. Damit konnten die Bodenlandschaften Vogelsberg, Unterer Vogelsberg, Büdinger Wald, Nordöstliche Wetterau, Südwestliche Wetterau und Taunus raumstatistisch voneinander getrennt werden. Somit stehen homogene Bodenlandschaften für bodenkundliche Regionalisierungen zur Verfügung deren Ergebnisse eine hohe Informationsdichte liefern und damit den Beprobungs- und Analyseaufwand minimieren. Als notwendiger Zwischenschritt zur räumlich repräsentativen Beprobung wurden innerhalb der Bodenlandschaftssegmente repräsentative Teilräume nach einem im SFB 299 entwickelten Verfahren mit einer Größe von 3x3 km ausgewählt. Im nächsten Arbeitsschritt konnten somit Methoden zur repräsentativen Auswahl von Transekten für die geophysikalische Erkundung entwickelt werden (Manuskript 2). Das Singleline-Verfahren erfasst alle Raumeinheiten entlang eines einzelnen Transekts im repräsentativen Teilraum. Die Multiline-Methodik weist mehrere Transekte entlang definierter Übergangsbereiche zwischen einzelnen Bodenformen im repräsentativen Teilraum aus. Statistische Analysen und Modellrechungen zeigten, dass der Multiline-Ansatz etwas längere Transekte liefert, jedoch den Merkmalsraum in Bezug auf die Häufigkeitsverteilung charakteristischer Reliefparameter wie Hangneigung, Exposition und Höhe über Tiefenlinie umfassender beschreibt. In einem weiteren Schwerpunkt wird in dieser Arbeit die Eignung von Stichprobenverfahren im Umgang mit redundanten, ungenauen (verrauschten) und großen Lerndatensätzen adressiert, wie sie bei der Verwendung gerasterter Bodenkarten als Lerngrundlage auftreten können (Manuskript 3). Durch die Anwendung von unterschiedlichen zufallsbasierten Stichprobenverfahren wurde eine Fokussierung auf relevante Informationen ermöglicht und damit die Prognosequalität um bis zu 12% verbessert. Klassische Bodenkarten wie auch Geologische Karten sind, da sie expertenbasierte Werke darstellen, meist subjektiven Einflüssen unterworfen. Die damit verbundenen Ungenauigkeiten und Generalisierungen zeichnen sich meist unmittelbar in den Grenzverläufen nach. Zur Verbesserung der Grenzverläufe wurde daher im Rahmen dieser Arbeit ein rasterbasiertes Verfahren entwickelt (Manuskript 4). Dabei werden die Unsicherheiten analysiert und an das Relief eines höher aufgelösten Höhenmodells angepasst. Das Verfahren zeigt am Beispiel einer Bodenkarte (1:50.000) im Nidda-Einzugsgebiet sowie einer Geologischen Karte der Republik Niger (1:1.000.000) eine plausible Korrektur der Grenzbereiche, wodurch Fehler und Artefakte in prognostischen Modellen verringert werden können. Die vorgestellten, modular einsetzbaren Methoden ermöglichen in kombinierter Anwendung eine reproduzierbare und objektive Gliederung der Landschaft in Segmente, eine valide Identifikation repräsentativer Teilräume und Transekte, sowie eine qualitativ verbesserte Geodaten-Basis für die Anwendung in Boden-Landschaftsmodellen. Somit können auch in Großlandschaften valide, hochaufgelöste bodenkundliche Informationen flächendeckend und effizient zur Verfügung gestellt werden.

Abstract:

This thesis is part of the Collaborative Research Centre (SFB) 299 – Land Use Options for Peripheral Regions founded by the German Research Foundation (DFG). The general aim was to develop methods and concepts for representative sampling and high-resolution digital soil mapping in large-scale landscapes (>1000km²). The main focus was on the development of a multi-stage sampling scheme in combination with data mining techniques in order to regionalize soil properties and soil classes. The main study areas included the Nidda catchment in Hesse, Germany, the Pfälzer Wald in Rhineland-Palatine, Germany, and one region in the Republic of Niger. As a first step of the sampling scheme (see manuscript 1) the Nidda catchment was divided in homogeneous, non-fragmented segments. The 1:50.000 soil map (HLUG), which served as a basis for the segmentation, was evaluated by a moving-window frequency distribution analysis and subsequently classified by a spatial k-means cluster analysis. The number of clusters as well as the size of the moving window were determined semi-automatically. Based on this approach the soilscapes Vogelsberg, Lower Vogelsberg, Forest of Büdingen, North-East Wetterau, South-West Wetterau and Taunus could be statistically separated. Thus homogeneous soilscapes for the additional use of digital soil mapping approaches were generated. Based on a patch sampling method developed in the SFB 299 representative patches were derived. The spatial extent of each patch was 3x3 km. The second step covers the development of methods for a representative generation of transects for geophysical surveys (see manuscript 2). The so called Singleline approach includes all spatial units along a single transect in a representative subspace. The Multiline method designates several transects along defined transition zones between different soil types in a representative subspace. Statistical analyses and model calculations showed that the Multiline approach generates longer transects. With regard to the frequency distribution of characteristic terrain attributes such as slope, aspect and local elevation, however, it describes the feature space more thoroughly. Further, this thesis focused on an objective and reproducible improvement of the prediction quality of soil information. Traditional soil maps have been compiled with different standards and mapping techniques and, as expert-based values, they are generally affected by subjective influences. The resulting uncertainties and generalizations have a direct effect on the boundaries. Therefore, a raster-based approach was developed in order to adjust the boundaries (see manuscript 3) on the basis of higher resolution terrain attributes. This method produced a plausible adjustment of the boundary regions for a soil map of the Nidda catchment (1: 50.000) and a geological map of the Republic of Niger (1:1.000.000). As a result, errors and artefacts in predictive models can be reduced. The last part of this work focused on the combination of sampling schemes and predictive models and their application in order to handle redundant, uncertain (noisy) information in large datasets, as they tend to occur when existing, rasterized soil maps are used as a training base (see manuscript 4). By applying different randomized sampling procedures focussing on relevant information and improving prediction quality up to 12% was enabled. Based on the modular structure of the methods introduced, it is possible to obtain a reproducible and objective segmentation of the landscape, a valid identification of representative subsets and transects and an improved quality of the geodata basis used for soil-landscape-modelling. Therefore, comprehensive and valid high-resolution soil scientific information can be provided even for large scale landscapes.

This item appears in the following Collection(s)