Vorstellung der Beispieldaten
Im Folgenden werden Datensätze beschrieben, die für die Tutorials des Datenmanagements benutzt werden, siehe Kapitel 2 (Strukturen anlegen) und Kapitel 3 (Konvertieren)
Der erste Datensatz ist der Ausgangspunkt der Objektbildung und der Herstellung von Verbindungen, der zweite Datensatz liefert zusätzliche weitere Informationen, mit denen die Objekte angereichert werden.
Doch bevor die Simplex4Data-spezifischen Zugriffe erfolgen, wirft diese Seite zunächst einen allgemeinen analytischen Blick auf den Inhalt dieser Daten: Was für Informationen liegen vor, wie sind sie formatiert und was lässt sich daraus ableiten?
1. Gemeindeverzeichnis (Destatis)
Die Internetpräsenz des statistischen Bundesamts (DESTATIS) bietet eine Reihe sehr nützlicher offener Daten an. Dazu gehört das deutsche Gemeindeverzeichnis.
Über die Seite https://www.destatis.de/DE/Themen/Laender-Regionen/Regionales/Gemeindeverzeichnis/_inhalt.html#101366 lässt sich u.a. der quartalsweise aktualisierte Datenstand als Tabellendokument herunterladen:
In einem Tabellenkalkulationsprogramm geöffnet, lassen sich im heruntergeladenen Dokument einige der Spalten des Datensatzes in folgender Abbildung erkennen:
1.1 Beobachtung: Hierarchie der Verwaltungsebenen
a) Jede Zeile ist ein eigener Datensatz.
b) Wie die textliche und farbliche Hervorhebung einzelner Zeilen signalisiert, liegen verschiedene Arten von Datensätzen vor, zwischen denen eine Hierarchie erkennbar ist. Diese Hierarchie ist in den Daten anhand des Feldes "Satzart" erkennbar. Unter anderem lassen sich unterscheiden:
- Bundesländer (fett und in blauer Schrift, Satzart 10)
- Landkreise bzw. Kreise (fett, Satzart 40)
- Gemeindeverbände (fett und in grüner Schrift, Satzart 50)
- Gemeinden (unterste Ebene, keine Hervorhebung, Satzart 60)
c) Diese Hierarchie sowie die Zuordnung zu der Datensatz-Art basiert auf einer Reihe von Schlüsseln, die zusammen den amtlichen Regionalschlüssel (ARS) bilden.
d) Durch das Feld "Textkennzeichen" werden innerhalb einer Stufe verschiedene Typen unterschieden (z.B. für Kreise: Textkennzeichen 41 = kreisfreie Stadt, Textkennzeichen 43 = Kreis)
1.2 Beobachtung: Informationen zu Gemeinden
Viele zusätzliche Informationen liegen in den Zeilen vor, die Gemeinden beschreiben:
© Daten (im Auftrag der Herausgebergemeinschaft Statistische Ämter des Bundes und der Länder) Statistisches Bundesamt (Destatis), 2023
2. Verwaltungsgebiete (BKG)
Eine weitere offene Datensammlung bietet das Bundesamt für Kartographie und Geodäsie (BKG).
Es stellt verschiedene Datensätze zu Verwaltungsgebieten bereit.
Hier wird das Produkt 1:1 000 000 (VG1000) gewählt. Es liefert die detailliertesten offen zugänglichen Daten. Es enthält eine Reihe von Shapefiles, welche ebenfalls verschiedene Verwaltungsebenen der Bundesrepublik beschreiben. Allerdings ist hier die unterste Ebene nicht die Gemeinde, sondern der Landkreis.
Diese unterste Ebene (durch das BKG mit "VG1000_KRS" bezeichnet) betrachten wir im Folgenden.
Unter anderem sind folgende Attribute zusätzlich zur geometrischen Information erhältlich:
© GeoBasis-DE / BKG (2022)
2.1 Beobachtung: Verwaltungsebenen
Das Produkt VG1000 unterscheidet zwischen den Verwaltungsebenen dadurch, dass es für jede Ebene ein separates Shapefile erstellt.
Einige Landkreise haben mehrere Einträge (=Zeilen) im Datensatz, z.B. Flensburg oder Dithmarschen. Wie die Dokumentation des Produkts verrät, bilden sie Teilflächen auf Gewässern (GF=2) und Landteilflächen (GF=4) ab und unterscheiden sich in der Spalte GF oder "Geofaktor". Jeden Landkreis gibt es nur ein einziges Mal mit GF=4.
2.2 Beobachtung: flächendeckende geometrische Informationen zu höheren Verwaltungsebenen
Der Datensatz liefert als Shapefile geometrische Informationen zu den Flächen der Landkreise und weiterer Verwaltungsebenen. Für Landkreise sind diese Informationen flächendeckend für ganz Deutschland.
In QGIS lassen sich diese geometrischen Informationen (hier zu Landkreisen) anzeigen:
© GeoBasis-DE / BKG (2022), © OpenStreetMap Contributors
2.3 Beobachtung: Attribute für höhere Verwaltungsebenen
Der Datensatz enthält eine Reihe weiterer Attribute zu den Landkreisen. Da der Destatis-Datensatz nur sehr wenige Informationen zu den Landkreisen bereit hält, ist das eine hilfreiche Ergänzung.
Die Bedeutungen dieser Attribute wird in der Dokumentation des BKG erläutert.
2.4 Beobachtung: Identischer Schlüssel
Das BKG gibt, wie Destatis, für Landkreise den ARS an. Mithilfe dieses Schlüssels können Landkreise, die in beiden Datenquellen vorkommen, identifiziert und die Informationen zu ihnen zusammengeführt werden.