Schritt für Schritt: eine Klasse definieren

Folgende Schritte sind für die Definition einer Klasse zu erledigen:

  1. Ein Objekt bzw. eine Klasse von Objekten in den Daten identifizieren.
  2. Die Klasse gemäß den 3 Buchstaben der Taxonomie des Simplex Modells spezifizieren.
  3. Standardfelder der Klasse in den Daten identifizieren bzw. festlegen.
  4. Die Klasse sowie ihre einzelnen Standardattribute (innerhalb der Definition) möglichst genau beschreiben.

Diese Schritte werden im Folgenden anhand des Beispiels durchgegangen.

Start

Ausgangspunkt ist die Liste aller Klassen in einer Quelle. Diese ist in der im vorhergegangenen Tutorial neu definierten Quelle noch leer.

Von dort wird über "Neue Klasse erstellen" folgendes Formular zur Definition einer neuen Klasse erreicht:

Zur Verfügung stehen uns die importierten Quelltabellen, die in einem eigenen Artikel beschrieben sind.

1. Klassen/Objekte identifizieren

Im Artikel zu Objekten und Klassen in Simplex4Data wird beschrieben, was - im Sinne des Simplex - ein Objekt ist.

Im Beispieldatensatz 1 (Destatis) können wir mehrere Arten von Objekten erkennen:

Gemeinden, die unterste Verwaltungsebene, zu der im Datensatz die meisten Informationen vorliegen (z.B. Averlak).

Landkreise (im Weiteren schlicht Kreise) , die nächsthöhere Verwaltungsebene (z.B. Burg-St. Michaelisdonn).

Diese Objekte sind in den Daten relativ leicht zu erkennen. Außerdem sind sie Teil der Verwaltung der Bundesrepublik und durch Gesetze, Vorschriften etc. fest definiert.

Wir entschließen uns an dieser Stelle, für beide je eine eigene Klasse zu definieren.

Entscheidend ist, dass es einen eindeutigen Objektschlüssel für jedes einzelne Objekt geben muss (für das Standardfeld "ndx", s.u.). Dieser Objektschlüssel kann bereits fertig in den Rohdaten vorliegen oder erst durch uns aus den Rohdaten gebildet werden. Entscheidend ist, dass wir uns darauf verlassen können, dass ein bestimmter Wert immer ein bestimmtes Objekt kennzeichnet.

Im vorliegenden Fall ist in den Rohdaten bereits ein eindeutiger Schlüssel enthalten: Der AGS. Er kann sowohl für Gemeinden (12 Stellen) als auch für Landkreise (9 Stellen)  genutzt werden.

Der Beispieldatensatz 2 (BKG) enthält, da er aus einem indizierten Shapefile stammt, auch eine sogenannte ShapeId, die ebenfalls eindeutig ist. Sie ist einfach ein fortlaufender Index. Dieser ist allerdings nicht mit anderen Datenquellen kompatibel: erhalten wir eine aktualisierte Datenlieferung nach einer Gemeindereform, können wir uns nicht darauf verlassen, dass diese ShapeId immer noch dieselben Landkreise bezeichnet. Dagegen können wir uns beim AGS auf diese Eindeutigkeit verlassen.

2. Die Klasse gemäß der Taxonomie des Simplex Modells spezifizieren

Die Taxonomie des Simplex-Modells bietet die Möglichkeit, den fachlichen Hintergrund der Daten anzugeben. Die Spezifikation hat keinerlei technischen Konsequenzen. Es geht hier um eine menschenlesbare grobe Einteilung, in welche „Schublade“ die Daten gehören, um leichter mit großen Datenmengen hantieren zu können.

Die Typologie ist im Kapitel zum Datenmodell erläutert und abgebildet.

Kreise und Gemeinden sind in dieser Typologie identisch anzuordnen: Beide sind Betrachtungsobjekte, womit "B" als erster Buchstabe feststeht.

Für den zweiten Buchstaben stellen wir fest: beide sind administrative Einheiten, womit "S" als zweiter Buchstabe feststeht.

Eine weitere Differenzierung mittels des dritten Buchstaben ersparen wir uns.

Wir können nun eintragen: "bs"

3. Standardfelder identifizieren und festlegen

Nachdem wir die Klasse selbst beschrieben haben, wechseln wir den Reiter und beschreiben die Felder der Klasse.

Die Standardfelder werden im Artikel zu Objekten und Klassen in Simplex4Data erläutert. Um geeignete Kandidaten zu finden, betrachten wir die Felder beider Beispieldatensätze (Destatis und BKG). Angewendet auf das Beispiel der Gemeinde ergibt sich folgende Definition der Felder:

Name

Wert der Quellstrukturen

Kommentar/Begründung

ndx

ARS

Der allgemeine Regionalschlüssel ist eindeutig pro Gemeinde

nam

Name der Gemeinde

 

dsc

Eine zusätzliche Eigenschaft der Gemeinde.

Hier ähnlich wie das Feld "typ" verwendet.

cmt

Vollständiger Name der Gemeinde.

Hier werden verschiedene beschreibende Spalten der Quelltabelle zusammenaddiert.

key

AGS

Der allgemeine Gemeindeschlüssel ist zwar auch eindeutig pro Gemeinde, wird jedoch seltener verwendet und ist veraltet. Deswegen ist er für eine möglichst breite Wiedererkennbarkeit einer Gemeinde weniger geeignet als der ARS. Alternativ wäre auch der ebenfalls vorliegende europäische Statistikschlüssel "nuts" eine passende Wahl gewesen.

typ

Bezeichnung der Gemeinde

Die Quellstrukturen geben eine kurze Liste an möglichen "Bezeichnungen" für Gemeinden an, die eine Differenzierung erlauben.

beg

Start der Lebenszeit der Gemeinde

Diese Lebenszeit bezieht sich auf Datenhaltung des BKG. Das wird deutlich, wenn man die Werte für Frankfurt am Main <1977-01-01 01:00:00+01> und Frankfurt an der Oder <2002-05-31 02:00:00+02> vergleicht.

fin

leer

Die Quellstrukturen enthalten keinen passenden Wert.

Zu beachten ist: Diese Definitionen sind noch keine Übertragung der Daten. Die erstellte Klasse ist leer. Um sie zu füllen, müssen eine oder mehrere Konvertierungen angelegt werden.

4. Die Klasse sowie ihre Standardattribute möglichst genau beschreiben

Die in den bisherigen Schritten geleistete Arbeit, die getroffenen Entscheidungen und Abwägungen, sowie das Wissen um die Daten sollte möglichst gut dokumentiert werden, indem die Formulare für die Klasse sowie ihre Standardfelder gefüllt werden.

Die in Schritt 1 und 2 gewonnen Erkenntnisse werden in das erste Interface eingegeben:

Die Definitionen der Standardfelder werden im Reiter zu den Standardfeldern eingetragen. Dabei werden möglichst alle recherchierten bzw. verfügbaren Informationen mit angegeben, um sie zu speichern. Das beliebig große Feld "cmt" ist besonders  geeignet, um dort z.B. Links auf Dokumentationen aufzunehmen, oder auch ganze Textabschnitte aus Dokumentationen abzuspeichern.

Nach Abschluss dieser Definition wird mit "Speichern" die Definition gespeichert. Damit ist diese Klasse nun erzeugt und liegt im Simplex4Data bereit!

Ergebnis

Nachdem einige weitere Klassen definiert wurden, sieht die Übersicht aller Klassen der Quelle nun folgendermaßen aus. Zu sehen sind für jede Klasse die Einträge zu ihrem Namen und ihre Beschreibung.

Die angelegte Klassendefinition kann betrachtet und geändert werden. Dazu wird die Klasse in der Liste angeklickt, und in der Detailansicht auf den Button "Bearbeiten" geklickt:

Das Formular zeigt die in den Definitionsschritten eingetragenen Werte sowie einige automatisch generierten Einträge.

Die Definition kann jederzeit angepasst werden, wenn sich z.B. während einer Konversion herausstellt, dass Standardfelder doch anders befüllt werden, oder zusätzliche Hinweise angebracht sind.