GOV-DES-Erfassungsprojekt Gemeindelexika Preußen 1885: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen
Zeile 38: Zeile 38:
Das DES gibt anschließend einen Datensatz der erfassten Daten als Export aus. Hier wird der erfasste Zahlenapparat zu den Ortsdaten hinzugefügt. Somit ergibt sich der Gesamtdatensatz.
Das DES gibt anschließend einen Datensatz der erfassten Daten als Export aus. Hier wird der erfasste Zahlenapparat zu den Ortsdaten hinzugefügt. Somit ergibt sich der Gesamtdatensatz.
Parallel dazu wird die Erfassung im GOV vorangetrieben. Die Erfassungsmaske im DES ist direkt mit dem GOV verbunden und fragt dieses für die Namen der einzelnen Ortsdaten jeweils ab. Für jedes erfasste Objekt (Stadt, Landgemeinde, Amtsbezirk usw...) muss die entsprechende GOV-ID vorliegen. Ist diese nicht vorhanden, wird das Objekt im GOV angelegt. Damit werden die Lücken im GOV ausgemacht und direkt geschlossen. Am Ende hat jedes erfasste Objekt eine eindeutige GOV-ID. Erst dann ist der Datensatz vollständig. Nach Abschluss eines Bandes wird der Datensatz ins GOV eingespielt und sämtliche Verknüpfungen, Zugehörigkeiten und Hierarchisierungen für jedes einzelne Objekte werden hergestellt.
Parallel dazu wird die Erfassung im GOV vorangetrieben. Die Erfassungsmaske im DES ist direkt mit dem GOV verbunden und fragt dieses für die Namen der einzelnen Ortsdaten jeweils ab. Für jedes erfasste Objekt (Stadt, Landgemeinde, Amtsbezirk usw...) muss die entsprechende GOV-ID vorliegen. Ist diese nicht vorhanden, wird das Objekt im GOV angelegt. Damit werden die Lücken im GOV ausgemacht und direkt geschlossen. Am Ende hat jedes erfasste Objekt eine eindeutige GOV-ID. Erst dann ist der Datensatz vollständig. Nach Abschluss eines Bandes wird der Datensatz ins GOV eingespielt und sämtliche Verknüpfungen, Zugehörigkeiten und Hierarchisierungen für jedes einzelne Objekte werden hergestellt.
Stand September 2025 ist das Projekt noch als geschlossenes Projekt angelegt, um die Koordinierung und Qualitätskontrolle zu erleichtern. Letztere findet in zwei Schritten statt. Eine Gruppe von Hilfskräften, die die Objekte im GOV anlegt, geht die einzelnen bereits erfassten Landkreise meist noch einmal durch und führt bei Bedarf Verbesserungen durch. Und zum Abschluss findet auch vonseiten der Projektleitung eine Kontrolle durch. Beim Einspielen ins GOV werden zudem etwaige Fehler gemeldet und können dann noch einmal korrigiert werden.
Stand September 2025 ist das Projekt noch als geschlossenes Projekt angelegt, um die Koordinierung und Qualitätskontrolle zu erleichtern. Letztere findet in zwei Schritten statt. Eine Gruppe von Hilfskräften, die die Objekte im GOV anlegt, geht die einzelnen bereits erfassten Landkreise meist noch einmal durch und führt bei Bedarf Verbesserungen durch. Und zum Abschluss findet auch vonseiten der Projektleitung eine Kontrolle durch. Beim Einspielen ins GOV werden zudem etwaige Fehler gemeldet und können dann noch einmal korrigiert werden.



Version vom 19. September 2025, 10:02 Uhr

Auf dieser Seite wird das GOV-DES-Erfassungsprojekt "Gemeindelexika Preußen 1885" beschrieben.

Das Erfassungsprojekt läuft ab Juli 2024 mit einer Mindestlaufzeit bis Anfang 2028 in Zusammenarbeit des Vereins für Computergenealogie mit der Task-Area 2 "Data-Connectivity" des NFDI4Memory-Konsortiums. Verantwortlicher Projektbetreuer ist Julian Freytag.

Einführung: Die Gemeindelexika und Ortsdaten in der Geschichtswissenschaft

Im Deutschen Kaiserreich (1871-1918) sind in regelmäßigen Abständen Gemeindeverzeichnisse als Gesamtüberblick über die vorhandenen Siedlungs- und Bevölkerungsstrukturen erschienen. Diese basierten auf den ebenfalls regelmäßig (alle zehn Jahre) durchgeführten Volkszählungen. Erstmals liegen damit mit diesen Gemeindeverzeichnissen über einen größeren Zeitraum vergleichbare serielle Quellen vor, die immer im gleichen Schema und mit gleichem Aufbau publiziert wurden und ihrerseits auf standardisiert erfassten Angaben und verbesserten statistischen Verfahren bei den Volkszählungen beruhten. Die Volkszählungen wurden im gesamten Deutschen Kaiserreich durchgeführt, die Ergebnisse jedoch in den unterschiedlichen Ländern verschiedentlich publiziert. Für das Königreich Preußen, dem mit Abstand größten Staat innerhalb des Reiches, wurden die Verzeichnisse einheitlich und regelmäßig vom Königlich Statistischen Büro (später vom Königlich Preußischen Statistischen Landesamt) veröffentlicht. Den Anfang machten in den 1870er-Jahren die "Die Gemeinden und Gutsbezirke des Preussischen Staates und ihrer Bevölkerung" auf Grundlage der Volkszählung 1871. Die Materialien der Volkszählung 1885 wurden dann 1887 und 1888 bereits als "Gemeindelexikon für das Königreich Preußen" herausgegeben. Dem folgten entsprechende Lexika ab 1895, 1905 und zuletzt nach 1910. Nach dem Ersten Weltkrieg wurde diese Tradition in Form des "Gemeindelexikon für den Freistaat Preußen" fortgesetzt. Die Publikation erfolgte immer in einzelnen Bänden für die einzelnen Provinzen.

Diese Gemeindelexika sind sowohl für die Genealogie als auch für die Geschichtswissenschaft eine äußerst wertvolle Quelle. Neben den Namen der Städte, Landgemeinden und Gutsbezirke werden verschiedene statistische Angaben zur Fläche, zum Grundsteuer-Reinertrag und zur Bevölkerung gemacht. Diese lassen sich durch eine Massenerfassung in großen Maßstäben auswerten und vergleichen, sowohl räumlich über die verschiedenen Provinzen als auch zeitlich über die Jahrzehnte hinweg. Für die Wirtschafts- und Sozialgeschichte sind die Lexika damit eine aussagekräftige Quelle, die Ruckschlüsse etwa über die Bevölkerungsstruktur und -zusammensetzung zulassen. Daneben sind die Angaben zur Gemeinde- und Verwaltungsstruktur von großem Interesse. Die hierarchische Verwaltungsgliederung lässt sich anhand der Lexika bis auf die unterste Ebene nachvollziehen: Von der Provinz, über den Regierungsbezirk, über die Landkreise hin zu den Städten, Landgemeinden und Gutsbezirke und zuletzt bis auf die Ebene der Wohnplätze. Hinzu kommt parallel die Zuordnung zu den Amtsbezirken (oder Polizeidistrikten), den Standesamtsbezirken und zur kirchlichen Verwaltungsstruktur in Form der evangelischen und katholischen Kirchspiele.

Somit lassen sich standardisierte und flächendeckende Ortsdaten erfassen, die in der Geschichtswissenschaft vor allem im Zuge der Digitalisierung und der Verfügbarkeit von Massendaten zunehmend an Bedeutung gewinnen.



Das Erfassungsprojekt

Ziel des Erfassungsprojektes ist die flächendeckende und erschöpfende Erfassung der Ortsdaten des Gemeindelexikons Preußen für einen festen Zeitpunkt und deren Repräsentation im GOV. Als Zeitpunkt wurde die Volkszählung 1885 ausgewählt, da hier noch größere Lücken im GOV vorlagen. Zudem sind alle Bände als Digitalisat verfügbar. Das Erfassungsprojekt startete im Juli 2024 und läuft zunächst bis Anfang 2028. Unter der Leitung von Julian Freytag arbeiten mehrere studentische Hilfskräfte an der Erfassung. Provinz für Provinz werden die einzelnen Bände abgearbeitet und alle Angaben in einem mehrteiligen Datensatz erfasst. Dieser wird im Laufe des Projekts in mehreren Teilen extern publiziert werden und somit sowohl für die Genealogie als auch für die Wissenschaft zur Verfügung stehen. Durch die parallele Einspielung der (fehlenden) Daten ins GOV, wird dieses zum einen quantitativ, durch die Verknüpfung, Hierarchisierung und Anreicherung der Objekte zum anderen aber auch qualitativ aufgewertet. Damit soll das GOV mit seinen hochwertigen Ortsdaten als wichtiges gazetteer perspektivisch auch in der Wissenschaft sichtbarer gemacht werden.

Workflow im DES und GOV

Grundlage der Erfassung sind die einzelnen Bände des Gemeindelexikons, die für jede Provinz einzeln publiziert wurden. Insgesamt handelt es sich dabei um 13 Bände, die in den Jahren 1887 und 1888 publiziert wurden. Erfassungstool für das Projekt ist das Daten-Erfassungs-System (DES) des Vereins für Computergenealogie. Hier werden für jeden Band einzelne Projekte angelegt. Dabei wird immer erst ein Band vollständig abgeschlossen bevor der nächste begonnen wird. In einem ersten Arbeitsschritt werden über die DES-Erfassungsmaske die wichtigsten Ortsdaten des Gemeindelexikons erfasst: Innerhalb jedes Landkreises umfasst dies:

  • die laufende Nummer
  • Städte
  • Landgemeinden
  • Gutsbezirke
  • Amtsbezirke (Polizeidistrikte)
  • Standesamtsbezirke
  • evangelische Kirchspiele
  • katholische Kirchspiele
  • Außerdem wird zur Vergleichbarkeit und Verknüpfung für die Städte und Landgemeinden die jeweilige GND-Nummer recherchiert, falls vorhanden

Im zweiten Arbeitsschritt erfassen die Hilfskräfte schließlich den kompletten Zahlenapparat zur Bevölkerungsstruktur in einer extra Tabelle. Dies umfasst folgende Informationen: Anzahl der Wohnplätze, Gebäude, Haushalte, Gesamtbevölkerungszahl, Aufteilung derselben in männlich und weiblich, aktive Militärpersonen, Evangelische, Katholiken, sonstige Christen, Juden und andere Religionsbekenntnisse. Stand September 2025 gibt es noch keine zufriedenstellende Lösung für die automatisierte KI-Erfassung bzw. -Erkennung dieser Zahlentabellen. Mehrere Versuche scheiterten an der zu hohen Fehlerquote. Das DES gibt anschließend einen Datensatz der erfassten Daten als Export aus. Hier wird der erfasste Zahlenapparat zu den Ortsdaten hinzugefügt. Somit ergibt sich der Gesamtdatensatz. Parallel dazu wird die Erfassung im GOV vorangetrieben. Die Erfassungsmaske im DES ist direkt mit dem GOV verbunden und fragt dieses für die Namen der einzelnen Ortsdaten jeweils ab. Für jedes erfasste Objekt (Stadt, Landgemeinde, Amtsbezirk usw...) muss die entsprechende GOV-ID vorliegen. Ist diese nicht vorhanden, wird das Objekt im GOV angelegt. Damit werden die Lücken im GOV ausgemacht und direkt geschlossen. Am Ende hat jedes erfasste Objekt eine eindeutige GOV-ID. Erst dann ist der Datensatz vollständig. Nach Abschluss eines Bandes wird der Datensatz ins GOV eingespielt und sämtliche Verknüpfungen, Zugehörigkeiten und Hierarchisierungen für jedes einzelne Objekte werden hergestellt.

Stand September 2025 ist das Projekt noch als geschlossenes Projekt angelegt, um die Koordinierung und Qualitätskontrolle zu erleichtern. Letztere findet in zwei Schritten statt. Eine Gruppe von Hilfskräften, die die Objekte im GOV anlegt, geht die einzelnen bereits erfassten Landkreise meist noch einmal durch und führt bei Bedarf Verbesserungen durch. Und zum Abschluss findet auch vonseiten der Projektleitung eine Kontrolle durch. Beim Einspielen ins GOV werden zudem etwaige Fehler gemeldet und können dann noch einmal korrigiert werden.

Projektfortschritt

Herausforderungen

Ausblick

Projektbetreuung

Projektbetreuer

Julian Freytag, M.A.

Kontakt

julian.freytag@geschichte.uni-halle.de