GOV-DES-Erfassungsprojekt Gemeindelexika Preußen 1885
GOV-Hauptseite > GOV/Projekt > GOV-Datenerfassungen > GOV-Daten Preußen > GOV-DES-Erfassungsprojekt Gemeindelexika Preußen 1885
Auf dieser Seite wird das GOV-DES-Erfassungsprojekt "Gemeindelexika Preußen 1885" beschrieben.
Das Erfassungsprojekt läuft ab Juli 2024 mit einer Mindestlaufzeit bis Anfang 2028 in Zusammenarbeit des Vereins für Computergenealogie mit der Task-Area 2 "Data-Connectivity" des NFDI4Memory-Konsortiums. Verantwortlicher Projektbetreuer ist Julian Freytag.
Einführung: Die Gemeindelexika und Ortsdaten in der Geschichtswissenschaft
Im Deutschen Kaiserreich (1871-1918) sind in regelmäßigen Abständen Gemeindeverzeichnisse als Gesamtüberblick über die vorhandenen Siedlungs- und Bevölkerungsstrukturen erschienen. Diese basierten auf den ebenfalls regelmäßig (alle zehn Jahre) durchgeführten Volkszählungen. Erstmals liegen damit mit diesen Gemeindeverzeichnissen über einen größeren Zeitraum vergleichbare serielle Quellen vor, die immer im gleichen Schema und mit gleichem Aufbau publiziert wurden und ihrerseits auf standardisiert erfassten Angaben und verbesserten statistischen Verfahren bei den Volkszählungen beruhten. Die Volkszählungen wurden im gesamten Deutschen Kaiserreich durchgeführt, die Ergebnisse jedoch in den unterschiedlichen Ländern verschiedentlich publiziert. Für das Königreich Preußen, dem mit Abstand größten Staat innerhalb des Reiches, wurden die Verzeichnisse einheitlich und regelmäßig vom Königlich Statistischen Büro (später vom Königlich Preußischen Statistischen Landesamt) veröffentlicht. Den Anfang machten in den 1870er-Jahren die "Die Gemeinden und Gutsbezirke von Preussen" auf Grundlage der Volkszählung 1871. Die Materialien der Volkszählung 1885 wurden dann 1887 und 1888 bereits als "Gemeindelexikon für das Königreich Preußen" herausgegeben. Dem folgten entsprechende Lexika ab 1895, 1905 und zuletzt nach 1910. Nach dem Ersten Weltkrieg wurde diese Tradition in Form des "Gemeindelexikon für den Freistaat Preußen" fortgesetzt. Die Publikation erfolgte immer in einzelnen Bänden für die einzelnen Provinzen.
Diese Gemeindelexika sind sowohl für die Genealogie als auch für die Geschichtswissenschaft eine äußerst wertvolle Quelle. Neben den Namen der Städte, Landgemeinden und Gutsbezirke werden verschiedene statistische Angaben zur Fläche, zum Grundsteuer-Reinertrag und zur Bevölkerung gemacht. Diese lassen sich durch eine Massenerfassung in großen Maßstäben auswerten und vergleichen, sowohl räumlich über die verschiedenen Provinzen als auch zeitlich über die Jahrzehnte hinweg. Für die Wirtschafts- und Sozialgeschichte sind die Lexika damit eine aussagekräftige Quelle, die Ruckschlüsse etwa über die Bevölkerungsstruktur und -zusammensetzung zulassen. Daneben sind die Angaben zur Gemeinde- und Verwaltungsstruktur von großem Interesse. Die hierarchische Verwaltungsgliederung lässt sich anhand der Lexika bis auf die unterste Ebene nachvollziehen: Von der Provinz, über den Regierungsbezirk, über die Landkreise hin zu den Städten, Landgemeinden und Gutsbezirke und zuletzt bis auf die Ebene der Wohnplätze. Hinzu kommt parallel die Zuordnung zu den Amtsbezirken (oder Polizeidistrikten), den Standesamtsbezirken und zur kirchlichen Verwaltungsstruktur in Form der evangelischen und katholischen Kirchspiele.
Somit lassen sich standardisierte und flächendeckende Ortsdaten erfassen, die in der Geschichtswissenschaft vor allem im Zuge der Digitalisierung und der Verfügbarkeit von Massendaten zunehmend an Bedeutung gewinnen. Genau wie in der Genealogie geht es auch in der geschichtswissenschaftlichen Forschung um die möglichst genau Identifikation und Zuordnung eines Ortes, der etwa in einer historischen Quelle genannt wurde. Zur genauen Verortung und Kontextualisierung sind qualitativ hochwertige Ortsdaten nötig. Diese lassen sich mithilfe der Gemeindelexika generieren. Wichtig dabei ist eine flächendeckend einheitliche Erfassung dieser seriellen Quelle. Zahlreiche Ortsdaten sind bereits in zahlreichen Ortsdatenbanken vorhanden, jedoch alle mit unterschiedlichen Standards und Angaben und oft mit regionalen oder lokalen Schwerpunkten. Die komplette Erfassung der preußischen Gemeindelexika 1885 wird einen großen Raum einheitlich abdecken.
Das Erfassungsprojekt
Ziel des Erfassungsprojektes ist die flächendeckende und erschöpfende Erfassung der Ortsdaten des Gemeindelexikons Preußen für einen festen Zeitpunkt und deren Repräsentation im GOV. Als Zeitpunkt wurde die Volkszählung 1885 ausgewählt, da hier noch größere Lücken im GOV vorlagen. Zudem sind alle Bände als Digitalisat verfügbar. Das Erfassungsprojekt startete im Juli 2024 und läuft zunächst bis Anfang 2028. Unter der Leitung von Julian Freytag arbeiten mehrere studentische Hilfskräfte an der Erfassung. Provinz für Provinz werden die einzelnen Bände abgearbeitet und alle Angaben in einem mehrteiligen Datensatz erfasst. Dieser wird im Laufe des Projekts in mehreren Teilen extern publiziert werden und somit sowohl für die Genealogie als auch für die Wissenschaft zur Verfügung stehen. Durch die parallele Einspielung der (fehlenden) Daten ins GOV, wird dieses zum einen quantitativ, durch die Verknüpfung, Hierarchisierung und Anreicherung der Objekte zum anderen aber auch qualitativ aufgewertet. Damit soll das GOV mit seinen hochwertigen Ortsdaten als wichtiges gazetteer perspektivisch auch in der Wissenschaft sichtbarer gemacht werden.
Workflow im DES und GOV
Grundlage der Erfassung sind die einzelnen Bände des Gemeindelexikons, die für jede Provinz einzeln publiziert wurden. Insgesamt handelt es sich dabei um 13 Bände, die in den Jahren 1887 und 1888 publiziert wurden. Erfassungstool für das Projekt ist das Daten-Erfassungs-System (DES) des Vereins für Computergenealogie. Hier werden für jeden Band einzelne Projekte angelegt. Dabei wird immer erst ein Band vollständig abgeschlossen bevor der nächste begonnen wird. Die Erfassungsreihenfolge richtet sich nicht nach der Nummerierung bzw. Veröffentlichungsreihenfolge der Bände. Priorität haben zunächst die ehemaligen östlichen Provinzen des Deutschen Reiches (Pommern, Posen, Ost- und Westpreußen, Schlesien), da hier die größten Lücken im GOV vorhanden sind.
Verwaltungsebene
Im ersten Arbeitsschritt werden über die DES-Erfassungsmaske die wichtigsten Ortsdaten des Gemeindelexikons erfasst: Innerhalb jedes Landkreises umfasst dies:
- die laufende Nummer
- Städte
- Landgemeinden
- Gutsbezirke
- Amtsbezirke (Polizeidistrikte)
- Standesamtsbezirke
- evangelische Kirchspiele
- katholische Kirchspiele
- Außerdem wird zur Vergleichbarkeit und Verknüpfung für die Städte und Landgemeinden die jeweilige GND-Nummer recherchiert, falls vorhanden
Im zweiten Arbeitsschritt erfassen die Hilfskräfte schließlich den kompletten Zahlenapparat zur Bevölkerungsstruktur in einer extra Tabelle. Dieser umfasst folgende Informationen über die Anzahl:
- Wohnplätze
- Gebäude
- Haushalte
- Gesamtbevölkerungszahl
- Aufteilung derselben in männlich und weiblich
- aktive Militärpersonen
- Evangelische
- Katholiken
- sonstige Christen
- Juden
- andere Religionsbekenntnisse.
Stand September 2025 gibt es noch keine zufriedenstellende Lösung für die automatisierte KI-Erfassung bzw. -Erkennung dieser Zahlentabellen. Mehrere Versuche scheiterten an der zu hohen Fehlerquote. Das DES gibt anschließend einen Datensatz der erfassten Daten als Export aus. Hier wird der erfasste Zahlenapparat zu den Ortsdaten hinzugefügt. Somit ergibt sich der Gesamtdatensatz. Parallel dazu wird die Erfassung im GOV vorangetrieben. Die Erfassungsmaske im DES ist direkt mit dem GOV verbunden und fragt dieses für die Namen der einzelnen Ortsdaten jeweils ab. Für jedes erfasste Objekt (Stadt, Landgemeinde, Amtsbezirk usw...) muss die entsprechende GOV-ID vorliegen. Ist diese nicht vorhanden, wird das Objekt im GOV angelegt. Damit werden die Lücken im GOV ausgemacht und direkt geschlossen. Am Ende hat jedes erfasste Objekt eine eindeutige GOV-ID. Erst dann ist der Datensatz vollständig. Nach Abschluss eines Bandes wird der Datensatz ins GOV eingespielt und sämtliche Verknüpfungen, Zugehörigkeiten und Hierarchisierungen für jedes einzelne Objekte werden hergestellt.
Derzeit (Stand September 2025) ist das Projekt noch als geschlossenes Projekt angelegt, um die Koordinierung und Qualitätskontrolle zu erleichtern. Letztere findet in zwei Schritten statt. Eine Gruppe von Hilfskräften, die die Objekte im GOV anlegt, geht die einzelnen bereits erfassten Landkreise meist noch einmal durch und führt bei Bedarf Verbesserungen durch. Und zum Abschluss findet auch vonseiten der Projektleitung eine Kontrolle statt. Beim Einspielen ins GOV werden zudem etwaige Fehler gemeldet und können dann noch einmal korrigiert werden.
Wohnplatzebene
Die skizzierten Arbeitsschritte betreffen jeweils einen Band des Gemeindelexikons, der jeweils einem in sich geschlossenen Projekt im DES entspricht. Perspektivisch ist zudem die flächendeckende Erfassung sämtlicher im Gemeindelexikon genannten Wohnplätze geplant. Dazu ist ein paralleler Workflow nötig, der nur die Wohnplätze erfasst. Dieser Projektteil findet sich gerade noch in der Erprobungsphase. Ziel hierbei ist die komplette Erfassung auch der untersten Ebene, die bei Ortsdaten möglich ist. In dieser geographischen Ausdehnung (ganz Preußen) und mit der Unterscheidung von Wohnplatz (Siedlungsobjekt) und Gemeinde (Verwaltungsobjekt) wäre dies ein Novum bei den Ortsdatenbanken. Diese Unterscheidung findet sich sowohl im Gemeindelexikon selbst als auch im GOV durch unterschiedliche Typengruppen (Verwaltung, Siedlung) und Typen (z.B.: Landgemeinde, Gutsbezirk, Wohnplatz, Dorf, Siedlung, Weiler usw...). Wichtig ist dabei zu beachten, dass die Objekte der Verwaltungsebene keine Punktkoordinaten haben sollen. Da sie sich meist aus mehreren untergeordneten Objekten (Dörfer, Wohnplätze, Güter usw...) zusammensetzen, ist eine Flächenkoordinate bzw. die Summe der Punktkoordinaten angebrachter. Die Objekte der Wohnplatzebene hingegen müssen alle eine Punktkoordinate zur genauen Lokalisierung haben.
Dementsprechend findet die Erfassung der Wohnplätze des Gemeindelexikons statt: Auch hier wird jeder Band des Gemeindelexikon von vorne nach hinten durchgearbeitet, Landkreis für Landkreis. Dazu werden extra DES-Projekte angelegt und die Wohnplatz-Erfassung folgt den Bänden der Verwaltungs-Erfassung mit zeitlicher Verzögerung, damit alle Verwaltungsobjekte schon erfasst sind. Zunächst wird jede Stadt und Gemeinde und jeder Gutsbezirk inklusive GOV-ID erfasst, weil alle Verwaltungsobjekte mindestens ein Wohnplatzobjekt unter sich haben. Anschließend wird der Wohnplatz als untergeordnetes mit GOV-Abfrage erfasst. Ist er bereits im GOV vorhanden, wird die GOV-ID automatisch hinzugefügt. Bei der Erfassung müssen schließlich nur noch die zusätzlichen Angaben zum Wohnplatz erfasstn werden: Gebäudeanzahl und Einwohner. Das Feld Koordinaten bleibt frei. Dies wird später aus der GOV-Datenbank auf Basis der eindeutigen ID ergänzt. Ist der Wohnplatz noch nicht im GOV angelegt, werden in der Erfassungsmaske auch Gebäudeanzahl und Einwohner eingetragen und der Wohnplatz muss auf der ebenfalls im DES eingeblendeten Karte gesucht und lokalisiert werden. Dabei werden die Koordinaten automatisch in die Erfassungsmaske eingefügt. Schließlich muss noch das fehlende Wohnplatz-Objekt im GOV angelgt werden, um die ID in der Erfassungsmaske zu haben. Auf diese Art und Weise wird schließlich für jede Provinz bzw. jeden Band ein eigener Wohnplatz-Datensatz erstellt, der bei Fertigstellung ebenfalls ins GOV eingespielt und dort die Koordinaten und die Gebäude- und Einwohnerzahl bei den Wohnplätzen ergänzen sollen. Der Datensatz selbst wird entweder gesondert publiziert oder in den Datensatz der Verwaltungsebene integriert werden.
Projektfortschritt
<tab class="wikitable" head="top" style="text-align:right"> | Band || Provinz|| Jahr || colspan="2" | Verwaltungsebene (Gemeindeeinheiten) || Zeitraum Erfassung || colspan="2" | Wohnplatzebene|| Zeitraum Erfassung || Bemerkungen
colspan="3" | || Bearbeitungsstand || Anzahl Objekte || || Bearbeitungsstand || Anzahl Objekte ||
| 1 || Ostpreußen || 1888 ||
|| 8.020 || ab April 2025 || || 11.766 ||
| 2 || Westpreußen || 1887 || || 3.545 || geplant 2025 || || 6.753 ||
| 3 || Stadtkreis Berlin und Provinz Brandenburg || 1888 || || 5.328 || || || 10.749 ||
| 4 || Pommern || 1888 ||
|| 4.709 || Juli-Dezember 2024 ||
|| 9.126 || ab Mai 2025
| 5 || Posen || 1888 ||
|| 6.505 || Oktober 2024 - März 2025 || || 9.465 ||
| 6 || Schlesien || 1887 || || 9.457 || || || 17.583 || || zuvor bereits teilweise im DES erfasst
| 7 || Sachsen || 1888 || || 7.367 || || || 7.817 ||
| 8 || Schleswig-Holstein || 1888 || || 2.138 || || || 8.221 ||
| 9 || Hannover || 1887 || || 4.461 || || || 9.945 ||
| 10 || Westfalen || 1887 || || 1.618 || || || 9.179 ||
| 11 || Hessen-Nassau || 1887 || || 2.609 || || || 5.918 ||
| 12 || Rheinland || 1888 || || 3.289 || || || 19.801 ||
| 13 || Hohenzollernsche Lande || 1887 || || 127 || || || 279 ||
</tab>
Diese einzelnen Bände sind auch größtenteils im GOV als Quelle angelegt. Siehe GOV/Gemeindelexikon Preußen
Herausforderungen
Während der gewöhnlichen Erfassungsarbeit kommt es von Zeit zu Zeit zu verschiedenen Herausforderungen. Deren Lösung verzögert den Projektverlauf, behebt aber gleichzeitig auch einige Probleme im GOV als positiver Seiteneffekt des Projekts. So waren vor allem die Provinzen Pommern und Posen von massiven Umwidmungen (mehrere tausende) der Landgemeinde-Objekte betroffen (die sogenannten "Stewner-Objekte"). Die schon angelegten Landgemeinden wurden in Dörfer umgewandelt und unterstanden als solche direkt den Landkreisen. Durch ein teilautomatisiertes Tool konnte dies für beide Provinzen bereinigt werden, indem die Dörfer mitsamt Koordinaten als solche belassen wurden, jedoch ein entsprechendes Gemeindeobjekte erstellt und dem Landkreis untergeordnet wurde. Das Dorf wurde dann entsprechend der Gemeinde untergeordnet.
In der Provinz Ostpreußen lagen in zahlreichen Landkreisen Objekte vor, die in sich mehrere unterschiedliche Typen unterschiedlicher Typgruppen vereinten (z.B.: Gemeinde, Gut; oder: Gutsbezirk, Dorf usw...). Im Rahmen des Projektes wird dieses Problem Stand September 2025 behoben und eine "Normalisierung" der Objekte durchgeführt. Siehe GOV-Daten Ostpreußen
Ausblick
Das Projekt ist zunächst bis Anfang 2028 angelegt. In diesem Zeitraum soll auf jeden Fall die Verwaltungsebene aller 13 Provinzen erfasst werden. Der Workflow dafür ist bereits etabliert. Je nach Möglichkeit sollen parallel auch die Wohnplätze erfasst werden. Der Workflow dafür befindet sich Stand September 2025 in der Ausarbeitung.
Im Laufe des Projektes werden je nach technischem Fortschritt KI-Texterkennungstool ausprobiert und ihr Nutzen für die Erfassung getestet werden, um die Erfassung zu beschleunigen und damit Freiräume für größere Mengen zu ermöglichen. Neben den Wohnplätzen wäre eine Ausweitung des Projektes auf die Gemeindelexika der anderen Staaten des Deutschen Reiches Stand 1885 denkbar. Diese müssen aber noch systematisch recherchiert werden.
Im Anschluss wäre entweder eine zeitliche Ausdehnung auf die Gemeindelexika davor oder danach denkbar. Oder eine räumliche Ausdehnung zum Vergleich. Neben den Lexika der restlichen Staaten des Deutschen Reiches wären das etwa vergleichbare Lexika in Österreich-Ungarn oder dem Russländischen Reich.
Projektbetreuung
Projektbetreuer
Julian Freytag, M.A.
Kontakt
julian.freytag@geschichte.uni-halle.de