Deutsches Automobil-Adreßbuch/Adressbuch 1909/Editionsrichtlinien
In den erfassten Daten können Sie hier suchen.
Hier kann jeder mitmachen: Die Autokennzeichenlisten DatenEingabeSystems (DES)
|
Allgemeines
Da die Kennzeichenlisten in Maschinenschrift erstellt wurden, haben wir alle Seiten mit OCR vorerfasst. Dieses Verfahren haben wir erstmals bei der Erfassung der Österreich-Ungarischen Verlustlisten vorgenommen. Die dort gewonnenen Erfahrungen sollen uns auch hier zum Einsatz kommen.
Ein Problem bei der OCR-Vorerfassung sind hier die Inhalte der Spalten, die leider nicht sauber definiert sind.
Die OCR-Technik benötigt ein Trennzeichen, um eine neue Spalte mit Inhalten zu erkennen. Dies ist in den Listen leider nicht immer an den benötigten Stellen vorhanden.
Folgendes Bild soll dies veranschaulichen:
Durch einige Vorarbeit konnten wir viele OCR-Fehler bereits bereinigen. Auf OCR-Buchstabensalat an manchen Einträgen ist jedoch noch achten und dies zu korrigieren!
Online-Erfassung
Ab März 2019 können die Autokennzeichenlisten mit dem Online-Erfassungssystem DES des Vereins für Computergenealogie erfasst werden. Die erfassten Datensätze stehen sofort für eine Suchabfrage bereit.
Möchte man zum ersten Mal im DES erfassen, sollte man sich zunächst die Bedienungsanleitung des Systems anschauen und anschließend die Editionsrichtlinien für dieses Projekt lesen.
Nun kann es losgehen! Im Kopf dieser Seite befindet sich eine "Bearbeitungsbox". Dort finden Sie einen Link, der Sie direkt zur Erfassung des Blattes führt und außerdem einen Link zur Statistik der Erfassung. Diese informiert darüber, wie viele der zu erfassenden Seiten schon fertig / in Bearbeitung / unbearbeitet sind, wie viele Erfasser am Buch beteiligt sind, wie viele Datensätze schon erfasst wurden ...
- Projektbetreuer
- Horst Reinhardt; Ingrid Reinhardt; Julia Rörsch
- Für Fragen zum Projekt und allgemeine Fragen haben wir eine Projektbegleitende Mailingliste eingerichtet.
- Kontakt
Abkürzungen
- Es wird immer vollständig und so buchstabengetreu wie möglich erfasst.
- Abkürzungen werden nicht aufgelöst. Ein „Aug.“ bleibt ein „Aug.“ und kein „August“, ein „Tischlermstr.“ wird kein „Tischlermeister“ und ein „u.“ bleibt ein „u.“
- Strassennamen werden nicht vereinheitlicht, die Abkürzung "...Str." wird nicht zu "...Straße" ergänzt.
Titel
- Titel wie z.B. Dr.med. werden hinter den Familiennamen getrennt durch Komma gesetzt: Meier, Dr.med.
Leider stehen die Titel in den gedruckten Listen immer im Feld des Vornamens, weil hier unsere OCR-Vorerfassung das Komma als Feldtrenner erkennt. Mit diesen Korrekturen müssen wir leben und dies manuell immer ändern. Aber die Vorteile der OCR möchten wir trotzdem nutzen.
Orte und Straßen
- Wir haben in den Listen auch hier Probleme der Zuordnung. Bei größeren Orten (Kreisstädte und Städte) stehen die Ortsbezeichnungen als Überschrift oft für mehrere Seiten geltend. Hier ist dann nur die Straße angegeben. Die OCR-Erfassung erkennt das in der Regel richtig und setzt die Straße in das dafür vorgesehen Adressfeld. Bei kleineren Städten stehen leider Einträge dazwischen, die auf Stadtteile oder zugehörige Gemeinden verweisen. Diese Gemeinden stehen dann im Adressfeld und müssen auch manuell in das Ortsfeld verschoben werden.
- Die fehlenden Orte wollen wir mit einer Flächenerfassung nachtragen, sie brauchen also hier nicht berücksichtigt werden.
Firma
- Eindeutig als Firma zu erkennende Einträge müssen ebenfalls manuell in das Feld Firma übernommen werden. Ist auch der Firmeninhaber oder der Geschäftsführer mit Namen genannt, so bleibt der Name im Feld Name bestehen und nur die Firmenbezeichnung wird ins Firmenfeld verschoben.
- Die Bezeichnung 'prakt. Arzt' oder auch 'Kaufmann' gibt keinen direkten Hinweis auf eine Firma und bleibt im Berufsfeld stehen.