SlownikGeo: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
(Update)
 
(143 dazwischenliegende Versionen von 11 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
[[en:SlownikGeo]]
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de" dir="ltr">
 
<head>
=Projektbeschreibung=
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
Das Projekt wurde im Jahr 2015 beendet. Die extrahierten Seiten liegen aufbereitet mit teilweise Aufösung der Abkürzungen als Text vor und sind bei Comgen archiviert.
<meta name="keywords" content="Projekt KB-Verkartung,Digitale Quellenkopie,GOV,Genealogieprogramm,Hauptseite,KB-Datenerfassungen,Kirchenbuch,Projekt KB-Verkartung/Arbeitsgruppen,Projekt KB-Verkartung/Archive,Projekt OFB,Quelle" />
 
<link rel="shortcut icon" href="/favicon.ico" />
Hier finden Sie die [[SlownikGeo_-_Polnische_Beschreibung_-|Beschreibung des Projektes in Polnisch.]]
<title>Projekt KB-Verkartung - GenWiki</title>
 
<style type="text/css" media="screen,projection">/*<![CDATA[*/ @import "/w/skins/monobook/main.css?7"; /*]]>*/</style>
==Einleitung==
<link rel="stylesheet" type="text/css" media="print" href="/w/skins/common/commonPrint.css" />
Texterschließung und Übersetzung der 16 Bände (14 785 Seiten) der Buchreihe: '''[[Słownik Geograficzny Królestwa Polskiego]] ''' ''(i innych krajów slowianskich)'' (1880 - 1902)  ''(deutsch: Geographisches Lexikon des Königreiches Polen (und anderer slawischer Länder))'' - aus dem Polnischen ins Deutsche und Aufbereitung der darin enthaltenen Daten für das Genealogische Ortsverzeichnis [[GOV]], [[GenWiki]] und Hic Leones.
<!--[if lt IE 5.5000]><style type="text/css">@import "/w/skins/monobook/IE50Fixes.css";</style><![endif]-->
 
<!--[if IE 5.5000]><style type="text/css">@import "/w/skins/monobook/IE55Fixes.css";</style><![endif]-->
Um sich einen Begriff zu machen, welche Arbeit der Herausgeber Filip Sulimierski und seine fast 700 Mitarbeiter in den Jahren 1880 - 1902 geleistet haben, vergegenwärtige man sich, dass der gesamte Text des Słownik Geograficzny (hintereinandergereiht als ein einziger Textfaden) eine Länge von etwa 130000 km hat (d.h. mehr als 3-mal um den Äquator ...).
<!--[if IE 6]><style type="text/css">@import "/w/skins/monobook/IE60Fixes.css";</style><![endif]-->
 
<!--[if IE 7]><style type="text/css">@import "/w/skins/monobook/IE70Fixes.css?1";</style><![endif]-->
==Vorgeschichte==
<!--[if lt IE 7]><script type="text/javascript" src="/w/skins/common/IEFixes.js"></script>
2003 veröffentlichte die [http://www.pgsa.org PGSA] die 16 Bände des Słownik Geograficzny Królestwa Polskiego auf [http://www.pgsa.org/Towns/SlownikReview.htm CD-ROM] (DJVU-Format). Dieses Projekt wurde durchgeführt von Rafał T. Prinke (Chefredakteur), Poznan, Poland, (Digitalisierung: Michał and Stanisław Prinke) und  mit weiterem Material von William F. Hoffman und finanziert durch die PGSA (Projekt-Manager: Kenneth Czerwinski; Projekt-Kommittee: Marcia Bergman, Jim Czuchra, Virginia Hill, Rosalie Lindberg, Annmarie Utroska und Stanley Schmidt). Einige Einträge wurden durch Mitglieder der PGSA ins Englische übersetzt [http://www.pgsa.org/Towns/SlownikReview.php].
<meta http-equiv="imagetoolbar" content="no" /><![endif]-->
 
===Idee===
<script language="JavaScript">
Die Bände des Słownik Geograficzny auf der CD-ROM der PGSA enthalten Beschreibungen aller Regionen, Städte, Dörfer und anderer Orte, Berge, Flüsse und Seen des Königreichs [[Polen]] (Kongresspolen) und im slawischen Sprachraum: die baltischen, westlichen und südlichen Gubernien (Gouvernements) des Russischen Reichs, [[Westpreußen]] und [[Ostpreußen]], das Großherzogtum [[Posen]] und [[Schlesien|Preußisch Schlesien]], [[Galizien]], [[Wolhynien]], [[Podolien]], [[Polesien]], [[Österreich-Schlesien|Österreichisch Schlesien]], [[Mähren]], die slovakischen Teile von [[Ungarn]] und der [[Bukowina]], und zusätzlich auch weitere wichtige Orte in den übrigen [[Gubernie|Gubernien]] im europäischen Russland (als da sind Landsitze, Kirchspiele, Eisenbahnstationen etc.) (geschätzt: etwa 315 000 - 350 000 Einträge), aber
 
* es handelt sich um BILD-Dateien, die man nicht auf jeden Begriff hin absuchen kann und
* es ist polnischer Text, der nicht jedem (deutschen) Forscher direkt zugänglich ist.
 
Es ist also wünschenswert, diesen Schatz an Informationen für Kultur- und Familienforscher als
 
* TEXT-Datei (mit globalen Suchfunktionen absuchbar) und
* in deutscher Sprache zugänglich zu machen.
 
===Vorarbeiten===
Der Vorversuch, die BILD-Dateien der Słownik-Geograficzny-CD-ROM durch OCR (Texterkennung mit FineReader, Ver. 6.0) zu digitalisieren, ergab sehr gute Resultate (> 95 % korrekte TEXT-Dateien), einschließlich der spezifischen polnischen  Schriftzeichen.
 
===Rechtliches===
H.V.J.Kolbe (Hic Leones) kontaktierte die PGSA  schriftlich mit Beispielen dieser OCR-Resultate und mit folgendem Vorschlag:
 
*Die PGSA stellt Hic Leones die Bilddateien des Słownik Geograficzny offiziell und unentgeltlich zur Verfügung, um die gesamten 14 785 Seiten von BILD-Dateien in TEXT-Dateien zu überführen.
 
*Als Gegenleistung erhält die PGSA diese TEXT-Dateien von Hic Leones für eigene Zwecke (z.B. Übersetzung ins Englische, weitere CDs (nun Text + Bild) etc.) ohne weitere Auflagen.
 
Die PGSA stand diesem Angebot positiv gegenüber und im Sept. 2005 erhielt H.V.J.Kolbe eine positive schriftliche Zusage des PGSA-Vorstandes (Board of Directors). Damit war die legale Seite der Datenverwendung geklärt und zusätzlich ein neuer, interessanter Kontakt (PGSA ) zur Familienforschung in Polen geschaffen.
 
Dieses Ergebnis wurde von Hic Leones 2005 auf dem [http://www.genealogienetz.de/genealogentag/2005/ 57. Genealogentag in Hannover] bekannt gegeben.
 
Ende Sept. 2005 war die TEXT-Digitalisierung aller 14 785 Seiten des Słownik Geograficzny abgeschlossen und Ende Okt. 2005 wurde der gesamte polnischen Text auf CD an Cynthia Piech geschickt.
 
==Das Projekt==
 
===Modus===
Wissenschaftliche Zusammenarbeit.
 
===Projekt Partner und deren Beteiligung===
====PGSA (Polish Genealogical Society of America)====
http://www.pgsa.org
 
*Scannen der 14 785 Seiten des Słownik Geograficzny und Speicherung im Bildformat
*Edition des Słownik Geograficzny Królestwa Polskiego auf CD-ROM
 
====Hic Leones====
*Konzept und Koordination des Projektes
*Texterkennung (OCR) der 14 785 Seiten des Słownik Geograficzny und Speicherung im Textformat
*Zusammenstellung eines 1000-seitigen PL => D Lexikons von 1879 im PDF-Format (frei für Mitarbeiter)
*letzte Aktivität Dezember 2013
 
<!--
<!--
====CompGen====
[[CompGen|(Verein für Computergenealogie e. V.)]]
*Bereitstellung des Arbeitsdatei-Import/Export-Moduls
*Co-Koordination des Projektes
====FGG (Forschungsgruppe Grafschaft Glatz)====
http://www.familienforschung-grafschaft-glatz.de/html/projects/projects.html
*Zugang zu einem Übersetzungsprogramm PL => D zur Vor/Roh-Übersetzung des Textes
===Voraussetzungen===
Um das enorme Textvolumen (formatiert etwa 250 MB Text, unformatiert etwa 70 - 80 MB) effizient und zügig ins Deutsche zu übersetzen, müssen die Daten in eine Datenbank (d.h. temporäre Arbeitsdatenbank) überführt werden.
Seitenweise Auszüge dieser Arbeitsdatenbank können dann im reinen Textformat (zusammen mit einem speziellen Font (für die Fremdcharaktere) und einer knappen Arbeitsanleitung) an interessierte, sprachkundige Forscher verschickt werden (s.u. - ''Beispiel der Zusammenarbeit mit einem Übersetzer'' -), die Seiten ihres eigenen Interesses (!) dann in Ruhe (offline) bearbeiten und übersetzen können <ref>Zur Hilfe der Übersetzung wurde ein sehr reiches, 998-seitiges polnisch-deutsches Lexikon (1879) Bild-digitalisiert und ausgiebig mit Lesezeichen versehen (als PDF-Datei auf der CompGen-CD 2006/2007), das jedem interessierten Mitarbeiter unentgeltlich zur Verfügung gestellt wird.
Zusätzlich wurde von der FGG (Forschungsgruppe Grafschaft Glatz) ein PL <=> D  Übersetzungsprogramm zur Verfügung gestellt, um in der Lage zu sein, schnell Vor/Roh-Übersetzungen zu erstellen. (Die Limitationen von Übersetzungsprogrammen sind bekannt, aber beim Słownik Geograficzny handelt es sich um Auflistung von statistischen Daten und nicht um eine philosophische Doktorarbeit oder um Poesie ...)
</ref>.
Eine Abschätzung hat ergeben, dass bereits nach 1-monatiger Vorarbeit, in denen in der Arbeitsdatenbank durch Suche/Ersetze die polnischen Abkürzungen durch deutsche ersetzt und auch andere Standardbegriffe (zusammen etwa  300 - 400 Termini, z. B. Bahnhof, Poststation, Kirche, Einwohner etc.) 'eingedeutscht' werden, etwa 40 % des Textes allgemein verständlich werden, auch für jemanden der nicht des Polnischen mächtig ist.
===Zeitplan===
Das Projekt umfasst folgende Schritte [ <font color="green">grün = erledigt oder in Bearbeitung</font>, <font color="red">rot = in Planung</font> ]
*<font color="green">Scan der 14 785 Seiten des Słownik Geograficzny und Edition der CD-ROM (erledigt durch die PGSA im Jahre 2003)</font>
*<font color="green">OCR der 14 785 Bilddateien des Słownik Geograficzny und Speicherung der Textdateien im CP 1250 Format (erledigt durch Hic Leones im Sept. 2005)</font>
*<font color="green">Erstellung der PDF-Datei eines PL => D Lexikon von 1879 mit Lesezeichen zur schnellen Wortfindung als Übersetzungshilfe (erledigt durch Hic Leones im Dez. 2006; auf der CompGen-CD 2006/2007 zu finden).</font>
*<font color="green">Programmierung der Import/Export Module zur Erweiterung der Arbeitsdatenbank (bis Mitte Feb. 2007).</font>
*<font color="green">Import der 14 785 Textdateien des Słownik Geograficzny in die Arbeitsdatenbank unter Berücksichtigung der polnischen Fremdcharaktere (Mitte Feb. 2007).</font>
*<font color="green">Erstellung einer kontinuierlich zu erweiternden Wort-für-Wort Übersetzungsliste (seit Anfang Jan. 2007).</font>
*<font color="green">Zusammenfassung des Projektes in einem Übersichtsartikel für die Zeitschrift 'Computergenealogie' (Anfang Feb. 2007, Publikation Ende März 2007.</font>
*<font color="green">Intern: Entfernung von systematischen OCR-Fehlern, unnötigen Bindestrichen und Leerzeichen; Einfügen von Leerzeilen hinter jeden einzelnen geographischen Eintrag. (kontinuierlich ab Mitte Feb. 2007).</font>
*<font color="green">Intern: Dokumentiertes Suche/Ersetze der polnischen Abkürzungen durch deutsche Abkürzungen (kontinuierlich ab Mitte/Ende Feb. 2007).</font>
*<font color="green">Intern: Dokumentiertes Suche/Ersetze von weiteren (ca. 300) Standardbegriffen (kontinuierlich ab Mitte/Ende Feb. 2007).</font>
*<font color="green">Intern: Erstellung von Listen geographischer Begriffe, die nach bestimmten Verwaltungsbezeichnungen (-Gub.- und -Pow.-) folgen. Dies geschieht durch Parser-Analyse. Diese Begriffe werden dann nach Varianten eines bestimmten Hauptbegriffes sortiert und in Folge in der Datenbank homogen durch diesen Hauptbegriff ersetzt (kontinuierlich seit Mitte Mai 2007).</font>
*<font color="green">Intern: Dokumentiertes Suche/Ersetze von weiteren (ca. 800) Standardbegriffen (d.h. Grundwortschatz) der polnischen Sprache (kontinuierlich ab Mitte Jun. 2007).</font>
*<font color="green">Intern: Alle geographische Begriffe, die auf die Bezeichnung 'Kom.' folgen (d.h. Komitat, d.h. Verwaltungseinheit in Ungarn; Vorkommen auf etwa 1100 Seiten), sind von den polnischen auf die ungarischen Begriffe standardisiert worden (Juni/July 2007).</font>
*<font color="green">[http://wiki-commons.genealogy.net/w/images/a/ad/SlownikGeo-Genealogentag2007.pdf Vorstellung und Vortrag des Projektes] auf dem [http://www.genealogentag.de Genealogentag 2007] in Ludwigshafen (Thema: "Ortsbezüge in der Genealogie") (15. Sept. 2007, 18:15h).</font>
*<font color="green">Intern: Die Formatierung (Leerzeile zwischen einzelnen Einträgen) wurde abgeschlossen nach zweimaligem Parsen über den gesamten Text und manueller Korrektur der angezeigten potentiellen Fehlstellen (Sept. 2007).</font>
*<font color="green">Für das SlownikGeo Projekt werden viele Freiwillige benötigt. Nach Absprache mit den Listen-Moderatoren: Ansage des Projektes in den genealogischen Mailinglisten (2008) und Aufruf zur externen Mitarbeit. Wiederholung dieser Ansage (mit kurzem Fortschrittsbericht): etwa alle 2 Monate.
**Änderung: Mittlerweile hat sich ein anderer Arbeitsmodus etabliert: Ein Hauptübersetzer zusammen mit mehreren anderen Personen, die Polnisch als Muttersprache haben, damit die übersetzung in standardisierter Form erfolgt. Mitarbeit von Freiwilligen wird also erst nötig (Kontakt: Peter Lingnau), wenn komplett übersetzte Datensätze ins GenWiki oder ins GOV eingearbeitet werden müssen.</font>
*<font color="red">Erstellung eines Glossars, welche polnischen Begriffe beibehalten werden und separat erklärt werden sollten (in Zusammenarbeit mit Prof. Eichler, Leipzig) (ab Mitte/Ende Feb. 2007).</font>
*<font color="green">Entsprechende Aufrufe in Vereinszeitschriften (kontinuierlich ab Ende Juli 2007).
**Änderung: Kann entfallen.</font>
*<font color="red">Einarbeitung von übersetzten und korrigierten Seiten in GOV und Hic Leones: Sobald eine Seite erschlossen ist, wird sie entsprechend markiert (und gegen weitere Veränderungen geschützt) und an Mitarbeiter überführt, die die dort beschriebenen Orte in GOV eintragen (kontinuierlich ab Januar 2011).</font>
*<font color="green">Aus der bisherigen Arbeit hat sich folgendes ergeben:
**Korrektur in der Datenbank durch Suchen/Ersetzen hat sich als aufwändiger gestaltet als vorhergesehen wurde (Ein Grund ist, dass einige Ortsnamen nur ein einziges Mal im Gesamttext vorkommen, aber trotzdem im Original verglichen und verifiziert werden müssen). Pro Jahr können dadurch nur etwa das Äquivalent eines Bandes (etwa 960 Seiten) übersetzt werden, d.h. Ende 2010 werden etwa 3 Bände übersetzt sein. Geplanter Abschluss des Projektes (vorsichtige Schätzung): A.D. 2023.</font>
Die polnischen Autoren dieses Werkes benötigten 22 Jahre zur Recherche, Erfassung, Korrektur und Edition dieser enzyklopädischen Serie. Mit den Mitteln der derzeitigen Technik sollte deshalb die Übersetzung und Einarbeitung in einem Viertel dieser Zeit, d.h. 5 - 6 Jahre, zu bewältigen sein ...
===Status Quo===
Hier wird in unregelmässigen Abständen die Veränderung des Textes in der Arbeitsdatenbank demonstriert.
Von den 14785 Seiten wurde 1 Seite (Seite 406, Band 6) willkürlich ausgewählt.


function SymError()
(a) die Originalseite aus dem Buch
{
  return true;
}


window.onerror = SymError;
(b) die Seite als OCR-Rohtext, d.h. direkt nach dem Import der Seite in die Arbeitsdatenbank und


//-->
(c) die Seite nach globaler Formatierung, Entfernen unnötiger Leerstellen und Bearbeitung von OCR-Fehlern.
</script>


<script type="text/javascript">var skin = 'monobook';var stylepath = '/w/skins';</script>
[OCR = Optical Character Recognition = maschinelle Texterkennung]
<script type="text/javascript" src="/w/skins/common/wikibits.js"><!-- wikibits js --></script>
<script type="text/javascript" src="/w/index.php?title=-&amp;action=raw&amp;smaxage=0&amp;gen=js"><!-- site js --></script>
<style type="text/css">/*<![CDATA[*/
@import "/w/index.php?title=MediaWiki:Common.css&action=raw&ctype=text/css&smaxage=18000";
@import "/w/index.php?title=MediaWiki:Monobook.css&action=raw&ctype=text/css&smaxage=18000";
@import "/w/index.php?title=-&action=raw&gen=css&maxage=18000";
/*]]>*/</style>
<!-- Head Scripts -->
</head>
<body  class="ns-0 ltr">


<!-- ========================================================== -->
==Beispiel der Zusammenarbeit mit einem Übersetzer==
<!-- ========================================================== -->


<div id="globalWrapper">
*Wer kann mitmachen ?
<div id="column-content">
**Für die Übersetzung suchen wir engagierte Mitarbeiter, die das Polnische lesen, schreiben und ins Deutsche übersetzen können. Wenn uns eine Vorliebe für eine bestimmte Region (z.B. ein Gouvernement) oder eine Großstadt mitgeteilt wird, wird dieses (soweit möglich) in der Auswahl der Seiten berücksichtigt.
<div id="content">
**Für die Einarbeitung ins GOV sind Kenntnisse in polnischer Sprache nicht nötig: Hier kann jeder mitmachen, der daran interessiert ist!
<a name="top" id="top"></a>
<h1 class="firstHeading">Projekt KB-Verkartung</h1>
<div id="bodyContent">
<h3 id="siteSub">aus GenWiki, dem genealogischen Lexikon zum Mitmachen.</h3>
<div id="contentSub"></div>
<div id="jump-to-nav">Wechseln zu: <a href="#column-one">Navigation</a>, <a href="#searchInput">Suche</a></div> <!-- start content -->
<table id="toc" class="toc" summary="Inhaltsverzeichnis"><tr><td><div id="toctitle"><h2>Inhaltsverzeichnis</h2></div>
<ul>
<li class='toclevel-1'><a href="#Projekt_Kirchenbuchverkartung"><span class="tocnumber">1</span> <span class="toctext">Projekt Kirchenbuchverkartung</span></a>
<ul>
<li class='toclevel-2'><a href="#Einleitung"><span class="tocnumber">1.1</span> <span class="toctext">Einleitung</span></a></li>
<li class='toclevel-2'><a href="#Definitionen"><span class="tocnumber">1.2</span> <span class="toctext">Definitionen</span></a>
<ul>
<li class='toclevel-3'><a href="#Digitalisierung"><span class="tocnumber">1.2.1</span> <span class="toctext">Digitalisierung</span></a></li>
<li class='toclevel-3'><a href="#Abschrift"><span class="tocnumber">1.2.2</span> <span class="toctext">Abschrift</span></a>
<ul>
<li class='toclevel-4'><a href="#Strukturierte_Abschrift"><span class="tocnumber">1.2.2.1</span> <span class="toctext">Strukturierte Abschrift</span></a></li>
</ul>
</li>
<li class='toclevel-3'><a href="#Verkartung"><span class="tocnumber">1.2.3</span> <span class="toctext">Verkartung</span></a></li>
<li class='toclevel-3'><a href="#Familienbuch"><span class="tocnumber">1.2.4</span> <span class="toctext">Familienbuch</span></a></li>
<li class='toclevel-3'><a href="#Ortsfamilienbuch"><span class="tocnumber">1.2.5</span> <span class="toctext">Ortsfamilienbuch</span></a></li>
</ul>
</li>
<li class='toclevel-2'><a href="#Archive.2C_Arbeitsgruppen.2C_Bearbeiter"><span class="tocnumber">1.3</span> <span class="toctext">Archive, Arbeitsgruppen, Bearbeiter</span></a></li>
<li class='toclevel-2'><a href="#Methoden.2C_Programme.2C_Hilfsmittel"><span class="tocnumber">1.4</span> <span class="toctext">Methoden, Programme, Hilfsmittel</span></a>
<ul>
<li class='toclevel-3'><a href="#Verkartungsprogramme"><span class="tocnumber">1.4.1</span> <span class="toctext">Verkartungsprogramme</span></a></li>
<li class='toclevel-3'><a href="#Methoden"><span class="tocnumber">1.4.2</span> <span class="toctext">Methoden</span></a></li>
</ul>
</li>
<li class='toclevel-2'><a href="#Weblinks"><span class="tocnumber">1.5</span> <span class="toctext">Weblinks</span></a></li>
</ul>
</li>
</ul>
</td></tr></table><script type="text/javascript"> if (window.showTocToggle) { var tocShowText = "Anzeigen"; var tocHideText = "Verbergen"; showTocToggle(); } </script>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=1" title="Abschnitt bearbeiten: Projekt Kirchenbuchverkartung">bearbeiten</a>]</div><a name="Projekt_Kirchenbuchverkartung"></a><h1>Projekt Kirchenbuchverkartung</h1>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=2" title="Abschnitt bearbeiten: Einleitung">bearbeiten</a>]</div><a name="Einleitung"></a><h2> Einleitung </h2>
<p>Im Projekt Kirchenbuch-Datenerfassungen des Vereins für Computergenealogie sollen in einem ersten Schritt alle schon abgeschlossenen Kirchenbucherfassungen systemematisch aufgenommen und im <a href="/wiki/Hauptseite" title="Hauptseite">GenWiki</a> eingetragen werden. Die Eintragungen sollen u.a. verwendet werden, um sie in das neue <a href="/wiki/GOV" title="GOV">GOV</a> einzupflegen, wo sie dann direkt abgefragt werden können.
</p><p><br />
<b>Das Projekt hat einen eigenen Bereich im <a href="/wiki/Hauptseite" title="Hauptseite">GenWiki</a>, in dem die Daten eingetragen werden: <a href="/wiki/KB-Datenerfassungen" title="KB-Datenerfassungen">KB-Datenerfassungen</a></b>
</p><p>Für die Kommunikation der Projektmitarbeiter untereinander gibt es eine eigene <a href="http://list.genealogy.net/mailman/listinfo/kb-verkartung" class='external text' title="http://list.genealogy.net/mailman/listinfo/kb-verkartung" rel="nofollow">Mailingliste</a>
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=3" title="Abschnitt bearbeiten: Definitionen">bearbeiten</a>]</div><a name="Definitionen"></a><h2> Definitionen </h2>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=4" title="Abschnitt bearbeiten: Digitalisierung">bearbeiten</a>]</div><a name="Digitalisierung"></a><h3>Digitalisierung</h3>
<p>Speichern der Seiten einer Quelle (Kirchenbuch, Standesamtregister usw.) mittels Buchscanner oder Digitalkamera als computerlesbare Grafikdatei. Hier stehen Sicherung und Schonung der Originalurkunde sowie einfach zu bewerkstelligender Zugang zum Original-Quelltext im Vordergrund. Eine andere Form (nicht-digital) der Quellenschonung sind auch die Fotokopie oder die Mikroverfilmung)
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=5" title="Abschnitt bearbeiten: Abschrift">bearbeiten</a>]</div><a name="Abschrift"></a><h3> Abschrift </h3>
<p>Eine genealogische <a href="/wiki/Quelle" title="Quelle">Quelle</a> (z.B. <a href="/wiki/Kirchenbuch" title="Kirchenbuch">Kirchenbuch</a>, <a href="/wiki/Standesamtsregister" title="Standesamtsregister">Standesamtsregister</a> etc.) wird wort- und buchstabengetreu abgeschrieben.<br />
Das ermöglicht den Zugang zum Inhalt des Originals unabhängig von der Kenntnis alter Schriften und gibt dabei die genealogischen Informationen in der Ursprungsschreibweise im Ursprungszusammenhang wieder, ohne die Quelle zu interpretieren.
</p><p>Eine Datei kann nach Buchstabenfolgen (strings) durchsucht werden. Der systematische Erschließungsgrad einer Abschrift ist geringer als der einer <a href="/wiki/Verkartung" title="Verkartung">Verkartung</a>.
</p><p>Namen können maschinell nur gefunden werden, wenn man die genaue Schreibweise des Anfangs oder des ganzen Namens kennt.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=6" title="Abschnitt bearbeiten: Strukturierte Abschrift">bearbeiten</a>]</div><a name="Strukturierte_Abschrift"></a><h4>Strukturierte Abschrift</h4>
<p>Hierbei werden die Angaben einer Quelle in einer festgelegten Reihenfolge mit definierten Trennzeichen in eine Textdatei abgeschrieben. Die Erfassung kann mit Texteditoren, Textprogrammen, Tabellenkalkulationsprogrammen, CSV-Editoren etc. erfolgen.
Das Ergebnis entspricht weitgehend einer Verkartung. Die Bearbeitung benötigt aber kein spezielles Verkartungs- oder Genealogieprogramm und die Struktur kann den Inhalten der Vorlage sehr leicht angepasst werden. Die weitere Verarbeitung ist mit Tabellenkalkulations-, Datenbank- oder Genealogieprogrammen möglich.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=7" title="Abschnitt bearbeiten: Verkartung">bearbeiten</a>]</div><a name="Verkartung"></a><h3> Verkartung </h3>
<p>Als <b>Verkartung</b> bezeichnet man die chronologische Erfassung der genealogisch relevanten Daten aus einer <a href="/wiki/Quelle" title="Quelle">Quelle</a> (<a href="/wiki/Kirchenbuch" title="Kirchenbuch">Kirchenbuch</a>, <a href="/w/index.php?title=Standesamtregister&amp;action=edit" class="new" title="Standesamtregister">Standesamtregister</a> usw.) auf Karteikarten, Zetteln oder mit Hilfe eines Computerprogrammes (<a href="/w/index.php?title=Datenbank&amp;action=edit" class="new" title="Datenbank">Datenbank</a>, Tabellenkalkulation usw.). Hier steht das "Ereignis" (Geburt/Taufe, Heirat, Tod) im Vordergrund, dem die einzelnen Personen zugeordnet werden. Die Daten sind auch zur Registererstellung zu den einzelnen Ereignisgruppen geeignet.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=8" title="Abschnitt bearbeiten: Familienbuch">bearbeiten</a>]</div><a name="Familienbuch"></a><h3> Familienbuch </h3>
<p>Basierend auf einer <a href="/wiki/Verkartung" title="Verkartung">Verkartung</a> erfolgt die Zusammenstellung der Ereignisdaten zu "Kleinfamilien" entweder auf <a href="/w/index.php?title=Familienblatt&amp;action=edit" class="new" title="Familienblatt">Familienblättern</a> oder mit Hilfe eine <a href="/wiki/Genealogieprogramm" title="Genealogieprogramm">Genealogieprogramms</a>. Jedem Elternpaar werden Heiratsdaten und die Kinder mit Geburts- und Sterbedaten aus der Quelle (Kirchenbuch, Standesamtsregister usw.) zugeordnet, soweit dies möglich ist. Bei mehreren Ehen der Ehepartner werden gesonderte Familienblätter angelegt. Der Abstand zur Vorlage (<a href="/wiki/Kirchenbuch" title="Kirchenbuch">Kirchenbuch</a>) ist sehr hoch, die Erschließung besonders tief.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=9" title="Abschnitt bearbeiten: Ortsfamilienbuch">bearbeiten</a>]</div><a name="Ortsfamilienbuch"></a><h3> Ortsfamilienbuch </h3>
<p>Verknüpfung der "Kleinfamilien" zu "Grossfamilien" durch Rückverweise auf den Familienblättern (z.B. auf die Eltern der Ehepartner oder auf die Eheschließung der Kinder) unter Heranziehung von weiteren Quellen (z.B. <a href="/wiki/Kirchenbuch" title="Kirchenbuch">Kirchenbücher</a> der umliegenden Orte, <a href="/w/index.php?title=Steuerlisten&amp;action=edit" class="new" title="Steuerlisten">Steuerlisten</a> usw.). Der Abstand zur Vorlage ist am höchsten, die Erschließung am tiefsten.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=10" title="Abschnitt bearbeiten: Archive, Arbeitsgruppen, Bearbeiter">bearbeiten</a>]</div><a name="Archive.2C_Arbeitsgruppen.2C_Bearbeiter"></a><h2> Archive, Arbeitsgruppen, Bearbeiter </h2>
<p>Auf den aufgeführten Unterseiten sollen regionale Besonderheiten der Kirchenbuchbearbeitung als Übersicht aufgeführt werden.
</p>
<ul><li> <a href="/wiki/Projekt_KB-Verkartung/Archive" title="Projekt KB-Verkartung/Archive">Archive</a>: Welche Arbeitsgruppen arbeiten im Bereich des Archivs? Welche Einzelbearbeiter?Welche Empfehlungen/Richtlinien/Vorschriften bestehten für die Bearbeitungsmethode, für Art und Ort der Veröffentlichung?
</li></ul>
<ul><li> <a href="/wiki/Projekt_KB-Verkartung/Arbeitsgruppen" title="Projekt KB-Verkartung/Arbeitsgruppen">Arbeitsgruppen</a>: Welche regionalen Arbeitsgruppen und Einzelbearbeiter zur Erfassung von Kirchenbuchdaten und Standesamtsregistern gibt es? Welcher Methoden und Veröffentlichungsarten bedienen diese sich?
</li></ul>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=11" title="Abschnitt bearbeiten: Methoden, Programme, Hilfsmittel">bearbeiten</a>]</div><a name="Methoden.2C_Programme.2C_Hilfsmittel"></a><h2> Methoden, Programme, Hilfsmittel </h2>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=12" title="Abschnitt bearbeiten: Verkartungsprogramme">bearbeiten</a>]</div><a name="Verkartungsprogramme"></a><h3>Verkartungsprogramme</h3>
<p>Programme speziell zur Verkartung von Kirchenbuch- oder Standesamtsregistern sind beispielsweise die Programme VK32 und  <a href="http://www.ahnenforschung-programm.de/Programme/VK/vk.html" class='external text' title="http://www.ahnenforschung-programm.de/Programme/VK/vk.html" rel="nofollow">VKWIN</a> von Dr. Coors.
</p><p>Eine Liste von Genealogieprogrammen, die auch zur Erstellung von Ortsfamilienbüchern geeignet sind, ist im <a href="/wiki/Projekt_OFB" title="Projekt OFB">Projekt OFB</a> verfügbar.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=13" title="Abschnitt bearbeiten: Methoden">bearbeiten</a>]</div><a name="Methoden"></a><h3>Methoden</h3>
<p>Neben speziellen Datenbankprogrammen für Verkartungen werden von vielen Verkartern Textbearbeitungs- oder Tabellenkalkulationsprogramme zur Erfassung der Daten genutzt.
</p><p>Eine solche Methode wird im Projekt <a href="/wiki/VK-Tabelle" title="VK-Tabelle">VK-Tabelle</a> vorgestellt.
</p>
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit&amp;section=14" title="Abschnitt bearbeiten: Weblinks">bearbeiten</a>]</div><a name="Weblinks"></a><h2>Weblinks</h2>
<p>Zu den Definitionen siehe auch:
</p><p><a href="http://de.wikipedia.org/wiki/Kirchenbuchverkartung" class='external free' title="http://de.wikipedia.org/wiki/Kirchenbuchverkartung" rel="nofollow">http://de.wikipedia.org/wiki/Kirchenbuchverkartung</a>
</p><p><a href="http://de.wikipedia.org/wiki/Ortsfamilienbuch" class='external free' title="http://de.wikipedia.org/wiki/Ortsfamilienbuch" rel="nofollow">http://de.wikipedia.org/wiki/Ortsfamilienbuch</a>
</p><p>Drei Verfahren zur Anwendung der <a href="/wiki/Digitale_Quellenkopie" title="Digitale Quellenkopie">digitalen Quellenkopie</a>
</p>
<!-- Saved in parser cache with key wiki_de:pcache:idhash:1019-0!1!0!0!!de!2 and timestamp 20070102125201 -->
<div class="printfooter">
Von "<a href="http://wiki.genealogy.net/wiki/Projekt_KB-Verkartung">http://wiki.genealogy.net/wiki/Projekt_KB-Verkartung</a>"</div>
<div id="catlinks"><p class='catlinks'><a href="/w/index.php?title=Spezial:Categories&amp;article=Projekt_KB-Verkartung" title="Spezial:Categories">Kategorie</a>: <span dir='ltr'><a href="/wiki/Kategorie:Verkartung" title="Kategorie:Verkartung">Verkartung</a></span></p></div> <!-- end content -->
<div class="visualClear"></div>
</div>
</div>
</div>
<div id="column-one">
<div id="p-cactions" class="portlet">
<h5>Views</h5>
<ul>
<li id="ca-nstab-main" class="selected"><a href="/wiki/Projekt_KB-Verkartung">Artikel</a></li>
<li id="ca-talk"><a href="/wiki/Diskussion:Projekt_KB-Verkartung">Diskussion</a></li>
<li id="ca-edit"><a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=edit">Bearbeiten</a></li>
<li id="ca-history"><a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=history">Versionen</a></li>
<li id="ca-move"><a href="/wiki/Spezial:Movepage/Projekt_KB-Verkartung">Verschieben</a></li>
<li id="ca-watch"><a href="/w/index.php?title=Projekt_KB-Verkartung&amp;action=watch">beobachten</a></li>
</ul>
</div>
<div class="portlet" id="p-personal">
<h5>Persönliche Werkzeuge</h5>
<div class="pBody">
<ul>
<li id="pt-userpage"><a href="/wiki/Benutzer:Kolbe" class="new">Kolbe</a></li>
<li id="pt-mytalk"><a href="/wiki/Benutzer_Diskussion:Kolbe" class="new">Eigene Diskussion</a></li>
<li id="pt-preferences"><a href="/wiki/Spezial:Preferences">Einstellungen</a></li>
<li id="pt-watchlist"><a href="/wiki/Spezial:Watchlist">Beobachtungsliste</a></li>
<li id="pt-mycontris"><a href="/wiki/Spezial:Contributions/Kolbe">Eigene Beiträge</a></li>
<li id="pt-logout"><a href="/w/index.php?title=Spezial:Userlogout&amp;returnto=Projekt_KB-Verkartung">Abmelden</a></li>
</ul>
</div>
</div>
<div class="portlet" id="p-logo">
<a style="background-image: url(/w/skins/common/images/genealogy.net.png);" href="/wiki/Hauptseite" title="Hauptseite"></a>
</div>
<script type="text/javascript"> if (window.isMSIE55) fixalpha(); </script>
<div class='portlet' id='p-Portale'>
<h5>Portale</h5>
<div class='pBody'>
<ul>
<li id="n-mainpage"><a href="/wiki/Hauptseite">Hauptseite</a></li>
<li id="n-Lexika"><a href="/wiki/Portal:Lexika">Lexika</a></li>
<li id="n-Regional"><a href="/wiki/Portal:Regionale_Forschung">Regional</a></li>
<li id="n-Basiswissen"><a href="/wiki/Portal:Basiswissen">Basiswissen</a></li>
<li id="n-Computer--Genealogie"><a href="/wiki/Portal:Computergenealogie">Computer- Genealogie</a></li>
<li id="n-Datenbanken"><a href="/wiki/Portal:Datenbanken">Datenbanken</a></li>
<li id="n-Vereine"><a href="/wiki/Portal:Vereine">Vereine</a></li>
<li id="n-Praktische-Hilfe"><a href="/wiki/Portal:Praktische_Hilfe">Praktische Hilfe</a></li>
<li id="n-Veranstaltungen"><a href="/wiki/Portal:Genealogische_Veranstaltungen">Veranstaltungen</a></li>
</ul>
</div>
</div>
<div class='portlet' id='p-GenWiki intern'>
<h5>GenWiki intern</h5>
<div class='pBody'>
<ul>
<li id="n-Über-GenWiki"><a href="/wiki/GenWiki:GenWiki">Über GenWiki</a></li>
<li id="n-Mitmach-Hilfe"><a href="/wiki/Portal:Mitmach-Hilfe">Mitmach-Hilfe</a></li>
<li id="n-Ausgesuchte-Artikel"><a href="/wiki/Portal:Ausgesuchte_Artikel">Ausgesuchte Artikel</a></li>
<li id="n-Hauptthemen"><a href="/wiki/Kategorie:Hauptthemen">Hauptthemen</a></li>
<li id="n-recentchanges"><a href="/wiki/Spezial:Recentchanges">Letzte Änderungen</a></li>
<li id="n-sitesupport"><a href="/wiki/GenWiki:Spenden">Spenden</a></li>
<li id="n-Chat-zum-GenWiki"><a href="/wiki/GenWiki:Chat">Chat zum GenWiki</a></li>
</ul>
</div>
</div>
<div id="p-search" class="portlet">
<h5><label for="searchInput">Suche</label></h5>
<div id="searchBody" class="pBody">
<form action="/wiki/Spezial:Search" id="searchform"><div>
<input id="searchInput" name="search" type="text" accesskey="f" value="" />
<input type='submit' name="go" class="searchButton" id="searchGoButton" value="Artikel" />&nbsp;
<input type='submit' name="fulltext" class="searchButton" value="Suche" />
</div></form>
</div>
</div>
<div class="portlet" id="p-tb">
<h5>Werkzeuge</h5>
<div class="pBody">
<ul>
<li id="t-whatlinkshere"><a href="/wiki/Spezial:Whatlinkshere/Projekt_KB-Verkartung">Was zeigt hierhin</a></li>
<li id="t-recentchangeslinked"><a href="/wiki/Spezial:Recentchangeslinked/Projekt_KB-Verkartung">Verlinkte Seiten</a></li>
<li id="t-upload"><a href="http://wiki-commons.genealogy.net/wiki/Special:Upload">Hochladen</a></li>
<li id="t-specialpages"><a href="/wiki/Spezial:Specialpages">Spezialseiten</a></li>
<li id="t-print"><a href="/w/index.php?title=Projekt_KB-Verkartung&amp;printable=yes">Druckversion</a></li> <li id="t-permalink"><a href="/w/index.php?title=Projekt_KB-Verkartung&amp;oldid=149794">Permanentlink</a></li> </ul>
</div>
</div>
</div><!-- end of the left (by default at least) column -->


  <div class="visualClear"></div>
*Ein polnisch versierter Mitarbeiter signalisiert seine Bereitschaft zur Mitarbeit (Kontaktadressen siehe unten). Er/Sie erhält (per eMail):
**die TEXT-Seiten seiner Wahl (z.B. 10) im Textformat (einschließlich des Spezialfonts)
**die entsprechenden original 10 BILD-Dateien des Slownik Geograficzny (TIF-Dateien) zur Kontrolle
**eine kurze Anleitung zur Bearbeitung
**eine einfache Excel-Datei, in der die bisherigen Wortersetzungen dokumentiert sind
**die PDF-Datei eines PL => D Lexikon von 1879 mit Lesezeichen zur schnellen Wortfindung (auf der CompGen-CD 2006/2007 zu finden oder im Download)


  <div id="footer" >
*Nun bearbeitet er/sie die einzelnen Seiten. Findet er/sie ein Wort (einen "Standardbegriff"), das von den Projekt-Coordinatoren in der Arbeitsdatenbank global ersetzt werden soll, trägt er/sie das Wort und sein deutsches Äquivalent in die Exceldatei ein <ref>Auf diese Weise trägt jeder Mitarbeiter dazu bei, dass die Erfahrungen, die er/sie mit wenigen Seiten gemacht hat, in kontrollierter Weise (durch die Projekt-Koordinatoren) auf alle Seiten übertragen werden, d.h. die Ausgangsqualität des noch nicht übersetzten Textes wird immer besser und der Aufwand der Übersetzung sollte mit der Zeit immer geringer werden (d.h. die Übersetzungsgeschwindigkeit sollte zunehmen). 
    <div z-index:2>
Erledigte Seiten stehen für GOV, GenWiki und Hic Leones zur Einarbeitung zur Verfügung.</ref>. Wenn er/sie mit der Übersetzung fertig ist, schickt er/sie die 10 Textdateien wieder an den Absender zurück, der sie nun wieder mit der Arbeitsdatenbank vereinigt (Re-Import) und entsprechend zur Weiterverarbeitung markiert.
      <li id="f-lastmod"> Diese Seite wurde zuletzt geändert um 16:05, 16. Jun 2006.</li>      <li id="f-viewcount">Diese Seite wurde bisher 7.284 mal abgerufen.</li>
      <br />


          <li>&nbsp;&copy; Das <a href="http://wiki-de.genealogy.net/wiki/GenWiki:GenWiki">GenWiki</a>
-->
  ist ein Projekt vom <a href="http://compgen.genealogy.net/index.php">Verein f&uuml;r Computergenealogie e. V.</a></li><br />
  <li>Unterst&uuml;tzen Sie uns und werden <a href="http://www.genealogy.net/vereine/CompGen/aufnahme-d.html" target="_blank" class="verweis">
  Mitglied</a>!</li><br />
  <li><a href="http://wiki-de.genealogy.net/wiki/Impressum">Impressum</a> -
  <a href="http://wiki-de.genealogy.net/wiki/CompGen:Datenschutz">Datenschutz</a> -
  <a href="http://wiki-de.genealogy.net/wiki/Disclaimer" >Juristisches</a></li>


    </div>
[[Kategorie:Genealogisches Projekt]]


    <div id="f-poweredbyico"><a href="http://www.mediawiki.org/"><img src="/w/skins/common/images/poweredby_mediawiki_88x31.png" alt="MediaWiki" /></a></div>    <div id="f-copyrightico"><a href="http://compgen.genealogy.net/index.php" target="_blank" class="verweis"> <img src="http://www.genealogy.net/images/compgen.png" alt="CompGen-Logo" width="180"> </a></div>
==Vortrag==
  </div>
Auf dem 59. Deutschen Genealogentag am 15.9.2007 in Ludwigshafen wurde das Projekt vorgestellt. Hier der Vortrag als [http://wiki-commons.genealogy.net/images/a/ad/SlownikGeo-Genealogentag2007.pdf PDF-File] (1 MB).
  </div>


<div id="menue">
== Anmerkungen ==
  <div id="menue-row">
<references/>
  <span id="not-aktiv-tab"><a href="http://www.genealogy.net" class="not-aktiv-tab-link">Home</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Computergenealogie" class="not-aktiv-tab-link">News</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Portal:Regionale_Forschung" class="not-aktiv-tab-link">Regional</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Portal:Vereine" class="not-aktiv-tab-link">Vereine</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Portal:Datenbanken" class="not-aktiv-tab-link">Datenbanken</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Kategorie:Genealogiesoftware" class="not-aktiv-tab-link">Software</a></span>
  <span id="not-aktiv-tab"><a href="http://list.genealogy.net/mailman/listinfo/" class="not-aktiv-tab-link">Mailinglisten</a></span>
  <span id="not-aktiv-tab"><a href="http://www.biggislist.de" class="not-aktiv-tab-link" target="_blank">Links</a></span>
  <span id="not-aktiv-tab"><a href="http://wiki-de.genealogy.net/wiki/Portal:Praktische_Hilfe" class="not-aktiv-tab-link">Hilfen/FAQs</a></span>
    </div>
    <div id="menue-subrow"></div>
  </div>
</body></html>

Aktuelle Version vom 28. Dezember 2021, 00:02 Uhr

en:SlownikGeo

Projektbeschreibung

Das Projekt wurde im Jahr 2015 beendet. Die extrahierten Seiten liegen aufbereitet mit teilweise Aufösung der Abkürzungen als Text vor und sind bei Comgen archiviert.

Hier finden Sie die Beschreibung des Projektes in Polnisch.

Einleitung

Texterschließung und Übersetzung der 16 Bände (14 785 Seiten) der Buchreihe: Słownik Geograficzny Królestwa Polskiego (i innych krajów slowianskich) (1880 - 1902) (deutsch: Geographisches Lexikon des Königreiches Polen (und anderer slawischer Länder)) - aus dem Polnischen ins Deutsche und Aufbereitung der darin enthaltenen Daten für das Genealogische Ortsverzeichnis GOV, GenWiki und Hic Leones.

Um sich einen Begriff zu machen, welche Arbeit der Herausgeber Filip Sulimierski und seine fast 700 Mitarbeiter in den Jahren 1880 - 1902 geleistet haben, vergegenwärtige man sich, dass der gesamte Text des Słownik Geograficzny (hintereinandergereiht als ein einziger Textfaden) eine Länge von etwa 130000 km hat (d.h. mehr als 3-mal um den Äquator ...).

Vorgeschichte

2003 veröffentlichte die PGSA die 16 Bände des Słownik Geograficzny Królestwa Polskiego auf CD-ROM (DJVU-Format). Dieses Projekt wurde durchgeführt von Rafał T. Prinke (Chefredakteur), Poznan, Poland, (Digitalisierung: Michał and Stanisław Prinke) und mit weiterem Material von William F. Hoffman und finanziert durch die PGSA (Projekt-Manager: Kenneth Czerwinski; Projekt-Kommittee: Marcia Bergman, Jim Czuchra, Virginia Hill, Rosalie Lindberg, Annmarie Utroska und Stanley Schmidt). Einige Einträge wurden durch Mitglieder der PGSA ins Englische übersetzt [1].

Idee

Die Bände des Słownik Geograficzny auf der CD-ROM der PGSA enthalten Beschreibungen aller Regionen, Städte, Dörfer und anderer Orte, Berge, Flüsse und Seen des Königreichs Polen (Kongresspolen) und im slawischen Sprachraum: die baltischen, westlichen und südlichen Gubernien (Gouvernements) des Russischen Reichs, Westpreußen und Ostpreußen, das Großherzogtum Posen und Preußisch Schlesien, Galizien, Wolhynien, Podolien, Polesien, Österreichisch Schlesien, Mähren, die slovakischen Teile von Ungarn und der Bukowina, und zusätzlich auch weitere wichtige Orte in den übrigen Gubernien im europäischen Russland (als da sind Landsitze, Kirchspiele, Eisenbahnstationen etc.) (geschätzt: etwa 315 000 - 350 000 Einträge), aber

  • es handelt sich um BILD-Dateien, die man nicht auf jeden Begriff hin absuchen kann und
  • es ist polnischer Text, der nicht jedem (deutschen) Forscher direkt zugänglich ist.

Es ist also wünschenswert, diesen Schatz an Informationen für Kultur- und Familienforscher als

  • TEXT-Datei (mit globalen Suchfunktionen absuchbar) und
  • in deutscher Sprache zugänglich zu machen.

Vorarbeiten

Der Vorversuch, die BILD-Dateien der Słownik-Geograficzny-CD-ROM durch OCR (Texterkennung mit FineReader, Ver. 6.0) zu digitalisieren, ergab sehr gute Resultate (> 95 % korrekte TEXT-Dateien), einschließlich der spezifischen polnischen Schriftzeichen.

Rechtliches

H.V.J.Kolbe (Hic Leones) kontaktierte die PGSA schriftlich mit Beispielen dieser OCR-Resultate und mit folgendem Vorschlag:

  • Die PGSA stellt Hic Leones die Bilddateien des Słownik Geograficzny offiziell und unentgeltlich zur Verfügung, um die gesamten 14 785 Seiten von BILD-Dateien in TEXT-Dateien zu überführen.
  • Als Gegenleistung erhält die PGSA diese TEXT-Dateien von Hic Leones für eigene Zwecke (z.B. Übersetzung ins Englische, weitere CDs (nun Text + Bild) etc.) ohne weitere Auflagen.

Die PGSA stand diesem Angebot positiv gegenüber und im Sept. 2005 erhielt H.V.J.Kolbe eine positive schriftliche Zusage des PGSA-Vorstandes (Board of Directors). Damit war die legale Seite der Datenverwendung geklärt und zusätzlich ein neuer, interessanter Kontakt (PGSA ) zur Familienforschung in Polen geschaffen.

Dieses Ergebnis wurde von Hic Leones 2005 auf dem 57. Genealogentag in Hannover bekannt gegeben.

Ende Sept. 2005 war die TEXT-Digitalisierung aller 14 785 Seiten des Słownik Geograficzny abgeschlossen und Ende Okt. 2005 wurde der gesamte polnischen Text auf CD an Cynthia Piech geschickt.

Das Projekt

Modus

Wissenschaftliche Zusammenarbeit.

Projekt Partner und deren Beteiligung

PGSA (Polish Genealogical Society of America)

http://www.pgsa.org

  • Scannen der 14 785 Seiten des Słownik Geograficzny und Speicherung im Bildformat
  • Edition des Słownik Geograficzny Królestwa Polskiego auf CD-ROM

Hic Leones

  • Konzept und Koordination des Projektes
  • Texterkennung (OCR) der 14 785 Seiten des Słownik Geograficzny und Speicherung im Textformat
  • Zusammenstellung eines 1000-seitigen PL => D Lexikons von 1879 im PDF-Format (frei für Mitarbeiter)
  • letzte Aktivität Dezember 2013

Vortrag

Auf dem 59. Deutschen Genealogentag am 15.9.2007 in Ludwigshafen wurde das Projekt vorgestellt. Hier der Vortrag als PDF-File (1 MB).

Anmerkungen