GEDCOM/UID: Unterschied zwischen den Versionen

Aktuelle Version vom 8. Januar 2025, 13:26 Uhr

In GEDCOM-Dateien werden UID eingesetzt, um einen Datensatz eindeutig identifizieren zu können.^[1] Eine UID ist 128 Bit lang und wird zufällig erzeugt. Bei der Länge einer UID ist es praktisch ausgeschlossen, dass zwei unabhängig voneinander erzeugte UID gleich sind.^[2]

Das kann nun wie folgt genutzt werden: Wenn ein Datensatz (z.B. für eine Person) in einem Genealogieprogramm neu angelegt wird, erzeugt dieses zu diesem Datensatz eine UID. Wird der Datensatz nun exportiert und an anderer Stelle weiter verwendet und bearbeitet, ist über die UID immer noch erkennbar, dass der Datensatz vom ursprünglich erzeugten Datensatz abgeleitet wurde. Die UID weist also über Exporte, Bearbeitungen und Datensatzverschmelzungen in verschiedenen Programmen hinweg darauf hin, dass der Datensatz dasselbe Objekt (z.B. eine Person) beschreibt.

In Online-Datenbanken kann man das nutzen, um eine Person auch nach Updates oder bei ihrer Einstellung in verschiedene Datenbanken eindeutig wieder zu finden: Trotz der Änderungen bezüglich genealogischer Daten ist die UID immer noch dieselbe. Datenbank-Systeme wie GEDBAS und Online-OFB nutzen das, um dem Anwender das Wiederfinden der Personen zu ermöglichen.

Voraussetzungen für das Funktionieren ist, dass die Programme beim Import die UID für die Datensätze unverändert lassen und beim späteren Export sie genau so wieder exportieren, wie sie im Import vorgefunden wurden. Der neueste Stand des GEDCOM Standards (7.0)^[3] hat dazu das GEDCOM-Kennzeichen UID in den Standard aufgenommen. Davor wurde es aber bereits seit langem in verschiedenen Genealogieprogrammen als nutzerdefiniertes Kennzeichen _UID verwendet. Durch die lange Historie trifft man in GEDCOM-Dateien auf durchaus verschiedene Darstellungen einer UID, teils mit unterschiedlicher Länge, mit und ohne Prüfkennziffern, unter Verwendung von Groß- oder Kleinbuchstaben, manchmal auch mit einem "-" Zeichen zur Untergliederung.

Eine UID kann nicht nur für Personendatensätze verwendet werden. Alle Datensatzarten in einer GEDCOM-Datei wie Quellen, Familien, Medienobjekte, Archive können mit einer UID eindeutig gekennzeichnet werden. Einem Datensatz können mehrere UID zugeordnet sein. Das kommt immer dann vor, wenn zwei Datensätze verschmolzen wurden, die zuvor unabhängig voneinander erzeugt worden sind.

Eine weitere Voraussetzung ist, dass Anwender nie einen bereits bestehenden Datensatz umfunktionieren, weil sie die alte Person (z.B. Max Müller) nicht mehr brauchen und diesen Datensatz nun einfach durch Überschreiben aller Daten zu einem Moritz Meyer machen. Für eine neu einzugebende Person muss immer ein frischer Datensatz mit einer für diesen Datensatz erzeugten UID eingesetzt werden!

Einzelnachweise[Bearbeiten]

↑ siehe RFC 4122 der IETF im Artikel Internet Engineering Task Force. In: Wikipedia, Die freie Enzyklopädie.
↑ siehe Artikel Universally Unique Identifier#Kollisionen. In: Wikipedia, Die freie Enzyklopädie.
↑ siehe GEDCOM Standard 7.0

[1] siehe RFC 4122 der IETF im Artikel Internet Engineering Task Force. In: Wikipedia, Die freie Enzyklopädie.

[2] siehe Artikel Universally Unique Identifier#Kollisionen. In: Wikipedia, Die freie Enzyklopädie.

[3] siehe GEDCOM Standard 7.0

[1]

[2]

[3]

@@ Zeile 1: / Zeile 1: @@
-Bei der zunächst bei [[PAF]] verwendeten 36-stellige '''Universellen Identifikationsnummer _UID''' handelt es sich um eine Zufallszahl, die keine kodierten Informationen enthält.
+In [[GEDCOM]]-Dateien werden UID eingesetzt, um einen Datensatz eindeutig identifizieren zu können.<ref>siehe [https://www.rfc-editor.org/rfc/rfc4122 RFC&nbsp;4122] der IETF im {{Wikipedia-Link|Internet Engineering Task Force}}</ref> Eine UID ist 128 Bit lang und wird zufällig erzeugt. Bei der Länge einer UID ist es praktisch
+ausgeschlossen, dass zwei unabhängig voneinander erzeugte UID gleich sind.<ref>siehe {{Wikipedia-Link|Universally Unique Identifier#Kollisionen}}</ref>
-Die Wahrscheinlichkeit, daß zwei Datensätze die selbe
+Das kann nun wie folgt genutzt werden: Wenn ein Datensatz (z.B. für eine Person) in einem [[Genealogieprogramm]] neu angelegt wird, erzeugt dieses zu diesem Datensatz eine UID. Wird der Datensatz nun exportiert und an anderer Stelle weiter verwendet und bearbeitet, ist über die UID immer noch erkennbar, dass der Datensatz vom ursprünglich erzeugten Datensatz abgeleitet wurde. Die UID weist also über Exporte, Bearbeitungen und Datensatzverschmelzungen in verschiedenen Programmen hinweg darauf hin, dass der Datensatz dasselbe Objekt (z.B. eine Person) beschreibt.
-Nummer bekommen, ist sehr gering:
-<math>p = 2^{-144} \approx 4{,}48 \cdot 10^{-44}</math>.
-Wenn bei jedem Import/Export die Nummer erhalten bleibt, kann man später den
+In Online-Datenbanken kann man das nutzen, um eine Person auch nach Updates oder bei ihrer Einstellung in verschiedene Datenbanken eindeutig wieder zu finden: Trotz der Änderungen bezüglich genealogischer Daten ist die UID immer noch dieselbe. Datenbank-Systeme wie [[GEDBAS]] und [[Online-OFB]] nutzen das, um dem Anwender das Wiederfinden der Personen zu ermöglichen.
-Datensatz auch bei mehrfacher Weitergabe wiedererkennen.
+Voraussetzungen für das Funktionieren ist, dass die Programme beim Import die UID für die Datensätze unverändert lassen und beim späteren Export sie genau so wieder exportieren, wie sie im Import vorgefunden wurden. Der neueste Stand des GEDCOM Standards (7.0)<ref>siehe [https://gedcom.io/specifications/FamilySearchGEDCOMv7.html GEDCOM Standard 7.0]</ref> hat dazu das GEDCOM-Kennzeichen UID in den Standard aufgenommen. Davor wurde es aber bereits seit langem in verschiedenen Genealogieprogrammen als nutzerdefiniertes Kennzeichen [[GEDCOM/UID-Tag|_UID]] verwendet. Durch die lange Historie trifft man in GEDCOM-Dateien auf durchaus verschiedene Darstellungen einer UID, teils mit unterschiedlicher Länge, mit und ohne Prüfkennziffern, unter Verwendung von Groß- oder Kleinbuchstaben, manchmal auch mit einem "-" Zeichen zur Untergliederung.
+Eine UID kann nicht nur für Personendatensätze verwendet werden. Alle Datensatzarten in einer GEDCOM-Datei wie Quellen, Familien, Medienobjekte, Archive können mit einer UID eindeutig gekennzeichnet werden. Einem Datensatz können mehrere UID zugeordnet sein. Das kommt immer dann vor, wenn zwei Datensätze verschmolzen wurden, die zuvor unabhängig voneinander erzeugt worden sind.
+Eine weitere Voraussetzung ist, dass Anwender nie einen bereits bestehenden Datensatz umfunktionieren, weil sie die alte Person (z.B. Max Müller) nicht mehr brauchen und diesen Datensatz nun einfach durch Überschreiben aller Daten zu einem Moritz Meyer machen. Für eine neu einzugebende Person muss immer ein frischer Datensatz mit einer für diesen Datensatz erzeugten UID eingesetzt werden!
+== Einzelnachweise ==
+<references />
 [[Kategorie:GEDCOM|UID]]

GEDCOM/UID: Unterschied zwischen den Versionen

Aktuelle Version vom 8. Januar 2025, 13:26 Uhr

Einzelnachweise[Bearbeiten]

Navigationsmenü

Suche im GenWiki