<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://genwiki39.genealogy.net/index.php?action=history&amp;feed=atom&amp;title=OCR</id>
	<title>OCR - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://genwiki39.genealogy.net/index.php?action=history&amp;feed=atom&amp;title=OCR"/>
	<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;action=history"/>
	<updated>2026-07-05T09:25:21Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in GenWiki</subtitle>
	<generator>MediaWiki 1.39.13</generator>
	<entry>
		<id>https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=2005030&amp;oldid=prev</id>
		<title>HJS: Kat. ergänzt</title>
		<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=2005030&amp;oldid=prev"/>
		<updated>2019-09-18T08:33:50Z</updated>

		<summary type="html">&lt;p&gt;Kat. ergänzt&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;de&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Nächstältere Version&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Version vom 18. September 2019, 10:33 Uhr&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l16&quot;&gt;Zeile 16:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Zeile 16:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;----&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;----&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;references/&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;references/&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;[[Kategorie:Lexikon]]&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>HJS</name></author>
	</entry>
	<entry>
		<id>https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1662707&amp;oldid=prev</id>
		<title>Baumbuwegen: Link auf dt. Quelle ergänzt, kleinere Optikkorr.</title>
		<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1662707&amp;oldid=prev"/>
		<updated>2015-12-13T12:25:43Z</updated>

		<summary type="html">&lt;p&gt;Link auf dt. Quelle ergänzt, kleinere Optikkorr.&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;de&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Nächstältere Version&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Version vom 13. Dezember 2015, 14:25 Uhr&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot;&gt;Zeile 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Zeile 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;OCR ist eine Abkürzung für Optical Character Recognition. Man versteht darunter das maschinelle &lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Lesen &lt;/del&gt;von Text. Es gibt sowohl kommerzielle als auch quelloffene Programme für OCR. Das wohl bekannteste quelloffene OCR-Programm ist Tesseract.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;OCR ist eine Abkürzung für Optical Character Recognition. Man versteht darunter das maschinelle &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Umsetzen &lt;/ins&gt;von &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;bildlich dargestelltem &lt;/ins&gt;Text &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;(Scans) in Testdaten&lt;/ins&gt;. Es gibt sowohl kommerzielle als auch quelloffene Programme für OCR. Das wohl bekannteste quelloffene OCR-Programm ist Tesseract.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Eine umfassende Erklärung, wie OCR funktioniert, findet sich auf &lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;dieser Webseite&lt;/del&gt;: http://how-ocr-works.com/OCR/OCR.html&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Eine umfassende Erklärung, wie OCR funktioniert, findet sich &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;u. a. &lt;/ins&gt;auf &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;diesen Webseiten&lt;/ins&gt;:&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;* [&lt;/ins&gt;http://how-ocr-works.com/OCR/OCR.html &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;technisch extakt, englisch]&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;* [http://www.computerbild.de/artikel/cb-Ratgeber-So-funktioniert-Texterkennung-4514615.html einfacher beschrieben, deutsch]&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Aufgrund der großen Datenmengen scheint es in vielen Fällen verlockend, OCR einzusetzen. Die Werbeversprechen der Herstellern (95% Genauigkeit) hören sich erfolgversprechend an. Leider sieht es in der Praxis anders aus. Aus folgenden Gründen lässt sich für unsere Art von Dokumenten OCR nicht besonders gut einsetzen:&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Aufgrund der großen Datenmengen scheint es in vielen Fällen verlockend, OCR einzusetzen. Die Werbeversprechen der Herstellern (95% Genauigkeit) hören sich erfolgversprechend an. Leider sieht es in der Praxis anders aus. Aus folgenden Gründen lässt sich für unsere Art von Dokumenten OCR nicht besonders gut einsetzen:&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die von den Herstellern angegebene Genauigkeit bezieht sich auf die &amp;#039;&amp;#039;Zeichengenaugikeit&amp;#039;&amp;#039;. Die Wortgenauigkeit ist deutlich geringer. Beträgt z.B. die Zeichengenauigkeit 95%, so wird ein Wort mit sieben Buchstaben mit nur noch bei 70%&amp;lt;ref&amp;gt;0,95^7=0,7&amp;lt;/ref&amp;gt;. Es gibt eine umfangreiche Studie, die zu dem Ergebnis kommt, dass schon in diesem Fall komplettes Abtippen effizienter als OCR mit anschließendem Korrekturlesen ist.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die von den Herstellern angegebene Genauigkeit bezieht sich auf die &amp;#039;&amp;#039;Zeichengenaugikeit&amp;#039;&amp;#039;. Die Wortgenauigkeit ist deutlich geringer. Beträgt z.B. die Zeichengenauigkeit 95%, so wird ein Wort mit sieben Buchstaben mit nur noch bei 70%&amp;lt;ref&amp;gt;0,95^7=0,7&amp;lt;/ref&amp;gt;. Es gibt eine umfangreiche Studie, die zu dem Ergebnis kommt, dass schon in diesem Fall komplettes Abtippen effizienter als OCR &lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;#039;&amp;#039;&amp;#039;&lt;/ins&gt;mit anschließendem Korrekturlesen&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;#039;&amp;#039;&amp;#039; &lt;/ins&gt;ist.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die Probleme mit der Zeichengenauigkeit kann man mit Hilfe von Grammatikanalyse und eines Wörterbuchs umgehen. Das funktioniert aber nur bei &amp;quot;normalem&amp;quot; Text, z.B. Tagebüchern, Manuskripten oder Briefen. Bei Familien- und Ortsnamen funktioniert es nicht, da es davon zu viele gibt und kein grammatikalischer Zusammenhang zu umgebenden Wort da ist. Aber gerade diese beiden Informationen sind für uns die wichtigsten.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die Probleme mit der Zeichengenauigkeit kann man mit Hilfe von Grammatikanalyse und eines Wörterbuchs umgehen. Das funktioniert aber nur bei &amp;quot;normalem&amp;quot; Text, z.B. Tagebüchern, Manuskripten oder Briefen. Bei Familien- und Ortsnamen funktioniert es nicht, da es davon zu viele gibt und kein grammatikalischer Zusammenhang zu umgebenden Wort da ist. Aber gerade diese beiden Informationen sind für uns die wichtigsten.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die Erkennungsrate bei &amp;#039;&amp;#039;Frakturschrift&amp;#039;&amp;#039; ist geringer als die der heute üblichen Antiqua-Schrift.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* Die Erkennungsrate bei &amp;#039;&amp;#039;Frakturschrift&amp;#039;&amp;#039; ist geringer als die der heute üblichen Antiqua-Schrift.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Baumbuwegen</name></author>
	</entry>
	<entry>
		<id>https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624908&amp;oldid=prev</id>
		<title>Jzedlitz am 29. August 2015 um 09:27 Uhr</title>
		<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624908&amp;oldid=prev"/>
		<updated>2015-08-29T09:27:11Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;de&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Nächstältere Version&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Version vom 29. August 2015, 11:27 Uhr&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot;&gt;Zeile 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Zeile 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;OCR ist eine Abkürzung für Optical Character Recognition. Man versteht darunter das maschinelle Lesen von Text. Es gibt sowohl kommerzielle als auch quelloffene Programme für OCR. Das wohl bekannteste quelloffene OCR-Programm ist Tesseract.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;OCR ist eine Abkürzung für Optical Character Recognition. Man versteht darunter das maschinelle Lesen von Text. Es gibt sowohl kommerzielle als auch quelloffene Programme für OCR. Das wohl bekannteste quelloffene OCR-Programm ist Tesseract.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Eine umfassende Erklärung, wie OCR funktioniert, findet sich auf dieser Webseite: http://how-ocr-works.com/OCR/OCR.html&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Jzedlitz</name></author>
	</entry>
	<entry>
		<id>https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624630&amp;oldid=prev</id>
		<title>Jzedlitz am 28. August 2015 um 15:55 Uhr</title>
		<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624630&amp;oldid=prev"/>
		<updated>2015-08-28T15:55:54Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;de&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Nächstältere Version&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Version vom 28. August 2015, 17:55 Uhr&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot;&gt;Zeile 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Zeile 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;OCR ist eine Abkürzung für Optical Character Recognition. Man versteht darunter das maschinelle Lesen von Text. Es gibt sowohl kommerzielle als auch quelloffene Programme für OCR. Das wohl bekannteste quelloffene OCR-Programm ist Tesseract.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Aufgrund der großen Datenmengen scheint es in vielen Fällen verlockend, OCR einzusetzen. Die Werbeversprechen der Herstellern (95% Genauigkeit) hören sich erfolgversprechend an. Leider sieht es in der Praxis anders aus. Aus folgenden Gründen lässt sich für unsere Art von Dokumenten OCR nicht besonders gut einsetzen:&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Aufgrund der großen Datenmengen scheint es in vielen Fällen verlockend, OCR einzusetzen. Die Werbeversprechen der Herstellern (95% Genauigkeit) hören sich erfolgversprechend an. Leider sieht es in der Praxis anders aus. Aus folgenden Gründen lässt sich für unsere Art von Dokumenten OCR nicht besonders gut einsetzen:&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Jzedlitz</name></author>
	</entry>
	<entry>
		<id>https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624629&amp;oldid=prev</id>
		<title>Jzedlitz am 28. August 2015 um 15:54 Uhr</title>
		<link rel="alternate" type="text/html" href="https://genwiki39.genealogy.net/index.php?title=OCR&amp;diff=1624629&amp;oldid=prev"/>
		<updated>2015-08-28T15:54:35Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== OCR bei genealogy.net ==&lt;br /&gt;
Aufgrund der großen Datenmengen scheint es in vielen Fällen verlockend, OCR einzusetzen. Die Werbeversprechen der Herstellern (95% Genauigkeit) hören sich erfolgversprechend an. Leider sieht es in der Praxis anders aus. Aus folgenden Gründen lässt sich für unsere Art von Dokumenten OCR nicht besonders gut einsetzen:&lt;br /&gt;
* Die von den Herstellern angegebene Genauigkeit bezieht sich auf die &amp;#039;&amp;#039;Zeichengenaugikeit&amp;#039;&amp;#039;. Die Wortgenauigkeit ist deutlich geringer. Beträgt z.B. die Zeichengenauigkeit 95%, so wird ein Wort mit sieben Buchstaben mit nur noch bei 70%&amp;lt;ref&amp;gt;0,95^7=0,7&amp;lt;/ref&amp;gt;. Es gibt eine umfangreiche Studie, die zu dem Ergebnis kommt, dass schon in diesem Fall komplettes Abtippen effizienter als OCR mit anschließendem Korrekturlesen ist.&lt;br /&gt;
* Die Probleme mit der Zeichengenauigkeit kann man mit Hilfe von Grammatikanalyse und eines Wörterbuchs umgehen. Das funktioniert aber nur bei &amp;quot;normalem&amp;quot; Text, z.B. Tagebüchern, Manuskripten oder Briefen. Bei Familien- und Ortsnamen funktioniert es nicht, da es davon zu viele gibt und kein grammatikalischer Zusammenhang zu umgebenden Wort da ist. Aber gerade diese beiden Informationen sind für uns die wichtigsten.&lt;br /&gt;
* Die Erkennungsrate bei &amp;#039;&amp;#039;Frakturschrift&amp;#039;&amp;#039; ist geringer als die der heute üblichen Antiqua-Schrift.&lt;br /&gt;
* OCR-Programme sind auf Dokumentenarten wie Zeitungsartikel oder Literatur optimiert. Mit &amp;#039;&amp;#039;Tabellenstrukturen&amp;#039;&amp;#039;, wie man sie z.B. in Ortsverzeichnissen vorfindet, kommt OCR sehr schlecht zurecht.&lt;br /&gt;
* Bei Handschrifterkennung muss man derzeit mindestens 100 Seiten eines Autors von Hand abtippen, bevor die Handschrift maschinell gelesen werden kann. Das ist also nur bei sehr umfangreichen Werken eines einzelnen Autors machbar. Bei einer Quelle mit ständig wechselnder Handschrift (z.B. Kirchenbuch oder Standesamtsurkunden) funktioniert es nicht. Auch liegt die Genauigkeit bei lediglich 70-80% - vermutlich die Zeichengenaugikeit.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&amp;lt;references/&amp;gt;&lt;/div&gt;</summary>
		<author><name>Jzedlitz</name></author>
	</entry>
</feed>