- search hit 1 of 1
OCR bei Inkunabeln – Offizinspezifischer Ansatz der Universitätsbibliothek Würzburg
OCR processing of incunabula: printshop-specific approach of the University Library of Würzburg
Please always quote using this URN: urn:nbn:de:bvb:20-opus-194002
- Im Rahmen des BMBF-geförderten Projekts KALLIMACHOS an der Universität Würzburg soll unter anderem die Textgrundlage für digitale Editionen per OCR gewonnen werden. Das Bearbeitungskorpus besteht aus deutschen, französischen und lateinischen Inkunabeln. Dieser Artikel zeigt, wie man mit bereits heute existierenden Methoden und Programmen den Problemen bei der OCR von Inkunabeln entgegentreten kann. Hierzu wurde an der Universitätsbibliothek Würzburg ein Verfahren erprobt, mit dem auf ausgewählten Werken einer Druckerwerkstatt bereitsIm Rahmen des BMBF-geförderten Projekts KALLIMACHOS an der Universität Würzburg soll unter anderem die Textgrundlage für digitale Editionen per OCR gewonnen werden. Das Bearbeitungskorpus besteht aus deutschen, französischen und lateinischen Inkunabeln. Dieser Artikel zeigt, wie man mit bereits heute existierenden Methoden und Programmen den Problemen bei der OCR von Inkunabeln entgegentreten kann. Hierzu wurde an der Universitätsbibliothek Würzburg ein Verfahren erprobt, mit dem auf ausgewählten Werken einer Druckerwerkstatt bereits Zeichengenauigkeiten von bis zu 95 Prozent und Wortgenauigkeiten von bis zu 73 Prozent erzielt werden.…
Author: | Felix Kirchner, Marco Dittrich, Phillip Beckenbauer, Maximilian Nöth |
---|---|
URN: | urn:nbn:de:bvb:20-opus-194002 |
Document Type: | Journal article |
Faculties: | Zentrale Einrichtungen / Universitätsbibliothek |
Language: | German |
Parent Title (German): | ABI Technik |
ISSN: | 2191-4664 |
ISSN: | 0720-6763 |
Year of Completion: | 2016 |
Volume: | 36 |
Issue: | 3 |
Pagenumber: | 178-188 |
Source: | ABI Technik 2016, 36(3), 178-188. doi: https://doi.org/10.1515/abitech-2016-0036 |
DOI: | https://doi.org/10.1515/abitech-2016-0036 |
Dewey Decimal Classification: | 0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 000 Informatik, Informationswissenschaft, allgemeine Werke |
0 Informatik, Informationswissenschaft, allgemeine Werke / 02 Bibliotheks- und Informationswissenschaften / 020 Bibliotheks- und Informationswissenschaften | |
Tag: | Inkunabel; OCR; Tesseract Incunabula; OCR; Tesseract |
Release Date: | 2020/12/01 |
Date of first Publication: | 2016/09/12 |
Note: | Dieser Beitrag ist mit Zustimmung des Rechteinhabers aufgrund einer (DFG-geförderten) Allianz- bzw. Nationallizenz frei zugänglich. |
Licence (German): | Deutsches Urheberrecht |