Vom Manuskript zum Digitaltext: Geschichten, Methoden und Magie

Gewähltes Thema: Transformation von Manuskripten zu Digitaltext. Wir nehmen Sie mit auf eine inspirierende Reise, in der vergilbte Seiten, verblasste Tinten und persönliche Notizen ein neues, durchsuchbares und lebendiges digitales Leben erhalten.

Die Reise vom Papier zum Pixel

Als eine Bibliothekarin ein Reisetagebuch von 1913 entdeckte, war es zunächst nur schwer lesbare Tinte. Nach der Digitalisierung wurde es durchsuchbar, kommentierbar und inspirierte Nachfahren, ihre Familiengeschichte neu zusammenzusetzen.

Scannen ohne Reue: Qualität beginnt vor der OCR

Zwischen 300 und 600 DPI, kalibrierte Farbtargets und eine Buchwiege, die den Rücken schont, bilden die Grundlage. So bleiben Details lesbar, Farben konsistent und fragiles Material unversehrt.

Scannen ohne Reue: Qualität beginnt vor der OCR

Entzerrung, Entschattung und sorgfältige Ausleuchtung minimieren Fehler bei der späteren Erkennung. Wer Krümmungen reduziert, verbessert die Textqualität spürbar und spart sich mühsame Korrekturen in Nacharbeit.

HTR und OCR: Maschinen lernen Handschrift

HTR-Modelle, etwa in Transkribus, lernen aus Beispielseiten mit verlässlichen Transkriptionen. Unterschiedliche Schreiberhände, Abkürzungen und Ligaturen stärken die Robustheit und erhöhen die Erkennungsraten nachhaltig.

HTR und OCR: Maschinen lernen Handschrift

Kein Modell ist perfekt. Mit Korrekturworkflows, Wörterbüchern, Sprachmodellen und Validierung durch Menschen sinken Fehlerraten. Iteratives Training verwandelt unscharfe Stellen in klare, zitierfähige Zeichenfolgen.

Struktur statt Chaos: TEI und semantische Auszeichnung

Absätze, Überschriften, Marginalien und Fußnoten werden markiert, damit Lesende Strukturen erfassen. So wird aus Textfluss ein Modell, das Edition, Zitat und Kontext elegant miteinander verbindet.

Struktur statt Chaos: TEI und semantische Auszeichnung

Named-Entity-Recognition hilft, Personen, Orte und Daten zu identifizieren. Verknüpft mit Normdaten entstehen Wissensnetze, in denen man Beziehungen erkundet und historische Spuren schnell nachvollzieht.

Struktur statt Chaos: TEI und semantische Auszeichnung

Semantische Markup macht mehr als ‚schön‘. Es ermöglicht präzise Suchen, thematische Pfade und anschauliche Visualisierungen. Abonnieren Sie unsere Hinweise, wie Sie Ihre TEI-Projekte lebendig präsentieren.

Metadaten, Rechte und Verantwortung

Beschreibende, technische und administrative Metadaten sorgen dafür, dass Digitaltexte gefunden, verstanden und korrekt zitiert werden. Standards bringen Ordnung, Vergleichbarkeit und langfristige Anschlussfähigkeit.

Metadaten, Rechte und Verantwortung

Urheberrecht, Lizenzen und Nutzungsbedingungen müssen klar sein. Offene Lizenzen erleichtern Forschung und Bildung, während Restriktionen sensible Bereiche schützen. Transparenz schafft Vertrauen und verhindert spätere Konflikte.

Metadaten, Rechte und Verantwortung

Manche Manuskripte enthalten intime Details oder kulturell heikle Passagen. Leitlinien und Ethik-Gremien helfen, angemessene Zugänge zu gestalten. Diskutieren Sie Ihre Sicht, wir lernen gemeinsam aus Erfahrungen.

Metadaten, Rechte und Verantwortung

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Qualitätssicherung und Gemeinschaft

Crowdsourcing, aber richtig

Mit klaren Richtlinien, doppelt erfassten Transkriptionen und Feedback-Schleifen wächst Qualität. Freiwillige fühlen sich ernst genommen und Projekte gewinnen an Tempo, Genauigkeit und begeisterter Beteiligung.

Kennzahlen, die wirklich zählen

CER/WER, Fehlertypen und Stichprobenprüfungen zeigen Fortschritt und Bedarf. Sichtbare Metriken motivieren Teams, gezielt nachzuschärfen und die Transformation vom Manuskript zum Digitaltext messbar zu verbessern.

Abonnieren und mitgestalten

Melden Sie sich für unseren Newsletter an, um Vorlagen, Checklisten und Erfahrungsberichte zu erhalten. Teilen Sie Ihre Workflows und helfen Sie anderen, ihre Manuskripte erfolgreich zu transformieren.

Bewahren und präsentieren: Langzeit und Zugang

Offene Formate, Replikation und regelmäßige Fixity-Checks verhindern Datenverlust. Dokumentierte Migrationspfade und PREMIS-Informationen halten die Geschichte der Dateien nachvollziehbar und auditierbar.

Bewahren und präsentieren: Langzeit und Zugang

IIIF-Viewer, Annotationen und kuratierte Ausstellungen machen aus Seiten Erlebnisse. Nutzer erkunden Details, vergleichen Versionen und entdecken Zusammenhänge, die zuvor im Schatten der Bindung verborgen blieben.
Ferreterialamichoana
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.