Der Wissensschatz von mehr als anderthalb Jahrhunderten MT-Berichterstattung wird digital erschlossen

Der Verlag J.C.C. Bruns erschließt den reichhaltigen Schatz seiner Tageszeitung für das digitale Zeitalter. Seit November werden ältere Jahrgangsbände des Mindener Tageblattes digital aufbereitet. “111.970 Seiten sind bereits eingescannt”, sagt Siegfried Peis, Inhaber der Prepress Systeme GmbH (Oberursel).

Vom Zeitungspapier in die Datenwolke: Das Mindener Tageblatt lässt alle Archivbände seit dem ersten Erscheinungstag am 4. Juli 1856 digitalisieren. Foto: Otto

Peis bringt viel Erfahrung in dem Metier mit. 1992 gründete er PPS zur Entwicklung und Vermarktung von Redaktionssystemen. Mit Beginn des neuen Jahrtausends widmete er sich zunehmend der Digitalisierung älterer Bestände deutschsprachiger Tages- und Wochenzeitungen. “Unser erstes Projekt war ‘Die Zeit’.” Die renommierte Hamburger Wochenzeitung ließ alle bis dahin erschienen Ausgaben seit ihrer Gründung 1946 von PPS scannen und stellt das Archiv heute im Internet zur Verfügung.

Ab 2006 liegen digitale E-Paper-Ausgaben vor

Es folgten gut drei Dutzend weitere Titel von der “Automobil Revue” aus Bern über die “Hessische Allgemeine” aus Kassel bis zum “Weser-Kurier” aus Bremen. Einige Verlage ließen nur die Titelblätter ihrer Zeitungen scannen, wie die “Badische Zeitung” aus Freiburg oder der “Südkurier” aus Konstanz. Andere sind inzwischen komplett bis Mitte des ersten Jahrzehnts im neuen Jahrtausend digital erfasst. “Ab da setzt meist die Aufbereitung für E-Paper-Ausgaben durch die Verlage selbst ein”, sagt Siegfried Peis. Auch für das Mindener Tageblatt liegen die Ausgaben ab 2006 in digitaler Form vor und sind im PDF-Format greifbar – allerdings bislang lediglich für Recherchen der Redaktion zugänglich im Intranet des Verlagshauses.
Von ungeheurem historischen Interesse sind dagegen die älteren Ausgaben von Tageszeitungen als Spiegel der Politik, Wirtschaft, Kultur und Gesellschaft ihrer jeweiligen Zeit. Große Verlage wie die “New York Times” sind daher dazu übergegangen, ältere Artikel im Internet zugänglich zu machen.

Mit seinem Vorhaben, die gesamten Jahrgangsbände seit der Gründung des Mindener Tageblattes und seines Vorläufers, des Minden-Lübbecker Kreisblattes, im Jahr 1856 digitalisieren zu lassen, nimmt der Verlag J.C.C. Bruns eine Vorreiterrolle ein. Die schweizerische “Automobil Revue” reicht bis 1906 zurück. “Die “Ibbenbürener Volkszeitung” haben wir von 1898 bis 2007 komplett digitalisiert”, sagt der PPS-Geschäftsführer. Mithin hat er bereits Erfahrung mit der Bearbeitung von kunstvoll gestalteten Fraktur-Schriften gesammelt, die nicht nur jüngeren Lesergenerationen manche Schwierigkeiten bereiten, sondern auch von normalen Scannern schlechter erkannt werden.

Den Zeitraum der IVZ übertrifft das Mindener Tageblatt noch einmal um vier Jahrzehnte. Damit würde das Projekt bei seinem Abschluss bis in die Mitte des 19. Jahrhunderts zurückreichen. Dadurch wird das Tor nicht nur zur Auseinandersetzung mit der Geschichte des Massenmediums, sondern auch zur politischen, wirtschaftlichen, gesellschaftlichen und kulturellen Geschichte der Stadt weit aufgestoßen.

Lebensweg von Personen leichter nachvollziehbar

Anders als durch die mühsame Recherche an Mikrofilm-Lesegeräte oder beim Umblättern brüchiger alter Zeitungsseiten, verbunden mit einem zeitraubenden Überfliegen der Seiten, übernimmt künftig der Computer die Suche nach zentralen Begriffen oder Namen – selbst im Anzeigenteil. So könnte Stadtgeschichte schon bald neu erlebbar und manches Kapitel leichter zugänglich werden. Der Lebensweg von Personen und Persönlichkeiten wird leichter nachvollziehbar – von der Geburtsanzeige über Konfirmation oder Schulentlassung bis zum Nachruf.

Eingescannt sind bislang die ersten zwei Jahrzehnte vom Wiedererscheinen im Dezember 1949 bis 1970, die spannende Zeit des Wiederaufbaus und der Wirtschaftswunderjahre. Drei Wochen habe sein zehnköpfiges Team für die 96 Bände benötigt – an drei Scannern in Doppelschicht. Die noch ausstehenden mehr als zwölf Jahrzehnte sollen Schritt für Schritt folgen.


Mit Einscannen ist es nicht getan

An eigens entwickelten Scannern werden die Zeitungen bei PPS Seite für Seite erfasst, bevor sie anschließend einer umfangreichen Bearbeitung durch verschiedene Lese- und Etrkennungsprogramme unterzogen werden. Foto: PPS

“150000 bis 300000 Zeitungsseiten können wir im Monat scannen”, sagt Siegfried Peis. Doch damit allein ist es nicht getan. Das von ihm gegründete Spezialunternehmen liefert auch einen Schlüssel mit, um all die bedruckten Seiten zu erschließen.

“Scannen ist das Einfachste”, erklärt Peis. Aber auch dabei ist darauf zu achten, dass die bei gebundenen Zeitungsbänden wie bei Büchern auch die Bundverzerrung möglichst weit reduziert oder sogar ganz überwunden wird. Dank viel Entwicklungsarbeit setzt das Unternehmen dafür drei Spezialscanner ein.
Allein auf das Scannen haben sich bereits viele Nationalbibliotheken beschränkt und Zeitungen lediglich digitalisiert. “Aber damit sind die Seiten nur abfotografiert”, gibt Siegfried Peis zu bedenken. Eine Textsuche ist damit noch nicht möglich.
Diesen Schritt ermöglicht erst eine speziell für den Oberurseler Spezialisten geschriebene Software. “In der Softwareentwicklung stecken 25 Mannjahre”, erläutert Peis.

Eine Hürde sei die Layouterkennung gewesen. Denn im Laufe der Jahrzehnte änderten sich die leitenden Prinzipien des Umbruchs mehrfach. Unterschiede gab und gibt es auch zwischen den einzelnen Tageszeitungen, die zu den Kunden der Prepress Systeme GmbH gehören. “Schwierigkeiten gab es speziell beim Schachtelumbruch”, sagt Peis. Dieses Vergehen bei der Seitengestaltung war beim Mindener Tageblatt bis Ende der 1980er-Jahre gebräuchlich, bis 1991 der Blockumbruch Einzug hielt.

In mehreren vollautomatischen Durchläufen analysiert die von PPS eingesetzte Software die eingescannten Texte und ordnet Zeilen und Wörter den jeweiligen Artikeln mit Dachzeile, Titel, Untertitel und Vorspann zu. “Dabei wird auch erkannt, wenn ein Artikel auf der nächsten Seite fortgesetzt wird.”

Mittels einer Suchsoftware können Nutzer später die immense Datenmasse nach den für sie relevanten Begriffen systematisch durchsuchen.

Autor: Jürgen Langenkämper, Lokalredaktion

Schreiben Sie einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

*