|
Teil
des Projektes ist die Erstellung von digitalen Versionen möglichst
vieler der (physischen) Bildkarten. Um sowohl eine große Zahl von
Bildkarten als auch ein hohes Maß an Qualität zu erreichen,
musste ein Prozeß entworfen werden, der den Umgang mit den verschiedenen
Informationsquellen ermöglicht.
Zur Zeit enthält der Bildindex ca. 300.000 (physische) Bild- und
Buchkarten. Die (digitalen) Karten enthalten textuelle Information über
das referenzierte Dokument (Bild, Buch, etc.) und bieten eine Vorschaumöglichkeit
(verkleinertes Bild, Inhaltsangabe eines Textes, etc.). Die Daten für
eine Karte werden aus verschiedenen Informationsquellen zusammengetragen:
-
Die (physischen) Bildkarten enthalten textuelle Information und Kontaktabzüge
(im Falle von Bildern). Sie sind die erste Quelle für Information,
die in die WEL aufgenommen wird.
-
Einige Diapositive und Photonegative, von denen die Kontaktabzüge
hergestellt wurden, sind noch vorhanden. Sie stellen eine bessere Grundlage
zum Digitalisieren als die Abzüge dar.
-
Einige Vorarbeiten, um die Information elektronisch verfügbar zu machen,
wurden bisher geleistet (in anderen Projekten). In erster Linie betrifft
dies das Scannen von Bildern. Die Daten aus älteren Projekten werden
in die WEL integriert.
-
Weltweit wird sehr viel Arbeit in Bibliographien und Bildarchive investiert.
Es ist geplant, einige davon für die WEL verfügbar zu machen.
Mit dem Zusammentragen der Daten aus den Informationsquellen sind viele
Probleme verbunden:
-
Die Information auf den (physischen) Bildkarten ist in handschriftlicher
Form notiert und folgt keinem festen Schema. Dadurch ist eine automatische
Texterkennung (OCR) unmöglich.
-
Die (physischen) Bildkarten haben sich im Laufe der Zeit abgenutzt. Deshalb
kann kein Scanner mit automatischen Vorlagentransport eingesetzt werden,
um komplette Karten zu scannen.
-
Die Kontaktabzüge sind unterschiedlich in Größe, Farbigkeit
und Qualität. Die Plazierung auf der Bildkarte ist stark unterschiedlich
(manchmal sogar auf der Rückseite der Karte). Einige von ihnen können
benutzt werden, um Vorschaubilder zu erzeugen.
-
Die Information auf den (physischen) Bildkarten ist oft unvollständig
und manchmal veraltet. Um die Qualität der Information zu verbessern,
ist zusätzliche Recherche nötig.
Einige Scan-Technologien wurden evaluiert. Die Rahmenbedingungen, die die
(physischen) Bildkarten schaffen, führten zu folgenden Entscheidungen:
-
Die textuelle Information wird manuell erfasst. Ein Software-Werkzeug,
das den Wissenschaftler dabei unterstützt, wurde dafür entwickelt.
-
Die Kontaktabzüge werden photographisch reproduziert, und die hergestellten
Dias werden gescannt. Letzteres kann halbautomatisch geschehen. Bildverbessernde
Massnahmen werden manuell erledigt.
|