Überblick - Erfassen der Bildkarten Inhaltsverzeichnisvorherige Seitenächste Seite
   
 

Teil des Projektes ist die Erstellung von digitalen Versionen möglichst vieler der (physischen) Bildkarten. Um sowohl eine große Zahl von Bildkarten als auch ein hohes Maß an Qualität zu erreichen, musste ein Prozeß entworfen werden, der den Umgang mit den verschiedenen Informationsquellen ermöglicht.

Zur Zeit enthält der Bildindex ca. 300.000 (physische) Bild- und Buchkarten. Die (digitalen) Karten enthalten textuelle Information über das referenzierte Dokument (Bild, Buch, etc.) und bieten eine Vorschaumöglichkeit (verkleinertes Bild, Inhaltsangabe eines Textes, etc.). Die Daten für eine Karte werden aus verschiedenen Informationsquellen zusammengetragen:

  • Die (physischen) Bildkarten enthalten textuelle Information und Kontaktabzüge (im Falle von Bildern). Sie sind die erste Quelle für Information, die in die WEL aufgenommen wird.
  • Einige Diapositive und Photonegative, von denen die Kontaktabzüge hergestellt wurden, sind noch vorhanden. Sie stellen eine bessere Grundlage zum Digitalisieren als die Abzüge dar.
  • Einige Vorarbeiten, um die Information elektronisch verfügbar zu machen, wurden bisher geleistet (in anderen Projekten). In erster Linie betrifft dies das Scannen von Bildern. Die Daten aus älteren Projekten werden in die WEL integriert.
  • Weltweit wird sehr viel Arbeit in Bibliographien und Bildarchive investiert. Es ist geplant, einige davon für die WEL verfügbar zu machen.

Mit dem Zusammentragen der Daten aus den Informationsquellen sind viele Probleme verbunden:

  • Die Information auf den (physischen) Bildkarten ist in handschriftlicher Form notiert und folgt keinem festen Schema. Dadurch ist eine automatische Texterkennung (OCR) unmöglich.
  • Die (physischen) Bildkarten haben sich im Laufe der Zeit abgenutzt. Deshalb kann kein Scanner mit automatischen Vorlagentransport eingesetzt werden, um komplette Karten zu scannen.
  • Die Kontaktabzüge sind unterschiedlich in Größe, Farbigkeit und Qualität. Die Plazierung auf der Bildkarte ist stark unterschiedlich (manchmal sogar auf der Rückseite der Karte). Einige von ihnen können benutzt werden, um Vorschaubilder zu erzeugen.
  • Die Information auf den (physischen) Bildkarten ist oft unvollständig und manchmal veraltet. Um die Qualität der Information zu verbessern, ist zusätzliche Recherche nötig.

Einige Scan-Technologien wurden evaluiert. Die Rahmenbedingungen, die die (physischen) Bildkarten schaffen, führten zu folgenden Entscheidungen:

  • Die textuelle Information wird manuell erfasst. Ein Software-Werkzeug, das den Wissenschaftler dabei unterstützt, wurde dafür entwickelt.
  • Die Kontaktabzüge werden photographisch reproduziert, und die hergestellten Dias werden gescannt. Letzteres kann halbautomatisch geschehen. Bildverbessernde Massnahmen werden manuell erledigt.
 

überblick | projektpartner | präsentationen
veröffentlichungen | querverweise | projekte
Software Systems Institute Welmaster