

Angesichts der jährlich steigenden Zahl elektronischer Dokumente testet die ZBW ein Verfahren zur automatischen inhaltlichen Erschließung mit dem Vokabular und der Fachsystematik des Standard-Thesaurus Wirtschaft (STW).
In der ersten Projektphase wird der MindServer Categorizer mit digitalen Volltexten trainiert, die bereits intellektuell inhaltlich erschlossen wurden. Die auf der patentierten CORE-Technologie basierende Lösung analysiert anhand dieser Trainingsdaten inhaltliche Kontexte und ist anschließend in der Lage, Inhalte von Dokumenten zu „verstehen“ und auf menschlichem Qualitätsniveau zu verschlagworten und in das Kategoriensystem des STW einzuordnen.
In einer zweiten Projektphase werden dann halbautomatische Indexierungsverfahren erprobt, bei denen die maschinell erstellten Vorschläge zur Inhaltserschließung noch manuell bestätigt oder ggf. korrigiert werden. In dieser Projektphase erfolgt ein weiteres Training des Systems parallel zum laufenden Geschäftsablauf.