Wissensmanagement in der Architekturarbeit, Teil 4
Table of Contents 1. Eine Volltextsuchmaschine mit Recoll einrichten 1.1. Suchoptionen 1.2. Exkurs: PDFs ohne Text mit OCR durchsuchbar machen 1. Eine Volltextsuchmaschine mit Recoll einrichten Eines der häufigsten Probleme mit organisch gewachsenen Dokumentenstrukturen ist es, Daten wiederzufinden. Die Fragestellung ist hier, wie finde ich Dokumente, die eine bestimmte Zeichenkette enthalten?
Dafür gibt es verschiedene Lösungsmöglichkeiten. Das Kommandozeilenwerkzeug ´pdfgrep´ ist in der Lage, durch PDF-Dateien zu greppen und liefert so das entsprechende Dokument und die Funstelle im Dokument zurück. Es ist aber nicht in der Lage z.B. durch Word, Excel oder Powerpoint-Dokumente zu suchen.