Volltextsuche Konfiguration

Allegra kann Vorgänge und deren Anhänge in den Formaten PDF, OpenOffice, Word, Excel, PowerPoint, HTML, RTF und XML nach Texten durchsuchen. Diese Suche muss konfiguriert werden.

Sie können die Volltextsuche aktivieren oder deaktivieren. Volltextsuche erfordert Speicherplatz auf der Festplatte, besonders wenn viele große Anhänge indiziert werden müssen. Die rechnerische Belastung der Indizierung kann groß sein, wenn ein vollständiger Re-Index während des Systemstarts erzwungen wird.

Sie können die Indizierung von Anlagen aktivieren oder deaktivieren. Das Deaktivieren ist sinnvoll, wenn Sie nur begrenzten Speicherplatz zur Verfügung haben oder die Berechnungslast des Servers reduzieren möchten.

Wir empfehlen, die Indexierung der Anlagen freizugeben.

Wenn dieses Kontrollkästchen aktiviert ist, wird während des Systemstarts ein vollständiger Index von Grund auf neu durchgeführt. Dies kann einige Zeit (Minuten bis Stunden) dauern, abhängig von der Anzahl der Vorgänge und Anhänge in der Datenbank. Während der Indizierungsprozedur funktioniert die Volltextsuche nicht.

Es wird empfohlen, bei jedem Server-Start nicht einen automatischen Neustart durchzuführen. Es genügt in der Regel, jedes halbe Jahr oder so ein Reindex zu machen. Es ist am besten, den Zugriff auf das System während des Reindex-Prozesses zu deaktivieren.

Allegra nutzt die Lucene Volltext-Indizierung und Abfrage-Engine. Beim Aufbau des Index ist es in der Regel nützlich, Wörter zu ignorieren, die man in der Regel nicht sucht und die häufigauftreten. Zum Beispiel gibt es in der deutschen Sprache Wörter wie „ein“, „der, die das“, „^auch“, „aber“ und so weiter. Diese Wörter sollten nicht indiziert werden.

Zu diesem Zweck gibt es verschiedene Analysatoren, die die Indexierung auf jene Textteile, die wirklich nützlich sind, konzentrieren. Dies hängt jedoch von der Sprache des Textes ab, der indiziert wird.

Hier können Sie den Analysator auswählen, der Ihren Anforderungen am besten entspricht. Der Standardanalysator ist nicht so effizient wie ein sprachspezifischer Analysator, sollte aber in allen Fällen funktionieren. Wenn Sie Texte und Anhänge in verschiedenen Sprachen haben, ist der Standardanalysator die beste Lösung.