Eigene Suchmaschine betreiben mit der Open Source Suchmaschinensoftware Apache Lucene/Solr

von Markus Mandalka ()

Wie kann dank freier Suchmaschinensoftware selbst im Rahmen von Vereinen, Redaktionen, Nichtregierungsorganisationen oder Bildungseinrichtungen eine eigene interne Suchmaschine betrieben werden? Wie können die im Laufe der Zeit wild gewachsenen und in großen Teilen ungeordneten Datenberge (wieder) erschlossen werden, die zudem noch über verschiedenste Systeme, Softwarelösungen und Speicherorte verteilt sind?

Der Open Source Enterprise-Search Suchserver Solr bietet hierfür eine leistungsfähige Basis, die verschiedene Datenquellen von Dokumenten und Dateien auf dem Dateiserver, Datenbanken, Intranet bis zu RSS-Feeds in eine eigene Suchmaschine integrieren und auch sehr große Datenmengen schnell durchsuchen kann.

Doch moderne Suche ist nicht nur Volltextsuche: Wie mensch durch semantische Suche, explorative Suche, facettierte Suche, Tagging und Annotieren mehr rausholen, gezielt filtern, weniger übersehen und letztlich gesuchtes leichter und schneller finden kann.

Dazu gibt es für EinsteigerInnen zum Thema Betrieb eigener Suchmaschinen einen Überblick über freie Suchmaschinensoftware und eine Einführung zu verschiedenen die Suche unterstützenden Methoden und Suchtechnologien wie Facettensuche, semantische Suche, Social Search, Annotation, Ordnungssysteme, Thesauri und Ontologien, Metadaten(verwaltung), Visualisierung und OCR.

Ãœber den Autor Markus Mandalka:

Markus Mandalka arbeitet in Berlin und anderswo als freier Journalist zu Politik, selbstbestimmter Informationstechnik und Datenschutz und als Informatiker mit und an datenschutzfreundlichen IT-Lösungen rund um kollaborative Wissensarbeit, Vernetzung und digitale Kommunikation.