Eigene Suchmaschine betreiben mit der Open Source Suchmaschinensoftware Apache Lucene/Solr

von Markus Mandalka ()

Wie kann dank freier Suchmaschinensoftware selbst im Rahmen von Vereinen, Redaktionen, Nichtregierungsorganisationen oder Bildungseinrichtungen eine eigene interne Suchmaschine betrieben werden? Wie knnen die im Laufe der Zeit wild gewachsenen und in groen Teilen ungeordneten Datenberge (wieder) erschlossen werden, die zudem noch ber verschiedenste Systeme, Softwarelsungen und Speicherorte verteilt sind?

Der Open Source Enterprise-Search Suchserver Solr bietet hierfr eine leistungsfhige Basis, die verschiedene Datenquellen von Dokumenten und Dateien auf dem Dateiserver, Datenbanken, Intranet bis zu RSS-Feeds in eine eigene Suchmaschine integrieren und auch sehr groe Datenmengen schnell durchsuchen kann.

Doch moderne Suche ist nicht nur Volltextsuche: Wie mensch durch semantische Suche, explorative Suche, facettierte Suche, Tagging und Annotieren mehr rausholen, gezielt filtern, weniger bersehen und letztlich gesuchtes leichter und schneller finden kann.

Dazu gibt es fr EinsteigerInnen zum Thema Betrieb eigener Suchmaschinen einen berblick ber freie Suchmaschinensoftware und eine Einfhrung zu verschiedenen die Suche untersttzenden Methoden und Suchtechnologien wie Facettensuche, semantische Suche, Social Search, Annotation, Ordnungssysteme, Thesauri und Ontologien, Metadaten(verwaltung), Visualisierung und OCR.

Über den Autor Markus Mandalka:

Markus Mandalka arbeitet in Berlin und anderswo als freier Journalist zu Politik, selbstbestimmter Informationstechnik und Datenschutz und als Informatiker mit und an datenschutzfreundlichen IT-Lsungen rund um kollaborative Wissensarbeit, Vernetzung und digitale Kommunikation.