Åpen Kildekode-basert søk får et stadig økt momentum. Først hadde du Lucene (2001), som ga kraftig søk for programmerere. Så fikk vi Solr (2006) som gjorde søk tilgjengelig for ikke-programmerere, men fortsatt behov for et visst nivå med ekspertise. Og så kom Constellio, en åpen kildekode / fri programvare (GPL) bedrifts-søkemotor distribusjon (distro) bygget på Solr, men med et pent GUI, innholds-connectorer, web-crawling støtte og mer.
Hva sa du sa du? En Solr distro?
Jeg kaller det “distro” fordi jeg liker å sammenligne evolusjonen med hva vi har sett innenfor GNU/Linux. Først hadde vi Linux-kjernen. Så fikk vi GNU-verktøyene som gjorde Linux brukbar til noe, men fortsatt kun for ingeniører som er komfortable med kommando-linjen. Og så begynte firmaer som RedHat, Suse o.l. å bygge komplette distoer inkludert moderne GUI, ut-av-boksen verktøy som OpenOffice, Thunderbird og mer. Uten disse disroene ville Linux bare vært en kjerne, og overlatt til brukeren å legge til alle verktøyene og sukkeret rundt.
Jeg tør påstå at det samme er i ferd med å skje med åpen kildekode-basert søk. Det er flere firmaer der ute allerede som har sin egen proprietære Apache Solr/Lucene baserte “distro”, men Constellio er den første sluppet som åpen kildekode så langt jeg har sett.
Hvis du kjenner Solr, vil du føle deg hjemme i ./constellio/tomcat/webapps/constellio/WEB-INF/solrcores/<your_core> der du finner skjema, solrconfig etc. Men jeg mistenker at mannuelle endringer du gjør her blir overskrevet av endringer gjort i GUI.
Låner fra Google Search Appliance
Skaperne av Constellio har gjort en ganske bra jobb med denne første 1.0 versjonen. Enkel installasjon, pent admin GUI, enkelt å starte crawling etc. Og de har vært frekke/modige nok til å rappe Google’s åpen kildekode innholds-connectorer for GSA, som er tilgjengelig på Google Code, isteden for å gå for ManifoldCF fra Apache eller et annet connector-rammeverk. De integrerer også Google OneBox APIet, dvs at brukere kan plugge inn alle de smarte “widgets” som f.eks. kan vise en aksjekurs dersom spørringen er identifisert som en børs-ticker. Kjekt! Vedder på at Google ikke forventet at rammeverket deres skulle bli brukt utenfor GSA…
Så hva er haken?
En ting er at det er GPL (v3), noe som betyr at visse potensielle brukere ekskluderes fra starten (med mindre de har en dobbel lisensiering i ermet?). Du må registrere deg på siden for å laste ned, dvs. at du antakelig blir kontaktet av en salgsperson på et eller annet tidspunkt – ikke noe problem i og for seg. Det er fri programvare og kildekoden er tilgjengelig, men den er ikke utviklet av et fellesskap på en åpen måte. Du kan laste ned koden som en zip fil, men hvis du endrer i den, hvem skal da vedlikeholde dine endringer? Antakelig deg selv…
Heldigvis er det ingen begrensning på antall dokumenter du kan indeksere eller QPS raten. Dermed er Constellio en sann fri (gratis) løsning, noe som ikke kan sies om den svake MS Search Server Express eller den gamle og begrensede Omnifind Yahoo! edition. Å være fri™ kan være grunn god nok til å gi verdi til mange som ellers ville måttet betale konsulenter for å få opp en løsning fra scratch basert på individuelle komponenter.
Constellio sin forretningsmodell er å leve av support og konsulent-honorarer, og det kan meget vel fungere. Men jeg kan ikke helt se hvordan de vi være i stand til å skape et sant åpent utviklings-fellesskap rundt produktet sitt, og på grunn av det tror jeg dette vil forbli en disto uten den helt store utbredelsen.
Irritasjonsmomenter
Det er tydelig at dette er en tidlig versjon 1.0. Hvis det var et ASF prosjekt ville den sannsynligvis hatt versjons nummer 0.x. Noen småfeil: Opplasting av ny logo fungerer ikke. Den identifiserer mine norske websider som Dansk, og den kræsjert en gang (se bilder). Men lykke til til leverandøren med å lage dette til en model Solr distro!
Skjermbilder