Snabbhet grunden, metadata förfiningen när VG-regionen skapade sökmotor

Varför säger folk att de vill att sökmotorn ska fungera som Google? Den frågan ställde sig Västra Götalandsregionen inför arbetet med sin nyss beta-lanserade sökmotor. Svaret de kom fram till: snabbheten, begränsad fakta kring en enskild träff – men inte den enkla resultatsidan med bara 10 länkar.

Regionens grundkrav var att hitta en sökfunktion med bra prestanda där det var möjligt att fullt ut bestämma användargränssnittet. Valet föll på open source-lösningen Solr och idag är sökmotorn i drift på intranätet. Den kommer också att användas externt.

Men viktigare än tekniken var givetvis arbetet med att ta reda på vad användarna krävde av en sökmotor. Föga förvånande var svaret ”den ska vara som Google”, vilket alla som arbetat med en sökmotor de senaste åren har hört. Många gånger.

Snabbhet underskattad nytta

Kanske något mer förvånande var vilka slutsatser regionens projektgrupp drog. Jag pratade med Kristian Norling (LinkedIn, Twitter) på regionens IT-strategiska avdelning och han berättar så här om deras tolkning av Google-jämförelsen.

Man menar två saker. För det första ett sökresultat som är ganska komprimerat med begränsad metadata. Sen menar användarna också att sökmotorn ska vara snabb men det säger de aldrig spontant.

Just snabbheten blev alltså prioriterad. Västra Götalandsregionens sökmotor svarar på mellan 0,1-0,2 sekunder. En vanlig Google-sökning tar cirka 0,2 sekunder och det är nära den gräns som Jakob Nielsen menar att användaren uppfattar som ett omedelbart svar (0,1 sekunder).

Exempel på ämnessökning
Exempel på ämnessökning

Resultaten presenterar vi så likt Google som möjligt förutom att vi lägger till författaren. Det är relevant i en stor organisation. Sen fick behovsanalysen styra och den säger uttryckligen att man vill kunna filtrera bort innehåll som är irrelevant, säger Kristian Norling.

Kontext och person viktiga dimensioner

Den stora synliga skillnaden gentemot de sökmotorer vi vant oss vid är mycket riktigt de filter som erbjuds användaren. Det handlar om

  • informationstyp
  • var dokumentet finns
  • var det passar in organisatoriskt
  • vilken typ av källa det är
  • senast ändrat
  • vem som är författare
  • vilket format det är publicerat i
  • vilka nyckelord som skapats.
Exempel på personssökning
Exempel på personssökning

Författaren är alltså viktig, liksom andra personer. Den enda relevansjustering som regionen gjort av sökmotorns grundinställning är att de höjt betydelsen för personer.

Vi försöker i sökresultaten skapa kontexten Ämne > Person > Kontaktuppgifter, säger Kristian.

Metadata: Allt från kontrollerade begrepp till etiketter

Tidigare försök att strukturerat arbeta med metadata inom regionen har misslyckats. Det jobb som redaktörerna gjorde syntes aldrig för dem. Så även om det gav effekt rann arbetet ut i sanden.

Nu är målet att visa hur metadatan används för att därigenom stärka arbetet med det och ytterst förbättra sökresultaten. Men först måste innehållet gallras. Kristian Norling räknar med att hälften av innehållet kommer att tas bort och därefter påbörjas det verkliga arbetet med metadata.

Förutom den systemstyrda metadatan – där Dublin Core är minimum – har regionen kompletterat sökmotorn med en metadatatjänst. Den gör två saker:

  • Analyserar textinnehållet, jämför det med en taxonomi och ger förslag på nyckelord som redaktören väljer från.
  • Ger redaktören möjlighet att fritt lägga till nyckelord.

Dessutom kommer användarna, alltså inte bara redaktörerna, att få lägga till etiketter. Dessa kommer att jämföras med två listor. Om de finns i ”whitelist” publiceras de direkt, om de finns i ”blacklist” raderas de. De ord som faller mellan dessa två listor ska granskas manuellt innan de syns och ger effekt.

Detta ger oss möjlighet att sätta olika relevans på olika typer av ord. Vi kan till exempel sätta högre relevans på den kontrollerade begreppsvärlden än på användarnas etiketter – eller tvärtom, säger Kristian Norling.

En reflektion, som också är Kristians egen, är hur lite av arbetet som egentligen handlar om teknik. Snabbheten, visst, men i övrigt var det egentligen frihet att anpassa efter de egna kraven som var viktigast för regionen.

Apropå Västra Götalandsregionens val att skaffa en Open Source-sökmotor — de väljer ofta att arbeta med just öppen källkod och delar med sig av sitt arbete i samma anda.

7 kommentarer

  1. Mycket intressant inlägg! Jag har själv ofta fått kommentarer om sökmotorer på webbplatser och intranät att de ”ska vara som Google”. Hade varit ett kanonverktyg, om det varit .Net.

    Känner du till om det finns bra .Net-alterntiv?

    Tack på förhand!
    / Per

  2. Hej Fredrik!
    Roligt att du skrev om den söklösning som vi har tagit fram tillsammans med Västra Götalandsregionen. Läs gärna mer om lösningen hos oss: http://www.findwise.se/blog/how-to-create-better-search-vgr-leads-the-way.

    Per: Apache Solr är programspråksagnostiskt i och med att man kan göra sökningar via en http- tjänst som returnerar XML. Det finns även .NET api, det ligger inte inom Apache men kan ändå vara värt en titt. http://code.google.com/p/solrnet/ .

Kommentarer är stängda.

Upptäck mer från Webbrådgivaren Fredrik Wackå

Prenumerera nu för att fortsätta läsa och få tillgång till hela arkivet.

Fortsätt läsa