onsdag, mars 28, 2007

Återigen på tal om boktäverna Å, Ä och Ö och sökmotorer

I ett tidigare inlägg kallat Google och Å, Ä, Ö - En mycket liten och kortfattad observation visade jag att en om man söker på ordet tettå får man fram ett sökresultat med orden tettaa. Google tolkar alltså å och aa som samma bokstav.
Nu har jag haft lite tid över och även testat på sökmotorerna Yahoo, Sesam och MSN Live Search.

Resultatet blev följande:
Söresuktaten på Yahoo och Sesam visade enbart sidor med den exakta frasen tettå (vilket inte var många).

MSN Live Search däremot gav en resultatlista som tyder på att a och å tolkas som samma bokstav. En sökning på tettå gav alltså en resultatlista som innehöll tetta.

tisdag, mars 20, 2007

Verktyg för att lista utgående länkar

Ett nytt användbart verktyg för att lista utgående länkar från en domän såg igår ljuset. Verktyget finns här:
Domain Outbound Links Check

Man kan också välja att sortera bort eller märka länkar med attributet rel=”nofollow”.

Verktyget är användbart om man t ex vill kolla vilka sidor man länkar till och om man länkar till dem med eller utan attributet rel=”nofollow”. Det händer ju att man glömmer att ta bort en länk vid t ex inaktualitet, avbrutet länkbyte mm.

Verktyget är fortfarande under utveckling och jag hoppas på att många fler funktioner för att kontrollera utgående länkar läggs till. Bland annat skulle det vara ännu mer användbart om man kunde kolla brutna länkar (för att kunna korrigera) och att kunna söka igenom mer än 1000 sidor.

måndag, mars 19, 2007

linedance teneriffa - Konstigt sökresultatsfenomen på Sesam

Såg att någon sökt på orden: linedance teneriffa på Sesam. Bland sökresultaten dyker en av mina gamla arbetsprojektdomäner upp (som under ca 8 månader varit 301-redirectad till en annan av mina domäner.

http://www.sesam.se/search/?q=linedance+teneriffa&c=d

Den sida som visas har dock aldrig existerat på min domän och resultat dyker inte upp (vad jag kan se) på Google, Yahoo eller MSN.

Bland sökresutaten finns det ytterligare några sidor på andra domäner som har samma text (texten som visas på Sesam), men denna sida exsisterar inte heller på deras sajter.

Sidansnamn publiceras som Blog och texten som följer är:
Citat:
...underbar 80 års vecka på Teneriffa och ge gubben din en kram...bråttom ety hon rymmer till Teneriffa i morgon !!! Inom snar framtid...kadriljen och i Amerika kallad linedance). Kadrill dansades i både...gå in och kolla vädret på Teneriffa. Kg är ff kvar på sjukhuset...



Jag kontaktade Sesam gällande detta och fick svaret att de gissar på att det är ett indexfel från deras håll och att frågan har skickats vidare till deras tekniker.

söndag, mars 18, 2007

En undersökning av Googles besöksfrekvens & uppdatering av cache

Jag gjorde en undersökning som som sökte svaret på om Google besöker och cachar sidor oftare om sidan uppdateras/förändras oftare?
Jag samlade in data under 103 dagar som jag sedan sammanställde i en rapport.

Det jag kunde bekräfta med hjälp av undersökningen var:
1. Google besöker och uppdaterar cachen för en sida mer frekvent om sidan uppdateras/förändras.
2. Webbplatskartans tidstämpel har obetydlig eller ingen inverkan på hur ofta Google besöker förstasidan.
3. Det finns en viss fördröjning innan Google slutar besöka en sida ofta när en sida slutar att förändras/uppdateras.
4. Det går att simulera en förändring på en sida för att Google ska besöka och uppdatera cachen av sidan oftare.

Hela undersökningen kan läsas, diskuteras och laddas ner i pdf-format här:
Googles besöksfrekvens & uppdatering av cache

Google och Å, Ä, Ö - En mycket liten och kortfattad observation

Detta är inget nytt, utan enbart en lite observation jag gjorde i studiesyfte. En hel del som jobbar med webbutveckling känner till att bland annat Google läser AA som Å, AE som Ä och OE som Ö. Vilket många gånger används när man skriver om URLer i sökmotoroptimeringssyfte.
Här är ett litet bildbevis på att Google tolkar AA och Å lika.
Sök till exempel på termen tettå och du får upp resultat för tettaa i resultatlisan.