Jelmer J. Toering (2006)
Website usability en Latent Semantic Analysis
Ontwikkeling van LSA Tools t.b.v. website usability
Master's thesis, Rijksuniversiteit Groningen.
[ Paper (PDF, 576 kb) ]

Samenvatting

Sinds het ontstaan van het `world wide web' heeft de gebruikersvriendelijkheid van dit medium steeds meer aandacht gekregen. Vooral de navigatie op websites die door de bezoekers wordt gebruikt om naar de informatie die bij hun doel.

Een methode die veel wordt gebruikt om usability tests uit te voeren voor de interfaces van software is de Cognitive Walkthrough. Deze test wordt uitgevoerd door een expert en is ontworpen om te achterhalen welke problemen een gebruiker ondervindt als hij een bepaald doel middels een interface wil bereiken. Een afgeleide van deze methode is ontwikkeld om usability problemen op websites te identificeren en op te lossen. Deze methode is gericht op de talige kant van website navigatie. Een probleem dat bijvoorbeeld met deze methode wordt geīdentificeerd is bijvoorbeeld of bepaalde woorden waarop moet worden geklikt (link-labels) wel qua betekenis genoeg overeenkomen met de tekst waarnaar wordt verwezen. Om een zinnige uitspraak te doen over deze `semantische overeenkomst' wordt gebruikt gemaakt van LSA.

LSA is een acroniem voor Latent Semantic Analysis en is een methode die wordt gebruikt om de semantische afstanden tussen teksteenheden (woorden, zinnen, paragrafen) vast te stellen. Deze afstanden worden berekend op basis van de `co-occurrences' van woorden in een corpus (een verzameling teksten).

Omdat er weinig software beschikbaar is om met LSA te werken en de beschikbare software belangrijke beperkingen kent, worden in deze scriptie de LSA-tools gepresenteerd. De LSA-tools is een verzameling scripts dat kan worden gebruikt om semantische afstanden tussen teksteenheden te berekenen. Belangrijke voordelen van de LSA-scripts zijn dat men zelf een corpus samen kan stellen bestaande uit teksten in een willekeurige taal. Verder kunnen zowel het corpus als de semantische afstanden worden opgeslagen in een MySql database, zodat deze informatie op een later moment nog steeds beschikbaar is. Verder zijn de scripts geschreven in de taal PHP, een scripttaal die zeer gangbaar is onder webprogrammeurs.