Sjors de Valk (2007)
Nederwaartse wateren doorkruist
De ontwikkeling van een applicatie voor het analyseren van sentiment
Master's thesis, Rijksuniversiteit Groningen.
[ Paper (PDF, 697 kb) ]

Samenvatting

Sentiment analysis probeert de houding van een auteur van een tekst vast te stellen. Uit deze houding blijkt of de auteur positief of negatief over een bepaalde zaak schrijft. Deze scriptie concentreert zich op polaire woorden. Polaire woorden zijn primaire indicators van sentiment in teksten. Toch is het de vraag in hoeverre polaire woorden geschikt zijn om sentiment te identificeren. Of vertaald naar de vraagstelling van de scriptie: "Kunnen polaire woorden duidelijk maken wat de houding van een auteur is over een bepaald onderwerp?".

Ter beantwoording van deze vraagstelling is Styx ontwikkeld, een applicatie voor het analyseren van sentiment. De applicatie maakt het mogelijk om een corpus met teksten te compileren en te doorzoeken met een bepaald onderwerp. De polaire woorden in de omgeving van dit onderwerp worden aansluitend geëxtraheerd. Daarnaast worden zogenaamde contexttermen verwerkt - betekenisvolle termen, zoals zelfstandig naamwoorden, die onthullen wat het verband is tussen de gevonden polaire woorden en het onderwerp. Het doel van deze operaties is om inzichtelijk te maken of auteurs zich positief of negatief over het onderwerp uitlaten en in welke context dat gebeurt.

Om te onderzoeken in welke mate aan dit doel kan worden beantwoord, is Styx aangewend voor een historisch experiment. Voor het experiment zijn toespraken van Amerikaanse presidenten doorzocht met onderwerp ‘Rusland‘. Tijdens dit proces zijn antwoorden gezocht op vragen als "Welke trends zijn er zichtbaar in de polaire woorden die naar Rusland verwijzen?" en "Komen de woorden overeen met historische gebeurtenissen?".