Zet woorden met speciale tekens tussen dubbele aanhalingstekens
"Type(A)" = "Eerste category"
Vergelijkingen
temperature > 20
temperature >= 20
temperature < 20
temperature <= 20
Dit doet niet wat je verwacht als een zin meerdere waardes kan hebben voor een meta-attribuut
hits >= 10 & hits <= 20
Zo zoek je naar een waarde tussen 10 en 20, inclusief
hits in 10 20
Zoeken zonder onderscheid van hoofdletters en kleine letters, en met SQL-jokers % en _
name % jan
name % j_n
name % "jan%"
Zoeken met een reguliere expressie
name ~ [Jj]anss?ens?
Zoeken naar een ontbrekende waarde
name = nil
Zoeken naar de naam nil
name = "nil"
`word` = "geen" AND `hlemma` IN ("geld", "belasting_geld") AND `rel` = "det"
Volgens de huidige regelgeving kan een school op de volgende manieren legaal alcohol schenken : · Als het feestcomité besluit dat het feest besloten is ( dus alleen genodigden ) en er wordt geengeld gevraagd voor de alcohol ( ook niet indirect via entree ) , dan gelden op dit feest dezelfde regels als thuis .
✤
De tabel bestaat uit twee delen. Het linkerdeel,
per item, geeft het aantal matches per metadata-waarde. Dit
is het totaal aantal matches in het corpus, en dat
kan soms hoger zijn dan het aantal matchende zinnen
omdat er soms binnen één zin twee of meer matches zijn.
De rechterdeel, per zin, geeft het aantal zinnen waarin een
match gevonden is. Dit aantal staat in de eerste kolom.
De tweede kolom binnen de tabel per zin geeft aan wat
de relatieve frequentie is voor deze metadata-waarde.
Dit is het aantal hits per n zinnen waarbij n
bijvoorbeeld 10 000 of 100 000 is (afhankelijk van de
grootte van het corpus).
Voorbeeld, sekse per zin:
aantal
per 10 000
waarde
36
40
female
30
50
male
In dit voorbeeld zijn er meer zinnen die matchen voor
vrouwelijke sprekers, dan voor mannelijke sprekers.
Stel dat in het complete corpus meer zinnen van vrouwelijke sprekers zijn opgenomen, dan van mannen:
totaal
waarde
9 000
female
6 000
male
Alleen al op basis hiervan zou je meer matches van vrouwen dan van mannen verwachten. De tweede kolom compenseert hiervoor.
De telling van matches genormaliseerd over tienduizend zinnen geeft voor
vrouwen 36 / 9 000 × 10 000 = 40, en voor mannen 30 / 6 000 × 10 000 = 50.
Dus, absoluut zijn er meer treffers voor vrouwen, maar relatief zijn er meer treffers voor mannen.