8 april 2020

Taken:

  1. PaQu
    • Dutch Web Corpus invoeren
  2. AlpinoGraph
    • losse koppeling via extensie in PaQu
    • login van PaQu gebruiken
    • voorlopig alleen met globale corpora
    • SPOD: bij sommige query’s: voor welke corpora wel/niet
      • drie query’s niet voor cgn
      • scheidbare werkwoorden en parser succes alleen voor automatische corpora
    • weergave van bomen
      • relaties als labels of als onzichtbare nodes, wat hadden we besloten?
      • relaties als labels zijn nu ruimer opgezet
    • universal dependencies
    • als het resultaat een edge of vertex bevat, dan in resultaat een leesbaardere tabel met attributen
      • altijd uitgeklapt
      • attributen sorteren
      • interne IDs weg
      • bij link: pijl naar links of rechts
    • query in hash voor bookmarking: alleen via button Kopiëren
    • query history
    • zinnen in uitvoer makkelijker selecteren met de muis: padding-left
    • voorbeelden uit tgrep2: bekijken wat omgezet kan worden naar query’s voor AlpinoGraph
      • zie beneden
    • frequentietabellen van (groepen van) woorden en lemma’s
      • dit soort dingen kan ook direct an AgensGraph, zie beneden
    • UD en mwu: alle woorden van mwu geven i.p.v. alleen het eerste
      • aangepaste query: voorbeeld
      • hulpattribuut op het eerste woord
        • dat zou op alle woorden moeten, niet alleen woorden die deel van mwu zijn
        • ook hulpattribuut voor lemma
    • macro’s, bijvoorbeeld woordenlijsten
      • macro’s gemaakt door gebruikers
      • macro’s met parameters
    • door gebruiker gevraagde nabewerking (bijv: alle conjuncten samengevoegd)
    • alle(?) globale corpora uit PaQu invoeren
    • documentatie in markdown
    • veel documentatie nodig, met afbeeldingen, over agensgraph in het algemeen, over structuur van Alpino_ds in agensgraph, en over structuur van hulpattributen
    • snellere file-server
  3. Cypher
    • cyp2ud
    • cyp2alp bijwerken
    • cypher bijwerken
    • cypher-text bijwerken
    • cypher-view bijwerken

Lijst van woorden onder een gezochte node:

select sentid, id, array_to_string(array_agg(word), ' ') as woorden
from (
  match (pp:node{cat:'pp'})-[:rel*]->(w:word)
  return distinct pp.sentid as sentid, pp.id as id, w.end as nummer, w.word as word
  order by sentid, id, nummer
) as foo
group by sentid, id;

Je kunt niet zien of de lijst met woorden aaneensluitend is.


Links:


Uit Blue eyes and porcelain cheeks

In de Appendix staan voorbeelden met /./ waar waarschijnlijk /../ bedoeld wordt?

XPath:

//node[@cat="pp" and @rel="mod"]
  //node[%looksA%]
  /../node[%looksN% or %clothing%]

In AlpinoGraph, niet helemaal hetzelfde omdat de macro %clothing% geen @pos="noun" heeft:

match (adj:word{pos: 'adj'})<-[:rel]-(n)-[:rel]->(noun:word{pos: 'noun'})
match (n)<-[:rel*]-(pp:node{cat: 'pp'})<-[:rel{rel:'mod'}]-()
where ( noun.root in [
-- uiterlijkN
'aangezicht','aanschijn','aanzicht','aanzien','achterste',
'achtersteven','achterwerk','arm','arm_DIM','baard','baard_DIM',
'bakkes','balg','been','been_DIM','beenweefsel','beharing',
'bek','bek_DIM','bibs','bil','bips','borst','borst_DIM','bot',
'buik','buik_DIM','coiffure','coupe','embonpoint','facie',
'fieselefacie','fieselemie','frisuur','fysiognomie','fysionomie',
'gehoororgaan','gelaat','gezicht','gezichtje','haar','haardos',
'haardracht','haarkrul','haarstijl','haar_DIM','heup','hol',
'hoofdhaar','huid','huid_DIM','jukbeen','kaak','kaakbeen',
'kaakbeent_DIM','kaak_DIM','kaaklijn','kaaksbeen','kakebeen',
'kakement','kap','kap_DIM','kapsel','kijkers','kin','kinnebak',
'kin_DIM','knie','knie_DIM','knook','kont','kont_DIM',
'korst_DIM','krul','krul_DIM','kuif','kuif_DIM','kuil_DIM',
'lichaam','lichaam_DIM','lijf','lijf_DIM','lip','lip_DIM',
'lokken','maag','mem','memmen','moel','mond','mond_DIM','muil',
'neus','neus_DIM','neusstuk','oog','ooghaar','oog_DIM',
'oogwimper','oor','oor_DIM','pens','pinkhaar','ponem','poot',
'porem','pram','pruik','reukorgaan','rimpel','rimpeltje',
'schraal','schoonheidsvlek_DIM','smoel','smoelwerk','snoet',
'snor','snorbaard','snorrebaard','snorrenbaard','snorretje',
'snotkoker','snufferd','stelt','taille','tand','tand_DIM',
'tiet','tiet_DIM','toet','toet_DIM','trekken','tronen','tronie',
'uiterlijk','uitloop','vel','voorhoofd','voorhoofd_DIM',
'vrouwenborst','wallen','wangbeen','wenkbrauw','wenkbrauw_DIM',
'wimper','wimper_DIM','zitvlak','streep_DIM','gelaatskleur',
'huidskleur','huidvlek','huidkleur','kleur','kleurtje','lens',
'matheid','onderdeur','pastelkleur','pasteltint','pigment',
'schakering','teint','wirwar',
-- kleding
'sjaal','tas','billentikker','bloes','bloesje','blouse','frak' ,
'halskraag','hemd','hemd_DIM','hoed','hoed_DIM','hoofddeksel',
'hoofddeksel_DIM','jacquet','japon','jas','jasje','jurk',
'jurk_DIM','kledij','kleding','kleren','kraag','kraag_DIM',
'laars','laars_DIM','lijf_DIM','manchet','mouw','mouw_DIM',
'onderhemd','overhemd','overjas','pandjesjas','pijpen','rok',
'rokjas','rok_DIM','schoen','schoen_DIM','schuimkraag','slipjas',
'sok','sok_DIM','trui','trui_DIM','vest','vest_DIM','ketting',
'ketting_DIM','parelketting','parelsnoer','oorbel','shawl',
'sjaal_DIM','tas_DIM'
] or noun.word in [
'espadrilles'
] )
  and
adj.root in [
-- uiterlijkA
'aangenaam','aantrekkelijk','aanzienlijk','aardig','adult',
'afgeleefd','afgemat','afgepeigerd','antiek','antraciet',
'aquamarijn','asachtig','asgrauw','azuren','azuur','bedekt',
'behoorlijk','beige','bekoorlijk','benig','berlijns-blauw',
'best','bevallig','blank','blauw','bleek','blind',
'bloedkoralen','blond','blozend','bont','bontgekleurd',
'bordeaux','breedgebouwd','briljant','bronskleurig','bronzen',
'broodmager','bruin','buikig','caleidoscopisch','chamois',
'charmant','chromaatgeel','chromaatgroen','cinnaber','compact',
'corpulent','crème','degelijk','diamanten','diep','dik','dof',
'dol','donker','donkerbruin','doodsbleek','dun','ecru','effen',
'eigentijds','fel','fijn','fiks','fit','flets','fleurig',
'flink','flinkgebouwd','fluorescent','fluorescerend','fors',
'forsgebouwd','fris','fuchsia','fuchsine','gedateerd','geel',
'geelbruin','geheel','gekleurd','gematteerd','gepareld',
'gespierd','getaand','gezet','gezwollen','glansloos','goud',
'goudbruin','gouden','goudkleurig','grasgroen','grauw',
'grauwbruin','grijs','grijsbruin','grijsgroen','grijsharig',
'grijswit','groen','groenbruin','groengeel','grofgebouwd',
'groot','gulden','hard','hardblauw','heel','heerlijk','heet',
'hel','helblauw','helder','hemelsblauw','heterogeen',
'honinggeel','hoog','hups','ijzeren','ijzersterk','indigo',
'inkt','ivoor','jong','kaal','kaalhoofdig','karmijn',
'karmozijn','kastanjebruin','kastanjekleurig','keihard',
'klassiek','klein','kleurig','knalblauw','knap','knokig',
'kobalt','koperachtig','koperen','koperkleurig','koraalrood',
'koralen','kort','koud','krachtig','krijtwit','lam','lang',
'lazuren','lazuur','lekker','lelijk','leuk','licht',
'lichtblond','lichtbruin','lichtgebouwd','lichtgekleurd',
'lieftallig','lijkbleek','lijkkleur','lijkwit','lijvig','lomp',
'luchtig','luimig','mager','mat','matig','mauve','modern',
'monochroom','mooi','muisgrijs','net','neutraal','nieuw',
'nieuwerwets','oker','olijfachtig','olijfgroen','omvangrijk',
'onaanzienlijk','ondoorzichtig','onesthetisch','ongebleekt',
'onooglijk','onzacht','onzuiver','oranje','oranjerood','oud',
'oudbakken','ouderwets','paarlen','paars','parelen','parelgrijs',
'parelvormig','pastel','perzik','pips','plezant','plomp',
'poederachtig','polychroom','potig','prettig','psychedelisch',
'puik','purper','purperblauw','reebruin','reseda','robuust',
'roestbruin','roestig','roestkleurig','romig','rood','roodbruin',
'roodharig','roodwangig','roomkleurig','roomwit','rosharig',
'rossig','roze','rozenrood','rozerood','rozig','ruig','ruw',
'saffier','saffierblauw','saffieren','saffraangeel','scharlaken',
'schel','schilderachtig','schimmelkleurig','schoon' ,'sepia',
'slank','slap','smaragd','spichtig','sportief','sprekend',
'sprietig','staalhard','steenhard','steenkolenzwart',
'steenkoolzwart','steil','stemmig','sterk','stevig','stijf',
'strak','strogeel','taankleurig','tache de beauté','teer',
'tekenachtig','tenger','tint','topaas','turkoois','turquoise',
'ultramarijn','vaal','vaalbruin','vaalgeel','vaalgrijs',
'vaalwit','valig','veelkleurig','verdord','vermiljoen',
'verouderd','verschoten','verzorgd','vet','vierkant',
'vijftigjarig','violet','vlasblond','vlek','vlinderachtig',
'vlot','vol','volumineus','volwassen','vormloos','vuilwit',
'warm','wasachtig','wasbleek','waterachtig','waterig','wild',
'wit','woest','wuft','zacht','zeegroen','zilverachtig',
'zilveren','zilverkleurig','zilverwit','zwaar','zwaargebouwd',
'zwaargeschapen','zwaarlijvig','zwart'
]
return adj, noun
alpinograph cypher paqu