[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. Functioneringsgesprek over twee weken
  2. PaQu

    • ❏ Docker op MacOS
    • ❏ Metadata in FoLiA
      • pqfolia (=folia2paqu)

        • ✔ native metadata
        • ❏ documentatie/voorbeelden
        • ? annotations

      • pqserve → zie: http://www.let.rug.nl/alfa/paqu/folia

        • → voorbeelddata: /net/aistaff/kleiweg/paqu/tmp/foliatool

        • ✔ na actie: pagina laden met anchor op plaats van de knop die was geklikt
        • ✔ weg: Uitvoer, Label voor invoerbestand, Prefix van delen van het path van het invoerbestand
        • ✔ weg: Run & download

        • ✔ Na invoer/edit metadata het item automatisch aankruisen (als naam en xpath beide niet leeg zijn) of demarkeren (als naam of xpath leeg zijn)
        • ✔ Bij save/test: items die niet compleet zijn demarkeren (geen naam en/of xpath)
        • ✔ Run & invoer in PaQu → Invoeren in PaQu

          • ✔ Invoer naam voor nieuw corpus
          • ✔ Pagina met alleen tekst die meldt dat corpus niet gelijk op tab Corpora verschijnt, en een link naar die pagina

          • ✻ Actie in achtergrond
          • ✻ Losse bestanden in ZIP
        • ✔ Link op tab Corpora naar FoLiA-tool

        • ❏ uitleg
        • ❏ voorbeelden
        • ✔ bij starten van pqserve, en daarna eens per dag foliadata die ouder is dan x dagen verwijderen (x in setup.toml)

        • ✔ native metadata
        • ? annotations

      • pqclean

      • pqrmuser

      • pqstatus

      • ✔ Zie mail van Maarten van Gompel
        • → FoLiA kan dus, behalve info over annotatie, ook andere native metadata bevatten. Voorbeeld onderaan.
    • ❏ Nieuw corpus
      • ❏ Labels op dubbelen controleren, ontdubbelen dmv numeriek suffix
      • ❏ Expert-opties voor Alpino
        • ❏ Kleinere timeout
        • ❏ Alternatieve parser voor corpus dat voornamelijk uit vragen bestaat
          • ✻ optie application_type=qa vóór de optie -parse


Huidig programma pqfolia gaat ervan uit dat de naam van het metadata-bestand in het folia-bestand is gedefinieerd.
Een andere mogelijkheid: niet in folia-bestand gedefinieerd, maar metadata-bestand heeft zelfde naam en relatief path als folia-bestand.


FoLiA met native metadata:

  <metadata type="native">                                                                                      
    <annotations>                                                                                               
      <token-annotation set="http://ilk.uvt.nl/folia/sets/ucto-tokconfig-nl" annotator="ucto" annotatortype="auto"/>                                                                                                            
      <pos-annotation set="http://ilk.uvt.nl/folia/sets/CGN" annotator="Frog" annotatortype="auto"/>            
      <lemma-annotation set="http://ilk.uvt.nl/folia/sets/lemmas-nl" annotator="Frog" annotatortype="auto"/>    
      <morphological-annotation set="http://ilk.uvt.nl/folia/sets/morphology" annotator="Frog" annotatortype="auto"/>                                                                                                           
      <division-annotation set="http://ilk.uvt.nl/folia/sets/divisions"/>                                       
    </annotations>                                                                                              
    <meta id="title">De trek : 7 : Grieken en Romeinen : Werkboek</meta>                                        
    <meta id="filename">target-folia-A/70434_232477.folia.xml</meta>                                            
    <meta id="maintype">school</meta>                                                                           
    <meta id="type">zaakvakmethode</meta>                                                                       
    <meta id="subtype">Geschiedenis</meta>                                                                      
    <meta id="serie">De trek</meta>                                                                             
    <meta id="publisher">Zwijsen</meta>                                                                         
    <meta id="authors">Wim Kratsborn, Ben Verschuren, Marjolein den Ouden, Ruurd Halbertsma</meta>              
    <meta id="isbn">9789027659781</meta>                                                                        
    <meta id="grade">7</meta>                                                                                   
    <meta id="level"/>                                                                                          
    <meta id="level_determination"/>                                                                            
    <meta id="supplying_org">Dedicon</meta>                                                                     
    <meta id="prod_date">6/12/2008</meta>                                                                       
    <meta id="remarks"/>                                                                                        
    <meta id="usable"/>                                                                                         
  </metadata>                                                                                                                                                                                        


CategoryPaQu