[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN

Taken:

  1. Forced Alignment...

    • ❏ Verdiepen in audio-analyse
    • ✔ Classificatie op basis van lengte van klanken
      • ✔ baseline: aantal in grootste groep gedeeld door totaal
      • ✔ linear SVM
      • ✔ gemiddelde score over de losse zinnen samen
    • ❏ Meer metadata voor Nederlandse spraak?
  2. Jaarlijkse evaluatie: zie beneden


Gemiddelden van 10-fold cross-validation op woordlengtes:

BAS = Baseline
LIN = Support Vector Machine Classification: linear
SVC = Support Vector Machine Classification: rbf (default)
ADA = AdaBoost
BAY = Gaussian Naive Bayes

Zin 1
N / O / Z           N+O / Z             N / Z
BAS 0.388384754991  BAS 0.611615245009  BAS 0.551546391753
LIN 0.432104566973  LIN 0.611712361712  LIN 0.644736842105
SVC 0.41186299081   SVC 0.617067099567  SVC 0.595
ADA 0.396919381788  ADA 0.622204184704  ADA 0.635657894737
BAY 0.307362155388  BAY 0.56825998076   BAY 0.544210526316

Zin 2
N / O / Z           N+O / Z             N / Z
BAS 0.388030888031  BAS 0.611969111969  BAS 0.556786703601
LIN 0.446073451151  LIN 0.640921767836  LIN 0.600975975976
SVC 0.438344858989  SVC 0.627345684282  SVC 0.562312312312
ADA 0.412930077691  ADA 0.608154045363  ADA 0.593168168168
BAY 0.388228890976  BAY 0.590769515353  BAY 0.56493993994

Zin 3
N / O / Z           N+O / Z             N / Z
BAS 0.393530997305  BAS 0.606469002695  BAS 0.555133079848
LIN 0.415436451489  LIN 0.606389284021  LIN 0.585686609687
SVC 0.404166271535  SVC 0.606535482851  SVC 0.570136752137
ADA 0.411981643297  ADA 0.544416785206  ADA 0.551772079772
BAY 0.392085506559  BAY 0.60091670618   BAY 0.563475783476

Zin 4
N / O / Z           N+O / Z             N / Z
BAS 0.452736318408  BAS 0.547263681592  BAS 0.623287671233
LIN 0.449464570517  LIN 0.557380952381  LIN 0.623928571429
SVC 0.453725222146  SVC 0.547619047619  SVC 0.623928571429
ADA 0.394292549556  ADA 0.552142857143  ADA 0.507142857143
BAY 0.428628389155  BAY 0.522857142857  BAY 0.575357142857

Zin 5
N / O / Z           N+O / Z             N / Z
BAS 0.388384754991  BAS 0.611615245009  BAS 0.552971576227
LIN 0.373336118073  LIN 0.611645021645  LIN 0.537199730094
SVC 0.373593706488  SVC 0.609859307359  SVC 0.5319365722
ADA 0.384708298524  ADA 0.582417027417  ADA 0.558313090418
BAY 0.34153091061   BAY 0.514664502165  BAY 0.48641025641

Zin 6
N / O / Z           N+O / Z             N / Z
BAS 0.425196850394  BAS 0.574803149606  BAS 0.586956521739
LIN 0.435743589744  LIN 0.660846153846  LIN 0.579790161679
SVC 0.429025641026  SVC 0.586525641026  SVC 0.592500859993
ADA 0.405333333333  ADA 0.636166666667  ADA 0.594358445132
BAY 0.397423076923  BAY 0.623025641026  BAY 0.590608875129

Zin 7
N / O / Z           N+O / Z             N / Z
BAS 0.456852791878  BAS 0.543147208122  BAS 0.629370629371
LIN 0.458020050125  LIN 0.670789473684  LIN 0.650476190476
SVC 0.452518796992  SVC 0.615           SVC 0.622857142857
ADA 0.519912280702  ADA 0.599473684211  ADA 0.727142857143
BAY 0.468333333333  BAY 0.646052631579  BAY 0.685238095238

Zin 8
N / O / Z           N+O / Z             N / Z
BAS 0.44776119403   BAS 0.55223880597   BAS 0.620689655172
LIN 0.409235588972  LIN 0.552142857143  LIN 0.565238095238
SVC 0.438496240602  SVC 0.552142857143  SVC 0.614285714286
ADA 0.394636591479  ADA 0.547380952381  ADA 0.56619047619
BAY 0.471854636591  BAY 0.512380952381  BAY 0.640476190476

Zin 9
N / O / Z           N+O / Z             N / Z
BAS 0.424124513619  BAS 0.575875486381  BAS 0.589189189189
LIN 0.393586894587  LIN 0.556641025641  LIN 0.557946336429
SVC 0.397883190883  SVC 0.572807692308  SVC 0.552683178535
ADA 0.362155270655  ADA 0.575076923077  ADA 0.487409700722
BAY 0.377300569801  BAY 0.514974358974  BAY 0.547746818025

Zin 10
N / O / Z           N+O / Z             N / Z
BAS 0.422480620155  BAS 0.577519379845  BAS 0.586021505376
LIN 0.391289173789  LIN 0.588782051282  LIN 0.542999656003
SVC 0.422686609687  SVC 0.577564102564  SVC 0.586308909529
ADA 0.366943019943  ADA 0.573076923077  ADA 0.584485724114
BAY 0.329347578348  BAY 0.584615384615  BAY 0.569642242862

Mean
N / O / Z           N+O / Z             N / Z
BAS 0.41874836838   BAS 0.58125163162   BAS 0.585195292351
LIN 0.420429045542  LIN 0.605725094919  LIN 0.588897816912
SVC 0.422230352916  SVC 0.591246691472  SVC 0.585195001328
ADA 0.404981244697  ADA 0.584051004925  ADA 0.580564129354
BAY 0.390209504768  BAY 0.567851681589  BAY 0.576810587073

Alle zinnen samen
N / O / Z           N+O / Z             N / Z
BAS 0.38768115942   BAS 0.61231884058   BAS 0.551546391753
LIN 0.451169590643  LIN 0.695414862915  LIN 0.632105263158
SVC 0.385769980507  SVC 0.612352092352  SVC 0.548815789474
ADA 0.474366471735  ADA 0.688665223665  ADA 0.6475
BAY 0.339278752437  BAY 0.608744588745  BAY 0.549078947368


Voor evaluatie: onderwerpen die afgelopen 12 maanden aan bod kwamen:

PaQu: vooral SPOD
Manual annotation of syntactic trees (?)
JavaScript: web-applicaties
 - Aurelia
installatie software op haytabo
CubeTalk: replay
Transducer: Dynamische arrays
Alpino
 - extensies voor Tred: http://www.let.rug.nl/vannoord/alp/Alpino/tred/
 - demo: Universal Dependencies: http://www.let.rug.nl/vannoord/bin/alpino
 - zoiets als dtsearch → gematchte nodes visueel markeren in Tred
 - aanpassingen in lassy13to15
handleidingen op lokale website:
 - haytabo en zo: http://www.let.rug.nl/alfa/distro/
 - latex bijgewerkt: http://www.let.rug.nl/alfa/tex/
verkenning van (software voor) numerieke methodes
Zoeken naar woordcombinaties: http://www.let.rug.nl/kleiweg/nl234/
Anaconda geïnstalleerd
 - kernels voor Python3, R, Julia, Octave, Matlab
 - automatisch dagelijkse updates
Herkennen van regionale spraak
 - verdiepen in audio-analyse
 - Octave, Matlab
 - machine learning
 - herhalen experimenten van Martijn c.s.
 - clustering op basis van Levenshtein-afstanden


CategorySpraakAccenten CategoryForcedAlignment