Werkoverleg met GvN
Taken:
- ❏ Verdiepen in audio-analyse
❏ Verder met Introduction to Audio Analysis: A MATLAB® Approach
- ❏ Welke persoonskenmerken zijn er uit een audio-signaal te halen?
- ✔ Classificatie op basis van lengte van klanken
- ✔ baseline: aantal in grootste groep gedeeld door totaal
- ✔ linear SVM
- ✔ gemiddelde score over de losse zinnen samen
- ❏ Meer metadata voor Nederlandse spraak?
- ❏ Verdiepen in audio-analyse
- Jaarlijkse evaluatie: zie beneden
❏ Formulier invullen: https://reno.gai.rug.nl/prd/hrm/roform/main/
Gemiddelden van 10-fold cross-validation op woordlengtes:
BAS = Baseline LIN = Support Vector Machine Classification: linear SVC = Support Vector Machine Classification: rbf (default) ADA = AdaBoost BAY = Gaussian Naive Bayes Zin 1 N / O / Z N+O / Z N / Z BAS 0.388384754991 BAS 0.611615245009 BAS 0.551546391753 LIN 0.432104566973 LIN 0.611712361712 LIN 0.644736842105 SVC 0.41186299081 SVC 0.617067099567 SVC 0.595 ADA 0.396919381788 ADA 0.622204184704 ADA 0.635657894737 BAY 0.307362155388 BAY 0.56825998076 BAY 0.544210526316 Zin 2 N / O / Z N+O / Z N / Z BAS 0.388030888031 BAS 0.611969111969 BAS 0.556786703601 LIN 0.446073451151 LIN 0.640921767836 LIN 0.600975975976 SVC 0.438344858989 SVC 0.627345684282 SVC 0.562312312312 ADA 0.412930077691 ADA 0.608154045363 ADA 0.593168168168 BAY 0.388228890976 BAY 0.590769515353 BAY 0.56493993994 Zin 3 N / O / Z N+O / Z N / Z BAS 0.393530997305 BAS 0.606469002695 BAS 0.555133079848 LIN 0.415436451489 LIN 0.606389284021 LIN 0.585686609687 SVC 0.404166271535 SVC 0.606535482851 SVC 0.570136752137 ADA 0.411981643297 ADA 0.544416785206 ADA 0.551772079772 BAY 0.392085506559 BAY 0.60091670618 BAY 0.563475783476 Zin 4 N / O / Z N+O / Z N / Z BAS 0.452736318408 BAS 0.547263681592 BAS 0.623287671233 LIN 0.449464570517 LIN 0.557380952381 LIN 0.623928571429 SVC 0.453725222146 SVC 0.547619047619 SVC 0.623928571429 ADA 0.394292549556 ADA 0.552142857143 ADA 0.507142857143 BAY 0.428628389155 BAY 0.522857142857 BAY 0.575357142857 Zin 5 N / O / Z N+O / Z N / Z BAS 0.388384754991 BAS 0.611615245009 BAS 0.552971576227 LIN 0.373336118073 LIN 0.611645021645 LIN 0.537199730094 SVC 0.373593706488 SVC 0.609859307359 SVC 0.5319365722 ADA 0.384708298524 ADA 0.582417027417 ADA 0.558313090418 BAY 0.34153091061 BAY 0.514664502165 BAY 0.48641025641 Zin 6 N / O / Z N+O / Z N / Z BAS 0.425196850394 BAS 0.574803149606 BAS 0.586956521739 LIN 0.435743589744 LIN 0.660846153846 LIN 0.579790161679 SVC 0.429025641026 SVC 0.586525641026 SVC 0.592500859993 ADA 0.405333333333 ADA 0.636166666667 ADA 0.594358445132 BAY 0.397423076923 BAY 0.623025641026 BAY 0.590608875129 Zin 7 N / O / Z N+O / Z N / Z BAS 0.456852791878 BAS 0.543147208122 BAS 0.629370629371 LIN 0.458020050125 LIN 0.670789473684 LIN 0.650476190476 SVC 0.452518796992 SVC 0.615 SVC 0.622857142857 ADA 0.519912280702 ADA 0.599473684211 ADA 0.727142857143 BAY 0.468333333333 BAY 0.646052631579 BAY 0.685238095238 Zin 8 N / O / Z N+O / Z N / Z BAS 0.44776119403 BAS 0.55223880597 BAS 0.620689655172 LIN 0.409235588972 LIN 0.552142857143 LIN 0.565238095238 SVC 0.438496240602 SVC 0.552142857143 SVC 0.614285714286 ADA 0.394636591479 ADA 0.547380952381 ADA 0.56619047619 BAY 0.471854636591 BAY 0.512380952381 BAY 0.640476190476 Zin 9 N / O / Z N+O / Z N / Z BAS 0.424124513619 BAS 0.575875486381 BAS 0.589189189189 LIN 0.393586894587 LIN 0.556641025641 LIN 0.557946336429 SVC 0.397883190883 SVC 0.572807692308 SVC 0.552683178535 ADA 0.362155270655 ADA 0.575076923077 ADA 0.487409700722 BAY 0.377300569801 BAY 0.514974358974 BAY 0.547746818025 Zin 10 N / O / Z N+O / Z N / Z BAS 0.422480620155 BAS 0.577519379845 BAS 0.586021505376 LIN 0.391289173789 LIN 0.588782051282 LIN 0.542999656003 SVC 0.422686609687 SVC 0.577564102564 SVC 0.586308909529 ADA 0.366943019943 ADA 0.573076923077 ADA 0.584485724114 BAY 0.329347578348 BAY 0.584615384615 BAY 0.569642242862 Mean N / O / Z N+O / Z N / Z BAS 0.41874836838 BAS 0.58125163162 BAS 0.585195292351 LIN 0.420429045542 LIN 0.605725094919 LIN 0.588897816912 SVC 0.422230352916 SVC 0.591246691472 SVC 0.585195001328 ADA 0.404981244697 ADA 0.584051004925 ADA 0.580564129354 BAY 0.390209504768 BAY 0.567851681589 BAY 0.576810587073 Alle zinnen samen N / O / Z N+O / Z N / Z BAS 0.38768115942 BAS 0.61231884058 BAS 0.551546391753 LIN 0.451169590643 LIN 0.695414862915 LIN 0.632105263158 SVC 0.385769980507 SVC 0.612352092352 SVC 0.548815789474 ADA 0.474366471735 ADA 0.688665223665 ADA 0.6475 BAY 0.339278752437 BAY 0.608744588745 BAY 0.549078947368
Voor evaluatie: onderwerpen die afgelopen 12 maanden aan bod kwamen:
PaQu: vooral SPOD Manual annotation of syntactic trees (?) JavaScript: web-applicaties - Aurelia installatie software op haytabo CubeTalk: replay Transducer: Dynamische arrays Alpino - extensies voor Tred: http://www.let.rug.nl/vannoord/alp/Alpino/tred/ - demo: Universal Dependencies: http://www.let.rug.nl/vannoord/bin/alpino - zoiets als dtsearch → gematchte nodes visueel markeren in Tred - aanpassingen in lassy13to15 handleidingen op lokale website: - haytabo en zo: http://www.let.rug.nl/alfa/distro/ - latex bijgewerkt: http://www.let.rug.nl/alfa/tex/ verkenning van (software voor) numerieke methodes Zoeken naar woordcombinaties: http://www.let.rug.nl/kleiweg/nl234/ Anaconda geïnstalleerd - kernels voor Python3, R, Julia, Octave, Matlab - automatisch dagelijkse updates Herkennen van regionale spraak - verdiepen in audio-analyse - Octave, Matlab - machine learning - herhalen experimenten van Martijn c.s. - clustering op basis van Levenshtein-afstanden