Werkoverleg met GvN
Taken:
❏ Verdiepen in machine learning met scikit-learn
→ Mastering Machine Learning with Scikit-learn (online, UB)
→ Practical Machine Learning Tutorial with Python (youtube)
→ Documentation of scikit-learn (user guide, tutorials)
- ✔ Classificatie op basis van lengte van klanken
- → variabel aantal klanken per woord, dus alleen op basis van lengte van woorden mogelijk
→ data in: /net/aistaff/kleiweg/spraak/fa/len
→ alle zinnen samen, zie: http://scikit-learn.org/stable/modules/preprocessing.html#imputation-of-missing-values
- Werktijden
- ❏ uren bijhouden
Suggesties:
Betere transcripties. De transcripties zijn erg onnauwkeurig. Bijvoorbeeld in Limburg, zin 1, spreker 10241, woord staat, wordt getranscribeerd met a. maar de klank lijkt niet op een a.
- Automatische classificatie vergelijken met classificatie door luisteraars.
- Trainen en testen op basis van classificatie van luisteraars. Werkelijke regio's negeren.
Gemiddelden van 10-fold cross-validation op woordlengtes:
SVC = Support Vector Machine Classification ADA = AdaBoost BAY = Gaussian Naive Bayes Zin 1 N / O / Z N+O / Z N / Z SVC 0.40156641604 SVC 0.615381192881 SVC 0.584736842105 ADA 0.413812308549 ADA 0.629663299663 ADA 0.627105263158 BAY 0.297768727374 BAY 0.579075276575 BAY 0.538815789474 Zin 2 N / O / Z N+O / Z N / Z SVC 0.424879051766 SVC 0.635152537067 SVC 0.567792792793 ADA 0.419224366089 ADA 0.598352969635 ADA 0.581681681682 BAY 0.399732490964 BAY 0.6162191582 BAY 0.559309309309 Zin 3 N / O / Z N+O / Z N / Z SVC 0.3937943959 SVC 0.606535482851 SVC 0.566586894587 ADA 0.343949061844 ADA 0.557633949739 ADA 0.547914529915 BAY 0.426100724785 BAY 0.584459459459 BAY 0.559464387464 Zin 4 N / O / Z N+O / Z N / Z SVC 0.453725222146 SVC 0.537380952381 SVC 0.623928571429 ADA 0.338904078378 ADA 0.487857142857 ADA 0.525357142857 BAY 0.408863066758 BAY 0.492142857143 BAY 0.599702380952 Zin 5 N / O / Z N+O / Z N / Z SVC 0.381262183236 SVC 0.608008658009 SVC 0.623928571429 ADA 0.362517404623 ADA 0.5555002405 ADA 0.525357142857 BAY 0.358747563353 BAY 0.524748677249 BAY 0.599702380952 Zin 6 N / O / Z N+O / Z N / Z SVC 0.433192307692 SVC 0.590679487179 SVC 0.598675610595 ADA 0.451794871795 ADA 0.645961538462 ADA 0.602442380461 BAY 0.413166666667 BAY 0.62558974359 BAY 0.557585139319 Zin 7 N / O / Z N+O / Z N / Z SVC 0.452518796992 SVC 0.588421052632 SVC 0.63 ADA 0.489335839599 ADA 0.612894736842 ADA 0.761428571429 BAY 0.480563909774 BAY 0.689736842105 BAY 0.622857142857 Zin 8 N / O / Z N+O / Z N / Z SVC 0.448759398496 SVC 0.547142857143 SVC 0.607142857143 ADA 0.353533834586 ADA 0.581904761905 ADA 0.627142857143 BAY 0.448521303258 BAY 0.513095238095 BAY 0.647619047619 Zin 9 N / O / Z N+O / Z N / Z SVC 0.416545584046 SVC 0.603743589744 SVC 0.568472652219 ADA 0.35812962963 ADA 0.578256410256 ADA 0.549982800138 BAY 0.396047008547 BAY 0.545435897436 BAY 0.551479188166 Zin 10 N / O / Z N+O / Z N / Z SVC 0.422686609687 SVC 0.577564102564 SVC 0.586308909529 ADA 0.376213675214 ADA 0.515705128205 ADA 0.587547299622 BAY 0.32363960114 BAY 0.589102564103 BAY 0.568438252494 Alle zinnen samen N / O / Z N+O / Z N / Z SVC 0.389571150097 SVC 0.612352092352 SVC 0.544078947368 ADA 0.434307992203 ADA 0.697290764791 ADA 0.692236842105 BAY 0.340545808967 BAY 0.610270562771 BAY 0.550526315789
CategorySpraakAccenten CategoryForcedAlignment CategoryMachineLearning