CategoryForcedAlignment

CategoryForcedAlignment

[PetersWerkWiki] [TitleIndex] [WordIndex]

zie ook: CategorySpraakAccenten

Fase A

een aantal (10) zinnen
‎van een aantal personen:
- herkomst
- ‎uitspraak van een deel van de zinnen

Fase B

per persoon per uitgesproken zin een reeks van varianten, één variant per woord in de zin, voor elk woord in elke zin een vaste set varianten

Fase C

per reeks uit fase B een voorspelling waar de persoon vandaan kwam, voor elk van de 10 zinnen een aparte voorspeller

van A naar B

forced alignment: software
onnauwkeurig, bijvoorbeeld in Limburg, zin 1, spreker 10241, woord staat, wordt getranscribeerd met a. maar de klank lijkt niet op een a.

van B naar C

systeem getraind met AdaBoost

doelen

✔ software voor forced alignment installeren
✔ van B naar C opnieuw uitvoeren, met andere software (in R, Torch, Go, Octave...), door middel van AdaBoost of neuraal netwerk of iets anders.
- ✻ AdaBoost
  - ✻ R: ada (alleen binaire classificatie), adabag, fastAdaboost, gbm, JOUSBoost, maboost
  - ✻ Go: CloudForest, weakai, AdaBoostGo
  - ✻ Matlab: Statistical Pattern Recognition Toolbox
  - ✻ Python: Milk
- ✻ Naive Bayes
  - ✻ Python: Multinomial Naive Bayes in scikit-learn
❏ ‎van A naar...?
❏ ‎van B naar...?
❏ ???

studie-onderwerpen

machine learning
HMM
‎audioanalyse
- 📖 Theodoros Giannakopoulos,‎ Aggelos Pikrakis: Introduction to Audio Analysis: A MATLAB® Approach
‎spraakanalyse

Pagina's:

CategoryCategory