zie ook: CategorySpraakAccenten
Fase A
- een aantal (10) zinnen
- van een aantal personen:
- herkomst
- uitspraak van een deel van de zinnen
Fase B
- per persoon per uitgesproken zin een reeks van varianten, één variant per woord in de zin, voor elk woord in elke zin een vaste set varianten
Fase C
- per reeks uit fase B een voorspelling waar de persoon vandaan kwam, voor elk van de 10 zinnen een aparte voorspeller
van A naar B
forced alignment: software
onnauwkeurig, bijvoorbeeld in Limburg, zin 1, spreker 10241, woord staat, wordt getranscribeerd met a. maar de klank lijkt niet op een a.
van B naar C
systeem getraind met AdaBoost
doelen
✔ software voor forced alignment installeren
✔ van B naar C opnieuw uitvoeren, met andere software (in R, Torch, Go, Octave...), door middel van AdaBoost of neuraal netwerk of iets anders.
✻ AdaBoost
✻ R: ada (alleen binaire classificatie), adabag, fastAdaboost, gbm, JOUSBoost, maboost
✻ Go: CloudForest, weakai, AdaBoostGo
✻ Matlab: Statistical Pattern Recognition Toolbox
✻ Python: Milk
- ✻ Naive Bayes
✻ Python: Multinomial Naive Bayes in scikit-learn
- ❏ van A naar...?
- ❏ van B naar...?
- ❏ ???
studie-onderwerpen
- HMM
- audioanalyse
📖 Theodoros Giannakopoulos, Aggelos Pikrakis: Introduction to Audio Analysis: A MATLAB® Approach
- spraakanalyse
Pagina's:
- PetersWerkWiki/2018-03-21
- PetersWerkWiki/2018-04-11
- PetersWerkWiki/2018-04-18
- PetersWerkWiki/2018-04-25
- PetersWerkWiki/2018-05-02
- PetersWerkWiki/2018-05-16
- PetersWerkWiki/2018-05-23
- PetersWerkWiki/2018-05-30
- PetersWerkWiki/2018-06-06
- PetersWerkWiki/2018-06-13
- PetersWerkWiki/2018-06-20
- PetersWerkWiki/2018-08-22
- PetersWerkWiki/2018-08-29
- PetersWerkWiki/2018-09-05
- PetersWerkWiki/2018-09-12