Werkoverleg met GvN.
Taken:
- Qtleap: Moses testen op data uit corpus europarl, Engels → Nederlands
- ✔ Data selecteren uit zinsalignment Nederlands → Engels (daarvan zijn voor Nederlands alle parses klaar)
- ✻ 10% voor trainen (later 98%), 1% voor tunen, 1% voor testen
- ✔ Vergelijken van methodes:
- ✔ standaard
- BLEU = 22.23, 56.5/27.7/16.1/9.8 (BP=0.997, ratio=0.997, hyp_len=361448, ref_len=362525)
- ✔ factored
- BLEU = 22.10, 56.4/27.6/16.0/9.7 (BP=0.996, ratio=0.996, hyp_len=361216, ref_len=362525)
- ✔ syntactisch
- BLEU = 19.80, 53.3/25.0/14.0/8.2 (BP=1.000, ratio=1.066, hyp_len=386558, ref_len=362525)
- ✔ standaard
- ✔ Data selecteren uit zinsalignment Nederlands → Engels (daarvan zijn voor Nederlands alle parses klaar)
Resultaten in /net/aistaff/kleiweg/moses/europarl