Voor het goed functioneren van taaltechnologische software is training nodig.
Aan een klein, representatief deel van een tekstcorpus, worden handmatig eigenschappen toegekend, zoals woordsoorten (part-of-speech tagging). Met dit handmatig getagde deel wordt het algoritme getraind dat daarna automatisch de woordsoorten of andere eigenschappen toekent aan de rest van de woorden in het corpus. Deze handmatige annotatie en part-of-speech tagging doe ik voor u.