Folktales as Classifiable Texts (FACT)
FACT wil software ontwikkelen waarmee de computer volksverhalen automatisch kan voorzien van metadata als namen, trefwoorden, het genre, de taal, een samenvatting en een typenummer. Er wordt derhalve gestreefd naar automatische annotatie en classificatie - een methode die ook internationaal van nut kan zijn. Bovendien wordt onderzocht of door middel van computeranalyse nieuwe relaties tussen volksverhalen ontdekt kunnen worden (clustering). Op basis van de resultaten wordt onderzoek gedaan naar de variabiliteit in mondelinge en schriftelijke overlevering, alsmede naar de voor- en nadelen van menselijke classificatie en computergestuurde clustering.
Participanten zijn Meertens Instituut, UT Twente en Universiteit van Tilburg. Het project gaat 6 september 2011 van start.