Hoe heet een verzameling geschreven teksten?
Een verzameling geschreven teksten wordt een corpus genoemd. Een corpus kan elke omvang hebben, van een kleine verzameling documenten tot een grote database met miljoenen teksten. Corpora worden vaak gebruikt voor taalkundig onderzoek, zoals het bestuderen van de frequentie van woorden of de structuur van zinnen. Ze kunnen ook voor andere doeleinden worden gebruikt, zoals het maken van taalmodellen of het trainen van machine learning-algoritmen.