OBJECTIFS :
- Filtrage, lemmatisation, suppression des mots-vides, part-of-speech tagging, trouver les mots composés, le tout avec un temps de traitement acceptable, Tf-Idf, Stopwords (?)
- Définition d’un protocole d’échange automatisé de données avec les groupes 4, 6 et 7 (il pourra s’agir d’un processus d’écriture/lecture dans des répertoires partagés déterminés au préalable.)