Nettoyage des données

Consécutivement à l’étape de collecte des données, le nettoyage de ces dernières constitue un palier déterminant pour la qualité de la poursuite de l’étude. Il a pour objectif l’amélioration de la qualité des données. Cette étape peut être longue à cause de la diversité des types de problèmes auxquels il faut remédier pour faire de nos données collectées une base de données structurée. En particulier, le besoin d’extraire de l’information des textes a entraîné l’élaboration de nouvelles techniques de nettoyage comprenant plusieurs étapes afin de transformer des mots et des phrases (données non structurées) en valeurs numériques exploitables (données structurées).