Quelles sont les étapes pour nettoyer des données texte ?

 

 

Les formats des données que reçoivent les entreprises ne sont pas forcément choisis par ces dernières, d'où la nécessité de les nettoyer. Certains logiciels comme Office Excel permettent d'obtenir le format souhaité pour les données.

Il peut exister des fonctionnalités spécifiques comme le vérificateur d'orthographe qui corrigera les mots mal orthographiés de la base de données. La boîte de dialogue "Supprimer les doublons" est également utile pour supprimer les lignes duppliquées. Mais le processus de nettoyage des données peut être plus compliqué.

Par exemple, pour supprimer les espaces de fin de texte, il faut créer une colonne pour nettoyer les données avec une formule, remplir la nouvelle colonne, convertir les formules en valeurs puis supprimer la colonne initiale.

 

De manière générale, les étapes pour nettoyer les données sont les suivantes :

-importer les données.

-créer une copie de sauvegarde des données originales dans un classeur distinct.

-vérifier que toutes les lignes et colonnes de notre base de données sont lisibles, et qu'il n'y a pas de lignes vides.

 

L'utilisation d'Excel est fortement conseillée.

-effectuer les tâches qui ne nécessitent pas la manipulation des colonnes, comme la vérification orthographique.

-effectuer les tâches nécessitant la manipulation des colonnes toujours selon le même procédé : création d'une nouvelle colonne, transformation des données dans la nouvelle colonne et suppression de la colonne initiale.

 

Si le nettoyage est régulier, il peut être utile de créer une macro afin d'automatiser le processus.  

 

 

Article publié le 2 novembre 2015 par Comité de Caritat.

Posez votre question, nos experts vous répondront