Stockage des données

Dans la majorité des cas, le nettoyage des données les formate en bases SQL. La manipulation de ces dernières en est facilitée. Il convient ensuite de s’interroger sur la manière de les stocker, d’autant plus que les volumes traités dépassent souvent la capacité des disques durs actuels. Pour répondre à cette problématique, les développeurs ont mis au point des systèmes de stockage parallèle comme Hadoop. Par ailleurs, l’échantillonnage apparaît aussi être une bonne alternative pour palier au problème de l’explosion des volumes. La législation limite cependant les durées de stockage des données personnelles par les entreprises.