Qu'est-ce qu'Hadoop ?

 

Hadoop est un framework proposant un système de stockage distribué via son système de fichier HDFS (Hadoop Distributed File System) et il permet de stocker les données en les dupliquant, paliant ainsi les possibilités de pannes des disques durs. Par ailleurs, Hadoop offre la possibilité d’analyser les données grâce à MapReduce.

Il est intéressant d’utiliser Hadoop dans un environnement constitué de plusieurs machines. De plus, il n’a pas d’intérêt pour les données de petites tailles ; les données doivent dépasser les limites de mémoire des disques durs du marché.

De nombreuses entreprises ou institutions publiques utillisent Hadoop.

A titre d’exemple, Yahoo a massivement investi dans ce projet. La société utilise Hadoop pour son moteur de recherche depuis 2006 et possède actuellement le plus grand nombre de machines Hadoop.

Les usages d’Hadoop sont variés. Dans le domaine de la santé, certains hôpitaux utilisent Hadoop pour stocker leurs données. En télécommunication, Nokia collecte et analyse de grandes quantités de données issues de téléphones portables de sa marque. Une solution à base d’Hadoop est utilisée par EDF pour la prévision de consommations électriques (stockage et analyse de courbes de charges). Certaines sociétés de transport exploite également le potentiel d’Hadoop pour stocker les données de capteurs placés dans leurs véhicules afin d’optimiser les déplacements et d’économiser sur le coût du carburant.   

 

 
 

Article publié le 2 novembre 2015 par Comité de Caritat.

Posez votre question, nos experts vous répondront