Data science avec « R » "pour les nuls"

Programme de la formation

Cette formation donne aux membres qualifiés de l’Institut des Actuaires :

 

 

Introduction

  • Processus général du traitement de données
  • Analyse des données textes : principe et intérêts
  • Présentation des outils pour la collecte et traitements des données

  • Prise en main de « R »

  • Packages à connaître pour la data science

  • Exemples de text mining

  • Lien avec speech analytics et intérêt pratique

Collecte des données web avec "R"

  • Bases de la structure des pages web
  • Scraping des données html avec « R »
  • Cas d’application : analyse des avis et notations des produits
  • Visualisation de l’évolution des notations
  • Import et analyse des données de twitter
  • Construction d’un outil de veille pour les produits ou les services
  • AB testing

Nettoyage de données html et textes

  • Traitement automatique du langage naturel (Natural language processing)
  • Manipulation des corpus avec « R »

  • Exploitation des documents term matrix (DTM)

  • Association des mots

  • Visualisation des nuages de mots

  • Extraction d’informations et analyse des sentiments

  • Clustering de textes

Détection de spams et machine learning avec "R"

  • Analyse prédictive des mails indésirables

  • Pratique de différents algorithmes avec « R »

  • Application d’un arbre de classification

  • Application de SVM (Support Vector Machine)

  • Application de la régression logistique

  • Agrégation de modèle : bagging et forêt aléatoire

  • Comparaison des différents algorithmes de classification

Performance des algorithmes

  • Matrice de confusion et taux d’erreur

  • Courbe ROC et AUC

  • Coefficient de Gini

Conclusions

  • Intérêt de l’analyse des données textes

  • Intérêt du processus d’analyse prédictive

 

 

Une formation de notre expert Kezhan SHI, dont nous vous invitons à découvrir le blog.

En pratique


Dernière date :
20 et 21 septembre 2017

Horaires :
9h00 - 12h30 et 14h00 - 17h30

Prix : 2 000 € HT + TVA 20%, soit 2 400 € TTC

Lieu : Caritat, 5 rue Tronchet Paris 8ème
Indication d'hébergement

Session suivante : En 2018 (également disponible en intra-entreprise sur demande)

Où vous loger ?

Si vous venez de province ou de l'étranger, pour toute réservation d'hôtel, contactez notre partenaire :
Elysées West Hôtel
- Tél : 01 85 34 72 00
- Mail : hotels@elyseeshotels.com
- Site web : http://elysees.hotusa.com/caritat/
Précisez que vous venez de la part de Caritat

Qui anime cette formation ?

kezhan shi
Kezhan SHI
Membre certifié de l’IA. Il est titulaire d’un master en actuariat de l’Université Paris Dauphine. Il a également fait l’École Centrale Paris. Il a travaillé chez Prim’Act, Direct Assurance et Aviva, avant de rejoindre Allianz en 2017, au titre de Data Scientist.