Data science avec « R » « pour les nuls »

Cette formation donne 42 points PPC aux membres qualifiés de l’Institut des Actuaires

Programme de la formation

Introduction à la programmation avec R

  • Installation de R et de RStudio
  • Présentation de RStudio

Collecte des données web avec R

  • Import des données
  • Bases de la structure des pages web
  • Scraping des données html avec R
  • Cas d’application : analyse des avis et notations des produits
  • Import et analyse des données de twitter
  • Construction d’un outil de veille pour les produits ou les services

Nettoyage de données html et textes

  • Text mining
  • Manipulation des corpus avec R
  • Exploitation des document term matrix (DTM)
  • Association des mots
  • Visualisation des nuages de mots

Machine learning avec R

  • Analyse prédictive des mails indésirables
  • Pratique de différents algorithmes avec R
  • Application d’un arbre de classification
  • Application de SVM (Support Vector Machine)
  • Application de la régression logistique
  • Agrégation de modèles
  • Comparaison des différents algorithmes

Performance des algorithmes

  • Matrice de confusion et taux d’erreur
  • Courbe ROC et AUC
  • Coefficient de Gini

Conclusions

  • Intérêt de l’analyse des données textes
  • Intérêt du processus d’analyse prédictive

 

Une formation de notre expert Kezhan SHI, dont nous vous invitons à découvrir le blog.

Date

13 mai 2019

Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 1250 € HT
  • TVA 20%
  • 1500 € TTC
Lieu

CARITAT, 5 rue Tronchet 75008 PARIS

Durée

1 jour

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Membre certifié de l’IA. Il est titulaire d’un master en actuariat de l’Université Paris Dauphine et a également fait l’École Centrale Paris. Il a travaillé chez Prim’Act, Direct Assurance et Aviva, avant de rejoindre Allianz en 2017, au titre de Data Scientist.

Points clés

À qui s’adresse cette formation ?

À toute personne susceptible d’intervenir dans l’élaboration et la mise en oeuvre d’une stratégie Big Data, et ce dans les domaines : produits, marketing, distribution et tarification.

Ainsi qu’à toute personne désireuse de se familiariser avec ce sujet en devenir.

Pour obtenir quoi ?

Une compréhension globale de la problématique Big Data et des outils disponibles à ce jour et nécessaires à son traitement.

Comment ?

Des exemples pratiques animeront chaque étape du processus de traitement du Big Data, et complèteront la définition et les perspectives de ce nouveau métier.

Quels sont les prérequis ?

Aucun en particulier. L’intérêt et l’utilisation des outils numériques sont cependant fortement recommandés.

 

Chaque participant se munira d’un ordinateur portable pour les travaux pratiques.

Points forts

  • Utiliser R pour des cas pratiques
  • Comprendre le processus complet de traitement des données
  • Astuces et bonnes pratiques concernant l’utilisation des modèles dans une entreprise d’assurance

Témoignages

  • «Formateur à l'écoute et pédagogue. »NP, Chargé d’études statistiques – MACIF
  • «Le programme est en cohérence avec mes attentes. L'exposé a été très clair. »MK, Actuaire – AXA
  • «Le programme est très intéressant et le formateur est passionné. »GL, Responsable de l’actuariat – ADDING
Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations