Qualité des données et Data science

Cette formation donne 42 points PPC aux membres qualifiés de l’Institut des Actuaires

Programme de la formation

Objectifs et enjeux de la qualité des données

  • Types d’anomalies (erreurs de saisies, fautes d’orthographe, erreurs intentionnelles, défaillance du système, etc.)
  • Différents types de risques et d’impacts financiers

Bonnes pratiques et organisation des données

  • Comment mieux organiser les fichiers
  • Comment organiser les données
  • Types de fichiers et de données

Principes de traitements d’anomalies

  • Comment explorer les données pour détecter les valeurs aberrantes
  • Comment traiter les anomalies des variables
    •  numériques
    • catégoriques
    •  textuelles
      • Identifier des clients doublons
      • Identifier les anomalies des adresses (un petit exemple)
      • Incohérences par rapport aux clauses des contrats
  • Calculer un score de vraisemblance

Techniques de data science mises en oeuvre

  • Découvrir comment les techniques de data science permettent de contrôler la qualité des données
    • Webscraping
    • Text-mining
    • Machine learning
    • Analyse des séries temporelles
  • Comment les méthodes clustering permettent de détecter des valeurs aberrantes
  • Comment les méthodes de classifications permettent de calculer un score de qualité

Cas d’application

  • Vérification textuelle (noms clients, adresses, clauses contrats, et autres saisies manuelles de textes)
  • Incohérence de catégories
  • Règles de calculs déterministes
  • Règles multi-critères
  • Segmentation des indicateurs multiples
Date

18 mars 2019

Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 2100 € HT
  • TVA 20%
  • 2520 € TTC
Lieu

CARITAT, 5 rue Tronchet 75008 PARIS

Durée

1 jour

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Membre certifié de l’IA. Il est titulaire d’un master en actuariat de l’Université Paris Dauphine et a également fait l’École Centrale Paris. Il a travaillé chez Prim’Act, Direct Assurance et Aviva, avant de rejoindre Allianz en 2017, au titre de Data Scientist.

Points clés

À qui s’adresse cette formation ?

Aux actuaires et data scientists, informaticiens qui gèrent les bases de données, managers et directeurs responsables de la qualité des données.

Pour obtenir quoi ?

Comprendre différents types d’anomalies et de risques liés à la qualité des données ;

Utiliser des techniques data science pour contrôler la qualité des données ;

Apprendre comment le machine peut aider à prédire la qualité des données et comment contrôler automatiquement la qualité des données.

Comment ?

Avec des études de cas et cas pratiques avec R.

Quels sont les prérequis ?

Aucun. Cependant la connaissance du langage de programmation R peut aider dans les cas pratiques.

 

Chaque participant se munira d’un ordinateur portable pour les travaux pratiques.

Points forts

  • Retour d’expériences sur des applications concrètes
  • Manipulation d’une base de données utilisée en assurance
Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations