Data Science appliquée à la qualité des données et aux données géographiques

Cette formation donne 84 points PPC aux membres qualifiés de l’Institut des Actuaires
Dernière mise à jour en novembre 2022

Programme de la formation

Objectifs et enjeux de la qualité des données

  • Types d’anomalies
  • Types de risques et d’impacts financiers

Bonnes pratiques et organisation des données

  • Types de fichiers et de données
  • Organisation des fichiers et des données.

Principes de traitements d’anomalies

  • Explorer les données pour détecter les valeurs aberrantes
  • Traiter les anomalies des variables numériques, des variables catégoriques, des variables textuelles.
  • Calculer un score de vraisemblance

Techniques de data science mises en œuvre

  • Webscrapping, text-mining, Machine learning, séries temporelles.
  • Clustering pour détecter des valeurs aberrantes
  • Méthodes de classifications pour calculer un score de qualité

Cas d’application

  • Vérification textuelle
  • Incohérence de catégories
  • Règles de calculs déterministes
  • Règles multi-critères
  • Segmentation des indicateurs multiples

Manipulation de données géographiques

  • Sources des données géographiques, format des données
  • Cartes thématiques, cartes avec fonds divers, cartes interactives
  • Segmentation des données et zoniers
  • Utilisation dans la classification et la régression

Construction d’un géocoedur

  • Principe de géocodage
  • Programme d’un géocodeur
  • Déploiement de la solution

Étude de cas

  • Étude de densité et de concentration
  • Zones inondables et assurés sinistrés
  • Géolocalisation des accidents automobiles
Dernière date
20 et 21 novembre 2023
Inscription possible jusqu'à la veille de la formation 16h (hors weekend et jour férié)

DISPONIBLE EN INTRA SUR DEMANDE

Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 2300 € HT
  • TVA 20%
  • 2760 € TTC
Lieu

CARITAT, 24 rue Tronchet 75008 PARIS

Durée

2 jours

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Il est diplômé de l'École Centrale Paris et titulaire d'un master en actuariat de l'Université Paris Dauphine. Il a travaillé chez Axa Global Direct et Allianz, avant de rejoindre Diot Siaci en 2022, au titre de Responsable du Data Lab.

Points clés

À qui s’adresse cette formation ?

Aux actuaires et data scientistes, informaticiens qui gèrent les bases de données, responsables de la qualité des données.

Pour obtenir quoi ?

Comprendre différents types d’anomalies et de risques liés à la qualité des données ;

Utiliser des techniques data science pour contrôler la qualité des données ;

Comment contrôler automatiquement la qualité des données ;

Analyser les besoins d’un géocodeur et présenter les données externes pour enrichir les données internes.

Quels objectifs pédagogiques ?

Analyser la qualité des données.

Développer des techniques avancées de correction d’anomalies.

Maîtriser et intégrer les données géographiques externes.

Quelles méthodes mobilisées ?

Par des études de cas et cas pratiques avec « R ».

Quels sont les prérequis ?

La connaissance du langage de programmation « R » .

Quelles modalités d’évaluation ?

Une évaluation des acquis des objectifs sera réalisée durant la formation.

Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations