Quel est le principe mathématique derrière le text mining ?

 

 

La technique du text mining doit tout d'abord contenir un algorithme de catégorisation de texte, capable de classer le texte parmi un ensemble pré-défini de catégories.

Pour faire cela, le principe mathématique est de construire un arbre de décision à partir d'une base d'apprentissage de données. Grâce à cette base, on crée un arbre auquel on confronte notre base test.

Une autre étape du text mining est le text clustering, il s'agit de regrouper ensemble les textes similaires par le biais d'une carte d'auto-organisation par exemple.

L'exploitation des concepts du texte se fait en combinant des méthodes de classification et de catégorisation.

On utilise une analyse des concepts afin de hiérarchiser ces derniers et de trouver les concepts forts du document.

Il faut aussi introduire des algorithmes de recherche d'information lorsque le but de l'étude est la recherche sélective d'informations.

 

Article publié le 2 novembre 2015 par Comité de Caritat.

Posez votre question, nos experts vous répondront