Dans le cours : Machine learning : Traitement du langage naturel avec Python

Accédez au cours complet aujourd’hui

Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.

Comprendre le pipeline de modélisation NLP

Comprendre le pipeline de modélisation NLP

De manière générale, pour réaliser une expérimentation en machine learning, il faudrait suivre dans l'ordre un certain nombre d'étapes. En NLP, pour construire un modèle de prédiction, il faudrait suivre l'ensemble des étapes suivantes. La première étape consiste à récolter les données. En effet, lorsqu'on travaille en machine learning, de maniére générale, pour construire un modèle quelconque nous procédons par l'entraînement d'un algorithme sur un jeu de données. C'est pour cette raison que la toute première étape consiste à récolter les données. Ces données vont servir, d'une part, pour entraîner un modèle et, d'autre part, pour tester le modèle construit. La deuxième étape consiste à nettoyer et préparer les données. Ces deux opérations, c'est-à-dire nettoyage et préparation des données, vont nous permettre de partir des jeux de données bruts et aboutir à un jeu de données sur lequel on peut réellement entraîner un algorithme. La troisième étape consiste à la vectorisation des…

Table des matières