Dans le cours : Machine learning : Traitement du langage naturel avec Python

Accédez au cours complet aujourd’hui

Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.

Utiliser le SVM avec TF-IDF

Utiliser le SVM avec TF-IDF

Dans tous les exemples précédents, lorsque nous avons réalisé un modèle de classification pour détecter les e-mails qui sont des spams de ceux qui ne le sont pas, en utilisant l'algorithme Support Vector Machine, nous avions utilisé l'algorithme de vectorisation CountVectorizer, qui consistait, pour rappel, à compter le nombre d'occurrences de chacun des mots dans tous les e-mails, pour ainsi construire une matrice qui a, au niveau des colonnes, les mots et au niveau des lignes, les e-mails et en rapportant à chaque fois, dans chaque cellule de cette matrice, le nombre d'occurrences de chaque mot dans chaque e-mail. Dans cet exemple, nous allons réaliser le même objectif que précédemment, c'est-à-dire nous allons appliquer l'algorithme Support Vector Machine, afin de construire un modèle de classification des e-mails. Sauf que cette fois, nous n'allons pas utiliser la méthode de vectorisation CountVectorizer, mais plutôt, nous allons utiliser la méthode TF-IDF. Ici, nous allons…

Table des matières