Dans le cours : Machine learning : Traitement du langage naturel avec Python
Accédez au cours complet aujourd’hui
Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.
Utiliser le SVM avec TF-IDF - Tutoriel Python
Dans le cours : Machine learning : Traitement du langage naturel avec Python
Utiliser le SVM avec TF-IDF
Dans tous les exemples précédents, lorsque nous avons réalisé un modèle de classification pour détecter les e-mails qui sont des spams de ceux qui ne le sont pas, en utilisant l'algorithme Support Vector Machine, nous avions utilisé l'algorithme de vectorisation CountVectorizer, qui consistait, pour rappel, à compter le nombre d'occurrences de chacun des mots dans tous les e-mails, pour ainsi construire une matrice qui a, au niveau des colonnes, les mots et au niveau des lignes, les e-mails et en rapportant à chaque fois, dans chaque cellule de cette matrice, le nombre d'occurrences de chaque mot dans chaque e-mail. Dans cet exemple, nous allons réaliser le même objectif que précédemment, c'est-à-dire nous allons appliquer l'algorithme Support Vector Machine, afin de construire un modèle de classification des e-mails. Sauf que cette fois, nous n'allons pas utiliser la méthode de vectorisation CountVectorizer, mais plutôt, nous allons utiliser la méthode TF-IDF. Ici, nous allons…
Entraînez-vous tout en suivant la formation avec les fichiers d’exercice.
Téléchargez les fichiers utilisés par l’instructeur pour enseigner le cours. Suivez attentivement et apprenez en regardant, en écoutant et en vous entraînant.
Table des matières
-
-
-
-
-
-
-
-
(Verrouillé)
Modéliser en machine learning4 m 21 s
-
(Verrouillé)
Aborder l'algorithme Support Vector Machine4 m 40 s
-
(Verrouillé)
Utiliser le SVM avec scikit-learn et CountVectorizer5 m 49 s
-
(Verrouillé)
Tester le modèle de classification SVM5 m 7 s
-
(Verrouillé)
Mesurer les performances du modèle de classification SVM5 m 12 s
-
Utiliser le SVM avec la cross-validation4 m 55 s
-
(Verrouillé)
Utiliser le SVM avec TF-IDF4 m 15 s
-
(Verrouillé)
-
-
-
-