Dans le cours : Machine learning : Traitement du langage naturel avec Python
Accédez au cours complet aujourd’hui
Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.
Analyser les features - Tutoriel Python
Dans le cours : Machine learning : Traitement du langage naturel avec Python
Analyser les features
Nous avons ajouté deux nouvelles colonnes à notre jeu de données, à savoir la colonne Content_len qui reprend le nombre de caractères dans chaque e-mail sans considérer les espaces ; également, la colonne punctuation_rate qui nous renseigne sur le taux de caractères de ponctuation dans un e-mail. Nous avons rajouté ces deux colonnes dans le but de les utiliser pour construire un modèle de prédiction sur la nature d'un e-mail, à savoir si un e-mail est un spam ou pas. Nous avons supposé que ces deux variables que nous avons rajoutées ont un pouvoir de prédiction sur la nature effectivement d'un e-mail, à savoir si c'est un spam ou pas. Dans cette vidéo, nous allons visualiser graphiquement ces deux colonnes afin de mesurer leur pouvoir de prédiction sur le caractère spam ou pas d'un e-mail. Pour cela, nous allons charger la bibliothèque matplotlib. Puis, nous allons construire un graphique composé de deux histogrammes ; le premier sera construit en utilisant uniquement les e-mails qui…
Entraînez-vous tout en suivant la formation avec les fichiers d’exercice.
Téléchargez les fichiers utilisés par l’instructeur pour enseigner le cours. Suivez attentivement et apprenez en regardant, en écoutant et en vous entraînant.
Table des matières
-
-
-
-
-
-
(Verrouillé)
Comprendre la vectorisation avec CountVectorizer3 m 57 s
-
(Verrouillé)
Utiliser CountVectorizer5 m 3 s
-
(Verrouillé)
Effectuer une vectorisation contextuelle avec N-Grams4 m 49 s
-
(Verrouillé)
Étudier TF-IDF3 m 32 s
-
Utiliser TF-IDF5 m 32 s
-
(Verrouillé)
Appréhender le feature engineering4 m 1 s
-
(Verrouillé)
Ajouter des features aux données4 m 36 s
-
(Verrouillé)
Analyser les features4 m 10 s
-
(Verrouillé)
-
-
-
-
-
-