Dans le cours : Machine learning : Traitement du langage naturel avec Python
Accédez au cours complet aujourd’hui
Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.
Réaliser le stemming avec NLTK - Tutoriel Python
Dans le cours : Machine learning : Traitement du langage naturel avec Python
Réaliser le stemming avec NLTK
Nous allons continuer nos étapes de préparation de données avec cette fois-ci l'application avec un exemple concret de « stemming » sur notre jeu de données. C'est-à-dire nous allons appliquer un des algorithmes de stemming afin de contracter les mots contenus dans les e-mails de notre jeu de données. Nous allons réaliser cet exemple toujours avec la langage Python et dans l'environnement Jupyter. Pour réaliser notre exemple, nous allons commencer par importer la bibliothèque nltk et également importer un des algorithmes de stemming les plus utilisés qui est défini avec cette méthode PorterStemmer. Nous allons appliquer cette méthode de stemming sur les deux mots racines au pluriel et racine au singulier. Juste pour illustrer l'effet que la méthode de stemming a sur ces deux mots. Comme vous pouvez le constater, ces deux mots ont été contractés dans leur racine commune qui est « racin ». Ce mot, je ne suis même pas sûr si ça existe dans le dictionnaire français. Cela est un…
Entraînez-vous tout en suivant la formation avec les fichiers d’exercice.
Téléchargez les fichiers utilisés par l’instructeur pour enseigner le cours. Suivez attentivement et apprenez en regardant, en écoutant et en vous entraînant.
Table des matières
-
-
-
-
-
(Verrouillé)
Aborder les étapes de préparation des données3 m 32 s
-
(Verrouillé)
Réaliser un exemple de nettoyage de données4 m 56 s
-
(Verrouillé)
Supprimer les stopwords5 m 4 s
-
(Verrouillé)
Réaliser le stemming avec NLTK4 m 28 s
-
Pratiquer la lemmatization avec NLTK4 m 24 s
-
(Verrouillé)
Comparer le stemming et la lemmatization2 m 30 s
-
(Verrouillé)
-
-
-
-
-
-
-