Dans le cours : Machine learning : Traitement du langage naturel avec Python

Accédez au cours complet aujourd’hui

Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.

Réaliser le stemming avec NLTK

Réaliser le stemming avec NLTK

Nous allons continuer nos étapes de préparation de données avec cette fois-ci l'application avec un exemple concret de « stemming » sur notre jeu de données. C'est-à-dire nous allons appliquer un des algorithmes de stemming afin de contracter les mots contenus dans les e-mails de notre jeu de données. Nous allons réaliser cet exemple toujours avec la langage Python et dans l'environnement Jupyter. Pour réaliser notre exemple, nous allons commencer par importer la bibliothèque nltk et également importer un des algorithmes de stemming les plus utilisés qui est défini avec cette méthode PorterStemmer. Nous allons appliquer cette méthode de stemming sur les deux mots racines au pluriel et racine au singulier. Juste pour illustrer l'effet que la méthode de stemming a sur ces deux mots. Comme vous pouvez le constater, ces deux mots ont été contractés dans leur racine commune qui est « racin ». Ce mot, je ne suis même pas sûr si ça existe dans le dictionnaire français. Cela est un…

Table des matières