Dans le cours : Python : L'analyse prédictive
Accédez à ce cours grâce à un essai gratuit
Inscrivez-vous aujourd’hui pour accéder à plus de 24 600 cours dispensés par des experts.
Aborder la séparation du jeu train et test - Tutoriel Python
Dans le cours : Python : L'analyse prédictive
Aborder la séparation du jeu train et test
Voyons maintenant comment nous pouvons utiliser la fonction qui nous permettra de séparer notre jeu de données en jeu d'entraînement et jeu de test. Pour cela, je vais utiliser dans un premier temps une technique que nous n'avons pas vue pour la partie Traitement des valeurs manquantes, c'est la partie Suppression des lignes qui contiennent des valeurs manquantes. Pour ce faire, je vais utiliser la fonction dropna, qui, comme son nom l'indique, permet de supprimer les valeurs manquantes. Ici, je restocke et j'écrase mon DataFrame wine_df, pour ne conserver que le jeu de données sans valeurs manquantes. Je vais dans un premier temps séparer mes variables explicatives et ma variable à prédire. Dans un premier temps, on va travailler sur la prédiction du type de données, que l'on va essayer de prédire en fonction des différentes caractéristiques que nous avons, à savoir notamment toutes les variables quantitatives. Je vais stocker dans la variable X l'ensemble des colonnes et des…
Table des matières
-
-
-
Identifier les types de données2 m 31 s
-
(Verrouillé)
Traiter les valeurs manquantes4 m 28 s
-
(Verrouillé)
Traiter les valeurs atypiques3 m 50 s
-
(Verrouillé)
Encoder les variables3 m 43 s
-
(Verrouillé)
Aborder la séparation du jeu train et test2 m 45 s
-
(Verrouillé)
Découvrir les techniques de scaling1 m 50 s
-
-
-
-