L'arbre de décision


Problème: former un modèle pour : 1) distinguer les différentes espèces de fleurs d'iris sur la base de quatre caractéristiques ; et 2) prédire quels passagers ont survécu sur le Titanic sur la base de huit caractéristiques différentes - le tout en utilisant la méthode de l'arbre de décision.

Contexte: L'arbre de décision est un algorithme d'apprentissage automatique simple mais puissant. Il est facile à comprendre et est en circulation depuis longtemps.

Type de modèle: Arbre de décision

Ce que nous avons fait: Pour développer le modèle d'apprentissage automatique, nous avons commencé par le processus de validation croisée k-fold, dans lequel nous avons d'abord divisé l'ensemble de données d'apprentissage en k morceaux. Nous avons ensuite formé le modèle sur les k-1 morceaux et évalué le modèle sur le dernier morceau. Nous avons répété ce processus tout en calculant la précision moyenne des résultats du modèle. Lorsque les résultats de la validation croisée sont satisfaisants, nous entraînons le modèle sur l'ensemble des données d'entraînement.

Dans cette démonstration, nous disposons de deux ensembles de données : la fleur d'iris et le Titanic. Pour l'ensemble de données Fleur d'iris, le modèle lit quatre mesures de la fleur (également appelées entrées ou caractéristiques) afin de déterminer l'espèce de fleur d'iris en question. Les quatre entrées sont : la longueur et la largeur des sépales, la longueur et la largeur des pétales.

Pour l'ensemble de données du Titanic, le modèle lit huit caractéristiques de chaque passager afin de déterminer si un passager donné a survécu ou non au naufrage du Titanic.

Choisissez un ensemble de données ci-dessous et essayez de procéder à une validation croisée, à un entraînement et/ou à un entraînement et à un test du modèle d'arbre de décision.


Essayez l'apprentissage automatique en libre-service dès aujourd'hui