L'albero delle decisioni


Problema: addestrare un modello per: 1) distinguere tra le diverse specie del fiore Iris in base a quattro caratteristiche; e 2) prevedere quali passeggeri sono sopravvissuti sul Titanic in base a otto caratteristiche diverse - il tutto utilizzando il metodo dell'albero decisionale.

Contesto: L'albero decisionale è un algoritmo di apprendimento automatico semplice ma potente. È facile da capire ed è in circolazione da molto tempo.

Tipo di modello: Albero decisionale

Cosa abbiamo fatto: Nello sviluppo del modello di apprendimento automatico, abbiamo iniziato con il processo di convalida incrociata k-fold, in cui abbiamo prima di tutto diviso il set di dati di formazione in k pezzi. Abbiamo quindi addestrato il modello su k-1 pezzi e valutato il modello sull'ultimo pezzo. Abbiamo ripetuto questo processo calcolando l'accuratezza media dei risultati del modello. Quando i risultati della convalida incrociata sono stati soddisfacenti, abbiamo addestrato il modello sull'intero set di dati di addestramento.

In questa demo abbiamo due set di dati: Iris Flower e Titanic. Per il set di dati Iris Flower, il modello legge quattro misure del fiore (anche dette input o feature) per determinare la specie di Iris in questione. I quattro input sono: lunghezza del sepalo, larghezza del sepalo, lunghezza del petalo e larghezza del petalo.

Per il set di dati del Titanic, il modello legge otto caratteristiche di ogni passeggero per determinare se un determinato passeggero è sopravvissuto o meno all'affondamento del Titanic.

Scegliete un set di dati qui sotto e poi provate a fare la convalida incrociata, l'addestramento e/o l'addestramento e il test del modello di albero decisionale.


Provate oggi stesso l'apprendimento automatico self-service