Vi è mai capitato di lavorare su un progetto e scontrarvi con il problema di avere dati di scarsa q...

Vi è mai capitato di lavorare su un progetto e scontrarvi con il problema di avere dati di scarsa qualità? Noi si :’D e ve lo spieghiamo con questo meme sul Laboratorio di Dexter. I dati grezzi, anche detti raw data, sono come un uomo primitivo che non ha ancora sviluppato la capacità di parlare. È pieno di informazioni, ma non è ancora in grado di comunicarle. Per questo, quando si ha a che fare con dati non elaborati il Data Scientist ha la responsabilità di guidarli nel processo di trasformazione per estrarne il massimo potenziale. Diversi sono gli step che devono essere eseguiti affinché questa procedura sia completa e l’informazione sia pronta ad entrare in un modello di Machine Learning. Tra questi troviamo l’individuazione e la rimozione di dati duplicati o di valori anomali che potrebbero essere dannosi, la gestione dei dati mancanti, la normalizzazione e tante altre tecniche. C’è un famoso principio del settore informatico che è “Garbage In, Garbage Out” che evidenzia come l’inserimento di dati di scarsa qualità porterà a risultati altrettanto scadenti. E voi quali tecniche usate per migliorare i vostri dati? #vedrai #intelligenzaartificiale

© 2021 Fiera Milano SpA - P.IVA 13194800150
Si è verificato un errore