Outliers...

Αναδημοσιεύω σχόλιο μου στο post του Indiblog "Δύο παρόμοιοι θάνατοι, μία δεκαετία, δύο διαφορετικοί κόσμοι." επειδή πολύ μου άρεσε η εξυπνάδα που έγραψα...

Η βιομηχανία, η όποια βιομηχανία, προσπαθεί πάντα να ομαδοποιήσει και να προσδιορίσει ανθρώπους, καταστάσεις και προϊόντα βάση κοινών χαρακτηριστικών έτσι ώστε να μπορεί να διαχειριστεί την όποια στρατηγική της πιο στοχευμένα… Αυτή η τάση έχει οδηγήσει στο γεγονός σήμερα μια από τις πιο ακριβοπληρωμένες δουλειές στον χώρο της πληροφορικής και όχι μόνο, να είναι αυτή του data scientist/analyst… Ο data scientist/analyst προσπαθεί να μοντελοποιήσει τα δεδομένα έτσι ώστε να μπορέσει να τα ερμηνεύσει με τον πιο αποδοτικό τρόπο και να κάνει προβλέψεις, όσο γίνεται πιο επιτυχείς για το μέλλον… Τα μοντέλα δεν είναι αντιπροσωπευτικά 100%, υπάρχει πάντα το λεγόμενο διάστημα εμπιστοσύνης ή περιθώριο λάθους… Οι τιμές που δεν μπορούν να εξηγηθούν από το μοντέλο συνήθως αφαιρούνται από αυτό για να μην αλλοιώνουν τα τελικά αποτελέσματα… Οι τιμές αυτές λέγονται outliers… Εσύ λοιπόν φίλε indi και άλλοι σαν κι εσένα είσαι outlier, είσαι η τιμή εκείνη που αλλοιώνει τα αποτελέσματα του μοντέλου…

Ελπίζω να μην βαρέθηκες πολύ από το μακροσκελές σχόλιό μου, καλή χρονιά εύχομαι!🙂

Σχόλια