Αναρτήσεις

Εμφάνιση αναρτήσεων με την ετικέτα Data

Free online R books...

Με αφορμή το γεγονός ότι ασχολούμαι ξανά μετά από χρόνια με την R, η παρακάτω λίστα θα φανεί πολύ χρήσιμη σε όποιον θέλει να μάθει και να κατανοήσει τις δυνατότητες αυτής της πολύ συμπαθούς γλώσσα προγραμματισμού... Είναι βιβλία πάνω σε διάφορα θέματα γύρω από και μέσα στο οικοσύστημα της R και διατίθενται δωρεάν από τους ίδιους τους συγγραφείς τους...  "R for Data Sciense" - Hadley Wickam & Garrett Grolemund "Hands-On Programming with R" - Garrett Grolemund "Advanced R" - Hadley Wickam "R packages" - Hadley Wickam & Jenny Bryan "Fundamentals of Data Visualization" - Claus Wilke  "Forecasting: Principles and Practice" - Rob J. Hyndman & George Athanasopoulos "Mastering Shiny" - Hadley Wickam "Geocomputation with R" - Robin Lovelace & Jacub Novosad & Jannes Muenchow

Common lingo...

Γίνεται συνεπές και αξιόπιστο reporting χωρίς συνεπή και αξιόπιστα data;  Η απάντηση είναι όχι... Γίνεται να μην υπάρχει κοινή ορολογία μεταξύ των τμημάτων μιας εταιρείας και να απαιτούμε να έχουμε συνεπές και αξιόπιστο reporting; Η απάντηση  είναι πάλι όχι... Οι έννοιες και οι ορολογίες που ορίζουν το business logic πρέπει να είναι σαφώς ορισμένες, να έχουν επικοινωνηθεί και να έχουν επικυρωθεί από όλους... Αν υπάρχει πολυγλωσσία και σύγχυση μεταξύ των τμημάτων μια εταιρείας πώς μπορούμε να περιμένουμε reconciliated και ακριβή αποτελέσματα; Material Group, Molecule, Product όλα σημαίνουν το ίδιο πράγμα, χρησιμοποιούνται από διαφορετικά τμήματα και ο κάθε ορισμός μπορεί να είναι παντελώς άγνωστος σε όσους δεν τον χρησιμοποιούν... Ο BI Engineer/Analyst δεν είναι μάγος... Δουλεύει με δεδομένα και το αποτέλεσμα της δουλειάς του είναι τόσο ακριβές όσο τα δεδομένα και τα specs που έχει στα χέρια του... Ο οποιοσδήποτε οργανισμός αν θέλει να έχει σωστό reporting και business i

Εισαγωγή δεδομένων UTF-8 στον SQL Server...

Εικόνα
Το σημερινό post γράφεται για δύο λόγους: Ο πρώτος είναι ότι όλοι όσοι έχουμε δουλέψει με δεδομένα σε γλώσσες άλλες από αυτές που χρησιμοποιούν το Λατινικό αλφάβητο, ξέρουμε πολύ καλά πόσο μεγάλος μπελάς είναι... Ο δεύτερος είναι ότι επειδή έφαγα σχεδόν δυο μέρες για να καταφέρω να φορτώσω ένα αρχείο txt tab delimited σε μια βάση SQL Server 2008 R2, θέλω να θυμάμαι τον λόγο και την αιτία της ταλαιπωρίας μου έτσι ώστε να μην περάσω τα ίδια αν χρειαστεί να το επαναλάβω μετά από καιρό και να βοηθηθεί και κάποιος άλλος που μπορεί να έχει το ίδιο πρόβλημα και να σπάει το κεφάλι του, όπως έκανα εγώ... Έστω λοιπόν ότι έχετε ένα txt αρχείο με δεδομένα τα οποία περιέχουν πεδία στα ελληνικά, το encoding του αρχείου είναι UTF-8 και δουλεύετε σε ένα μηχάνημα που το locale του είναι Greek... Δοκιμάζοντας να κάνετε import το αρχείο σε μια βάση SQL Server μέσω του Management Studio πιθανότατα δεν θα το καταφέρετε με την πρώτη... Κατά πάσα πιθανότητα το error που θα συναντήσετε οι περισσότεροι θ