Αναρτήσεις

Εμφάνιση αναρτήσεων με την ετικέτα Data Science

Free online R books...

Με αφορμή το γεγονός ότι ασχολούμαι ξανά μετά από χρόνια με την R, η παρακάτω λίστα θα φανεί πολύ χρήσιμη σε όποιον θέλει να μάθει και να κατανοήσει τις δυνατότητες αυτής της πολύ συμπαθούς γλώσσα προγραμματισμού... Είναι βιβλία πάνω σε διάφορα θέματα γύρω από και μέσα στο οικοσύστημα της R και διατίθενται δωρεάν από τους ίδιους τους συγγραφείς τους...  "R for Data Sciense" - Hadley Wickam & Garrett Grolemund "Hands-On Programming with R" - Garrett Grolemund "Advanced R" - Hadley Wickam "R packages" - Hadley Wickam & Jenny Bryan "Fundamentals of Data Visualization" - Claus Wilke  "Forecasting: Principles and Practice" - Rob J. Hyndman & George Athanasopoulos "Mastering Shiny" - Hadley Wickam "Geocomputation with R" - Robin Lovelace & Jacub Novosad & Jannes Muenchow

Σε αυτή την στάση κατεβαίνω...

Εκεί στα τέλη του 2014, επηρεασμένος από το hype που κυριαρχούσε (και κυριαρχεί ακόμα) και από τη θέληση μου για εξέλιξη, προσωπική κι επαγγελματική, αποφάσισα να ανέβω στο τρένο που λέγεται Data Sciense ... Μέχρι τότε είχα μια δεκαετή καριέρα ως DWH / ETL Developer, είχα μόλις εισέλθει στον κόσμο των Analytics (βλέπε Qlikview ) και είχα διάθεση για κάτι νέο και μεγάλο, κατάλληλο για την νέα επαγγελματική αρχή που είχα κάνει από την αρχή εκείνης της χρονιάς στην Τράπεζα Πειραιώς...Είχαν προηγηθεί άρθρα που ανακήρυτταν την δουλειά του Data Scientist ως την πιο sexy του 21ου αιώνα , καινούργια buzzwords που συναντούσες όλο και συχνότερα όπως Big Data , Hadoop , MapReduce και η υπόσχεση ότι το Data Sciense θα διαμορφώσει το μέλλον τόσο σε προσωπικό όσο και παγκόσμιο επίπεδο...  Ασχολήθηκα πολύ με αυτό, επένδυσα και χρήμα και χρόνο ... Ξόδεψα τουλάχιστον 2 χρόνια από τη ζωή μου σε αυτή την υπόθεση προσπαθώντας να γίνω όσο καλύτερος γινόταν... Ήξερα από την αρχή ότι η Στατιστική...

Όταν το ενδιαφέρον στερεύει...

Τι κάνεις όταν ξαφνικά συνειδητοποιείς ότι κάτι στο οποίο έχεις επενδύσει πολύ χρόνο και χρήμα δεν σε ενδιαφέρει πια; Σφίγγεις τα δόντια και ολοκληρώνεις την προσπάθεια έτσι ώστε να αποκτήσεις έστω τα certifications για τα οποία έχεις μοχθήσει για να τα έχεις έστω στο cv σου ή τα παρατάς όλα εκεί που έμειναν ανολοκλήρωτα; Ασχολούμαι με τον χώρο και το γνωστικό αντικείμενο που έχει επικρατήσει να λέγεται Data Sciense από το 2015, έχω παρακολουθήσει αμέτρητα tutorials, έχω γράψει πολύ κώδικα, έχω πάρει σχετικό certification και τώρα που μιλάμε βρίσκομαι στην διαδικασία απόκτησης ενός δεύτερου... Το πρόβλημα είναι, παρά το γεγονός ότι εξακολουθεί να είναι το απόλυτο buzz word στον χώρο της πληροφορικής, εγώ απλά βαρέθηκα... Δεν έχω τον ενθουσιασμό που είχα όταν ξεκίνησα, η Στατιστική μου φαίνεται πιο βαρετή από ότι μου φαινόταν παλιότερα και η σχετική μελέτη μου φαίνεται αγγαρεία... Σίγουρα παίζει ρόλο το ότι στην καθημερινή μου εργασία δεν έχουν εφαρμογή όλες αυτές οι τεχνολογίες κ...

Outliers...

Αναδημοσιεύω σχόλιο μου στο post του Indiblog "Δύο παρόμοιοι θάνατοι, μία δεκαετία, δύο διαφορετικοί κόσμοι." επειδή πολύ μου άρεσε η εξυπνάδα που έγραψα... Η βιομηχανία, η όποια βιομηχανία, προσπαθεί πάντα να ομαδοποιήσει και να προσδιορίσει ανθρώπους, καταστάσεις και προϊόντα βάση κοινών χαρακτηριστικών έτσι ώστε να μπορεί να διαχειριστεί την όποια στρατηγική της πιο στοχευμένα… Αυτή η τάση έχει οδηγήσει στο γεγονός σήμερα μια από τις πιο ακριβοπληρωμένες δουλειές στον χώρο της πληροφορικής και όχι μόνο, να είναι αυτή του data scientist/analyst… Ο data scientist/analyst προσπαθεί να μοντελοποιήσει τα δεδομένα έτσι ώστε να μπορέσει να τα ερμηνεύσει με τον πιο αποδοτικό τρόπο και να κάνει προβλέψεις, όσο γίνεται πιο επιτυχείς για το μέλλον… Τα μοντέλα δεν είναι αντιπροσωπευτικά 100%, υπάρχει πάντα το λεγόμενο διάστημα εμπιστοσύνης ή περιθώριο λάθους… Οι τιμές που δεν μπορούν να εξηγηθούν από το μοντέλο συνήθως αφαιρούνται από αυτό για να μην αλλοιώνουν τα τελικά αποτε...

Μεγάλη η χάρη του...

Ξεκίνησα σήμερα να διαβάζω το πολλά υποσχόμενο "Getting Started with Data Science: Making Sense of Data with Analytics" του Murtaza Haider  αλλά ομολογώ ότι το παρακάτω quote σχετικά με τον ορισμό του τι είναι μηχανικός (engineer) με άφησε άναυδο για μερικά δευτερόλεπτα... Η μορφοποίηση του κειμένου είναι δική μου... ...Professor Rajan is an engineer. So are Xi Jinping , the President of the People’s Republic of China, and Alexis Tsipras, the Greek Prime Minister who is forcing the world to rethink the fundamentals of global economics . They might not be designing new circuitry, distillation equipment, or bridges, but they are helping build better societies and economies ...

Κοίτα μαμά, τα κατάφερα, είμαι Data Scientist...

Εικόνα
17 μήνες μετά, με ξενύχτια, με διάβασμα, με κούραση, με πολλές ώρες πάνω από τον υπολογιστή, είτε στο σπίτι είτε στα Starbucks της πλατείας όπου κατέφευγα για λίγη ησυχία για να μπορέσω να μελετήσω... Αυτό που ξεκίνησε το Γενάρη του 2015 τελείωσε σήμερα το πρωί, κατάφερα και ολοκλήρωσα το Data Sciense Specialization που προσφέρεται από το Coursera και το JHU με βαθμό 95% , όχι κι άσχημα νομίζω... :) Ήταν μια πολύ ωραία εμπειρία, το ευχαριστήθηκα πολύ, έμαθα καινούργια πράγματα, απέκτησα μια διαφορετική οπτική πάνω στην έννοια της πληροφορίας όπως την γνώριζα από την μέχρι τώρα επαγγελματική μου εμπειρία, ήταν η επίτευξη ενός στόχου που είχα θέσει στον εαυτό μου για να αναπληρώσω (ως ένα βαθμό τουλάχιστον) το μεταπτυχιακό που δεν έκανα ποτέ μου... Υ.Γ. Το πιστοποιητικό, προφανώς, έχει τροποποιηθεί λιιιιιίγο... :)

Data Science specialisation capstone project...

Αύριο ξεκινάει το τελευταίο μέρος της προσπάθειας που ξεκίνησε τον Ιανουάριο του 2015 με στόχο το Data Science specialisation από το Coursera και το JHU ... Για τους επόμενους δύο μήνες θα δουλεύω πάνω στο capstone project  του course, της πτυχιακής εργασίας όπως θα λέγαμε ελληνιστί... Ελπίζω να πάνε όλα καλά, χωρίς απρόοπτα και στα μέσα του Ιουνίου να έχω αποκτήσει τον τίτλο του Data Scientist...