A Web Full of Data – Talk at TEDx UniversityOfIoannina 2017 (Tzamtzis, Gkesoulis)

Last week on Saturday (May 6th) I had the chance to talk, with my colleague Dimitris Gkesoulis, about what we love the most (digital analytics) at TEDx UniversityOfIoannina 2017. It was a great chance for us to present to a crowd, that is not relevant with analytics, how we imagine the future of digital analytics, how we think they can improve our every day life and also educate them on the web tracking technologies and the risks.

The complete talk and the rest of the talks of the conference are also available online:

You can download our full presentation here or view it online. The talk is in Greek.


Below is a draft transcript of our talk:

Θα σας μιλήσουμε σήμερα για όλα αυτά που συμβαίνουν όταν κάποιος περιηγείται στο διαδίκτυο. Πολλοί ίσως το ξέρετε, άλλοι ίσως το φαντάζεστε, αλλά κάθε κίνηση που κάνουμε online μεταφέρει πληροφορίες από την συσκευή μας σε προς άλλους υπολογιστές που είναι συνδεμένοι στο διαδίκτυο. Αυτές οι πληροφορίες, χωρίς να το καταλαβαίνουμε, στις περισσότερες περιπτώσεις συλλέγονται και στην συνέχεια αναλύονται. Με όλες αυτές τις πληροφορίες καταφέρνουν τα website να εξελίσσονται, προς την σωστή κατεύθυνση, για να έρθουν πιο κοντά στις συνήθειες των επισκεπτών και να γίνονται ευκολότερα στην χρήση. Η συλλογή και ανάλυση online δεδομένων είναι μια σχετικά καινούργια επιστήμη – άρχισε να χρησιμοποιείται ευρέως τα τελευταία 10 χρόνια περίπου – αλλά έχει γνωρίσει τρομερή ανάπτυξη τα τελευταία χρόνια.

Παρόλο που δεν είναι ακόμα αρκετά ώριμη στην Ελλάδα, εμείς έχουμε την τύχη να ασχολούμαστε με αυτό το αντικείμενο σε μια εταιρία που δουλεύει εξολοκλήρου με πελάτες από το εξωτερικό, αλλά εδρεύει στην Θεσσαλονίκη. Με αυτό τον τρόπο θέλουμε να πιστεύουμε ότι έχουμε συνδυάσει το ιδανικό περιβάλλον εργασίας παραμένοντας συγχρόνως δίπλα στο σπίτι μας. Το μοναδικό αντικείμενο της εταιρίας μας είναι η συλλογή και ανάλυση των ηλεκτρονικών δεδομένων.

Παρόλο που η δουλειά μας δεν είναι τόσο cool, όσο φαίνεται να είναι σε μερικές σειρές και ταινίες,  οι αναλυτές δεδομένων αυτή τη στιγμή είναι μια από τις πιο δυσεύρετες (και τις πιο “hot”) ειδικότητες στην παγκόσμια αγορά. Αυτό δεν φαίνεται να αλλάζει μέσα στα επόμενα χρόνια αφού τα δεδομένα που υπάρχουν διαθέσιμα συνεχώς αυξάνονται, άρα και η ανάγκη για αναλύσεις θα γίνεται όλο και μεγαλύτερη.

Εισαγωγή σε Digital analytics

Όταν αναφερόμαστε γενικά στη συλλογή και την ανάλυση δεδομένων από ηλεκτρονικές πηγές για συντομία χρησιμοποιούμε τον όρο digital analytics. Η συγκεκριμένη επιστήμη, εκτός από τα website, εφαρμόζεται ήδη σε πολλούς τομείς αφού μπορεί να χρησιμοποιηθεί οπουδήποτε υπάρχουν διαθέσιμα στοιχεία από μετρήσεις.

  • Ένα πολύ συνηθισμένο παράδειγμα για όποιον έχει ασχοληθεί με το μάρκετινγκ είναι τα supermarket. Μέσω των καρτών μέλους γίνεται ανάλυση των συνηθειών αγορών. Με αυτό τον τρόπο καταφέρνει μια επιχείρηση να προωθήσει τα προϊόντα της πολύ πιο στοχευμένα ή να δημιουργήσει συνδυαστικές προσφορές που θα έχουν μεγαλύτερη απήχηση.
  • Τελευταία χρόνια έχει αρχίσει να βρίσκει εφαρμογή και σε πολυκαταστήματα για την ανάλυση της κίνησης των επισκεπτών μέσα στον φυσικό χώρο. Χρησιμοποιώντας αισθητήρες κίνησης και κάμερες γίνεται παρακολούθηση του κόσμου που κινείται μέσα στο κατάστημα, για τον εντοπισμό διαδρόμων ή σημείων μέσα στον χώρο με μικρή κίνηση, που παραμένουν ανεκμετάλλευτα.
  • Ακόμα και σε αθλήματα όπως η Formula1 ή το ποδόσφαιρο γίνεται καταγραφή της απόδοσης για να βρεθούν οι ιδανικές συνθήκες που θα βελτιώσουν το τελικό αποτέλεσμα κάθε αθλητή.
  • Άλλο παράδειγμα είναι οι αγροτικές καλλιέργειες όπου έχουν αρχίσει να χρησιμοποιούνται συστήματα για την καταγραφή της κατάστασης του εδάφους και των καιρικών συνθηκών. Συνδυάζοντας αυτά τα δεδομένα μπορεί να γίνει καλύτερη διαχείριση της παραγωγής και να ελαχιστοποιήσουμε την χρήση λιπασμάτων

Με τόσες εφαρμογές ο όγκος των δεδομένων που καταλήγει να είναι διαθέσιμος, είναι τεράστιος! Γιαυτό και μέσα από διάφορες τεχνικές έξυπνης ανάλυσης καταφέρνουμε να εξάγουμε συμπεράσματα τα οποία ούτε τα είχαμε φανταστεί παλιότερα.

Web analytics

Όταν αναφερόμαστε μόνο σε δεδομένα που προέρχονται από ιστοσελίδες διαδικτύου, συνηθίζουμε να χρησιμοποιούμε τον όρο web analytics. Σήμερα θα σας κάνουμε μια εισαγωγή στις τεχνικές και τις διαδικασίες που χρησιμοποιούνται από μικρά μέχρι παγκόσμιας εμβέλειας website.
Με αυτούς τους τρόπους καταλαβαίνουμε με μεγάλη ακρίβεια πως αλληλεπιδρούν οι επισκέπτες, αν είναι ευχαριστημένοι με το περιεχόμενο που βλέπουν και ποια είναι τα σημεία που μπορούν να βελτιωθούν. Μπορεί αν δεν υπήρχαν τα web analytics ακόμα το internet να ήταν γεμάτο website που παίζουν μουσική και ηλεκτρονικά καταστήματα που σου ζητούν να δημιουργήσεις λογαριασμό πριν μπορέσεις να κάνεις μια αγορά, γιατί απλά δεν θα υπήρχαν οι μετρήσεις που θα έδειχναν ότι αυτά είναι χαρακτηριστικά που κάνουν δυσκολεύουν έναν επισκέπτη.

Ας το σκεφτούμε και στην πραγματική μας ζωή, ας πούμε για παράδειγμα ότι έχουμε ένα κατάστημα στο κέντρο των Ιωαννίνων και αποφασίζουμε να κάνουμε μια βελτίωση – μια αλλαγή της ταμπέλας, να βάλουμε μια διαφήμιση στο ραδιόφωνο ή να αλλάξουμε την βιτρίνα. Θα μπορέσουμε να πάρουμε μια ιδέα για το πως αυτή η αλλαγή επηρεάζει τους πελάτες μας, απλά παρατηρώντας τις αντιδράσεις του κόσμου, ρωτώντας όσους μπαίνουν στο κατάστημα ή βλέποντας αν περνάει περισσότερος κόσμος για να δει την βιτρίνα.

Όταν είσαι όμως ιδιοκτήτης ενός ηλεκτρονικού καταστήματος δεν έχεις σχεδόν καθόλου ορατότητα για το τι συμβαίνει μέχρι κάποιος να αποφασίσει να αγοράσει κάτι. Αυτό το κενό στην πληροφορία γίνεται όλο και μεγαλύτερο με την εξέλιξη της τεχνολογίας και την εξοικείωση των ανθρώπων με αυτή. Η φυσική επικοινωνία του πελάτη με τους διαχειριστές ενός ηλεκτρονικού καταστήματος, γίνεται όλο και μικρότερη. Ειδικότερα με την πρόοδο στην τεχνητή νοημοσύνη, προβλέπεται ότι μέχρι το 2020 η σχέση ενός πελάτη με μια επιχείρηση θα γίνεται κατά 85% χωρίς να υπάρχει καθόλου ανθρώπινη επαφή! Καταλαβαίνεται λοιπόν πόσο θα αυξηθεί η ανάγκη για τον εντοπισμό της πληροφορίας που δείχνει αν ο επισκέπτης είναι ευχαριστημένος με το περιεχόμενο ενός website.
Ο Δημήτρης θα σας πει τώρα περισσότερες λεπτομέρειες σχετικά με το πως δουλεύει όλη αυτή η διαδικασία και πως μοιάζει το αποτέλεσμα της δουλειάς που κάνουμε κάθε μέρα.

Data collection

Για να απαντήσουμε όλα τα ερωτήματα που προκύπτουν, το πρώτο βήμα που κάνουμε είναι να συλλέξουμε δεδομένα για το πως αλληλεπιδρούν οι επισκέπτες με το website.

Πως γίνεται όμως η συλλογή δεδομένων σε ένα website? Γίνεται με την χρήση καταλλήλων εφαρμογών που μας βοηθούν να μαζέψουμε και να καταγράψουμε σε ηλεκτρονική μορφή πληροφορίες που σε ένα κατάστημα μπορεί να ήταν σχεδόν αδύνατον. Σε μια ιστοσελίδα έχουμε την δυνατότητα να μεταφράζουμε τις αλληλεπιδράσεις του χρήστη σε κατάλληλα μετρήσιμα δεδομένα. Για παράδειγμα, πόσες φορές έγινε κλικ σε ένα κουμπί ή πόσες φορές ένα βίντεο ξεκίνησε να παίζει. Οι αλληλεπιδράσεις όμως δεν είναι τα μόνα δεδομένα που μπορούμε να συλλέξουμε κατά την περιήγηση του χρήστη. Σκεφτείτε ότι είστε στο κινητό σας και θέλετε να βρείτε νέα ή πληροφορίες για την περιοχή των Ιωαννίνων. Τι θα κάνατε?

Εγώ θα έψαχνα χρησιμοποιώντας το google την φράση “νέα Ιωάννινα” και στα αποτελέσματα που θα εμφανίζονται θα έκανα κλικ στο πρώτο ή στο δεύτερο αποτέλεσμα. Η ιστοσελίδα που μου ανοίγει μετά το κλικ έχει την δυνατότητα να καταγράψει ότι την βρήκα μέσω αναζήτησης στο google και η λέξη που χρησιμοποίησα ήταν “νέα Ιωάννινα”. Όπως επίσης, και ότι η συσκευή που χρησιμοποιώ για να διαβάσω τα άρθρα της ιστοσελίδας είναι κινητό και όχι υπολογιστής. Επιπλέον, δεδομένα μαζεύονται και για την σελίδα που έχω ανοίξει  όπως ποιος είναι τίτλος του άρθρου που διαβάσω εκείνη την στιγμή (π.χ. Οι καλύτερες φάσεις της Euroleague), αν έκανα scroll, σε ποιο τμήμα της ιστοσελίδας βρίσκομαι (π.χ. Διαβάζω αθλητικά ή τεχνολογικά νέα) ή αν έκανα την σελίδα share σε κάποιο social media. Από το share που έγινε, μπορεί κάποιος άλλος χρήστης από το social να δει το link και να κάνει κλικ. Έτσι,  η ιστοσελίδα μάλλον έχει κερδίσει έναν νέο επισκέπτη. Πως όμως η σελίδα ξεχωρίσει ότι την επισκέφτηκε ένας νέος επισκέπτης και όχι κάποιος χρήστης που την έχει ξανά ανοίξει?

Αυτό γίνεται δυνατόν με την χρήση κατάλληλων τεχνολογιών που μας βοηθούν να γνωρίζουμε αν ένας χρήστης ήρθε για πρώτη φορά στην ιστοσελίδα μας ή αν αυτή ήταν η δεύτερη επίσκεψη του μετά από μία εβδομάδα. Αυτό είναι δυνατόν και χωρίς ο χρήστης να συνδεθεί με κάποιον λογαριασμό στην ιστοσελίδα “αρκεί” μόνο να ανοίγει την σελίδα χρησιμοποιώντας την ίδια συσκευή.  Ωστόσο, αν ο επισκέπτης χρησιμοποιεί κάποιο λογαριασμό στην ιστοσελίδα μπορούμε να συλλέξουμε δεδομένα καθώς ο χρήστης συνδέεται στις διαφορετικές συσκευές του και χρησιμοποιεί την ιστοσελίδα. Επιπλέον, αν χρήστης συνδεθεί με κάποιο από το social profile του δίνει στην ιστοσελίδα την δυνατότητα να συλλέξει κάποια δεδομένα που έχει μοιραστεί στο social profile του. Τι μπορεί να είναι αυτά?

Το όνομα και το email που χρησιμοποιεί, τα likes ή tweets που έχει κάνει για κάποιο αγώνα ή κάποια ταινία και αρκετά ακόμη. Για να μαζέψουμε όμως όλα τα αυτά τα δεδομένα δεν χακάρουμε κάποιου τον υπολογιστή ή το social profile του ούτε εγκαθιστούμε κάποιον ιό στον υπολογιστή του. Χρησιμοποιούμε δεδομένα που τις περισσότερες φορές μπορούμε να εξάγουμε από τον ίδιο τον browser του χρήστη, από τα cookies, από τον πηγαίο κώδικα της σελίδας και μέσω διάφορων υπηρεσιών.

Είναι λίγο τρομακτικό, αν αναλογιστεί κάποιος πόσα δεδομένα σχετικά με τις συνήθειες του είναι διαθέσιμα στο διαδίκτυο, ειδικά αν αυτά συνδυαστούν μεταξύ τους. Για αυτό το λόγο και ο βασικότερος κανόνας των web analytics είναι ότι όλα τα δεδομένα που συλλέγονται πρέπει να παραμένουν ανώνυμα! Αν το σκεφτείτε υπάρχει μεγαλύτερη αξία στο να μπορεί να καταλάβει κάποιος τρόπους συμπεριφοράς παρά προσωπικά στοιχεία. Για παράδειγμα αν η Μαρία μπει σε ένα ειδησεογραφικό website, δεν μας ενδιαφέρει να μπορούμε να καταλάβουμε αν μπήκε η Μαρία αλλά ότι η Μαρία είναι κοπέλα 30 -35 ετών, η οποία βάσει προηγούμενων επισκέψεων ψάχνει συχνά για ταξίδια. Άρα είναι καλύτερα να τις εμφανίσουμε άρθρα που να είναι σχετικά, για να βοηθήσουμε την Μαρία να βρει αυτό που θέλει και να την κάνουμε να μείνει περισσότερη ώρα στο website.

Πως όμως θα γίνει αυτό για την κάθε Μαρία που επισκέπτεται την ιστοσελίδα?  Αρκεί να κάνουμε μόνο συλλογή δεδομένων? Η απάντηση είναι όχι. Τα δεδομένα για να αρχίζουν να βγάζουν κάποιο νόημα και να μην είναι μόνο νούμερα θα πρέπει να υποστούν κάποια επεξεργασία. H διαδικασία της επεξεργασίας των δεδομένων ονομάζεται ανάλυση δεδομένων. Στην ανάλυση δεδομένων χρησιμοποιούνται στατιστικά μοντέλα για να συνδυαστούν τα δεδομένα και να εξαχθούν συμπεράσματα, που με την πρώτη ματιά δεν είναι προφανή. Για παράδειγμα, ο χρήστης που έρχεται από Twitter παραμένει στην ιστοσελίδα περισσότερο χρόνο όταν τα άρθρα είναι μικρά  όπως τα tweets και λιγότερο χρόνο όταν πρέπει να κάνει δύο τρεις φορές scroll.  Έτσι, η  ανάλυση βοηθάει τους διαχειριστές της ιστοσελίδας να διαμορφώσουν το περιεχόμενο της για τους χρήστες που έρχονται από το Twitter. Η ανάλυση δεδομένων δεν μας βοηθάει μόνο να κρατήσουμε τους χρήστες σε μια ιστοσελίδα, αλλά και να απαντήσουμε διάφορες ερωτήσεις για το πως λειτουργεί η ιστοσελίδα. Όπως, γιατί είχαμε αύξηση επισκεψιμότητας στην ιστοσελίδα μας μεταξύ 3 και 5 το μεσημέρι της περασμένης Τετάρτης?

Με την βοήθεια της ανάλυσης έχουμε την δυνατότητα να δούμε ότι εκείνες τις ώρες το τμήμα μάρκετινγκ της ιστοσελιδας έτρεχε κάποιες προωθητικές ενέργειες όπως μία διαφήμιση στο google και ένα προωθητικό email. Επιπλέον, από την ανάλυση των δεδομένων μπορούμε να βρούμε ότι η διαφήμιση στο google έφερε τις διπλάσιες επισκέψεις από ότι το email. Αυτό, έχει ως αποτέλεσμα το τμήμα μάρκετινγκ να αυξήσει τις διαφημίσεις στο google και να μειώσει τα προωθητικά email.

Επιπλέον, ο αναλυτής όταν η ιστοσελίδα είναι παγκόσμιας εμβέλειας θα πρέπει ελέγξει αν μία διαφήμιση είχε την ίδια απήχηση σε όλες τις περιοχές της υφηλίου. Για αυτό θα πρέπει να συμπεριλάβει ως παραμέτρους στις αναλύσεις του και τα διαφορετικά χαρακτηριστικά που μπορεί να έχει μία περιοχή της υφηλίου από την άλλη. Σκεφτείτε ότι μία διαφήμιση με ένα μοντέλο που είναι προκλητικά ντυμένο μπορεί να μην έχει απήχηση και να θεωρηθεί προσβλητική σε κάποιες ισλαμικές χώρες λόγω των εθίμων τους, ενώ η ίδια διαφήμιση στις δυτικές χώρες να είναι αποδεκτή και να έχει τρομερή επιτυχία. Όπως καταλαβαίνετε, τα αποτελέσματα της ανάλυσης είναι εκείνα που θα βοηθήσουν τους ανθρώπους πίσω από την ιστοσελίδα να ξέρουν τι ευχαριστεί ή δυσαρεστεί τον κάθε επισκέπτη και τελικά να γίνουν οι κατάλληλες ενέργειες ώστε όχι μόνο η ιστοσελίδα να κρατήσει τους επισκέπτες της αλλά και να τους αυξήσει. Όπως, θα δείτε και στο επόμενο βίντεο ένα λάθος στην συλλογή και ανάλυση δεδομένων μπορεί να έχει καταστροφικές συνέπειες.

The future

Τα web analytics είναι μια πολύ συναρπαστική επιστήμη (τουλάχιστον για εμάς). Ένας πολύ σημαντικός λόγος είναι ότι υπάρχει χώρος για έρευνα που μπορεί να συνδυάσει πάρα πολλούς διαφορετικούς κλάδους.
Για ανθρώπους σαν εμάς, που τους αρέσει να ασχολούνται με την πληροφορική και να βλέπουν καινούργια πράγματα, είναι σαν παίζεις συνεχώς με καινούργια παιχνίδια. Οι τεχνολογίες του διαδικτύου συνεχώς αλλάζουν και εξελίσσονται. Όπως όμως και με το παραδοσιακό μάρκετινγκ, όταν ξεκινάει το κομμάτι της ανάλυσης των δεδομένων χρειάζονται γνώσεις στην στατιστική, την ανάλυση αριθμητικών δεδομένων και της ψυχολογίας, για να δώσεις νόημα στα δεδομένα που έχεις μπροστά σου.

Όπως είπαμε και νωρίτερα το μέλλον προβλέπεται αρκετά ευοίωνο για τα analytics. Οι άνθρωποι έχουν αρχίσει να συνηθίζουν να βλέπουν περιεχόμενο το οποίο να τους είναι ενδιαφέρον. Και οι αποφάσεις τους γίνονται όλο και πιο γρήγορες. Ένα website έχει περίπου 10 δευτερόλεπτα για να κερδίσει ένα καινούργιο επισκέπτη και ο απώτερος στόχος του θα πρέπει να είναι να μπορεί να προσφέρει μια εμπειρία προσαρμοσμένη στον εκάστοτε επισκέπτη, σε πραγματικό χρόνο. Ακόμα και αν ακούγεται τεχνικά δύσκολο, αυτό περιμένει ένας επισκέπτης. Άλλωστε αυτή θα ήταν και ιδανική εμπειρία που θα του προσέφερε και ένας καλός ομιλητής, σε μια face to face συνομιλία. Αν δεν προσπαθήσει να εκμεταλλευτεί ένα website τις πληροφορίες που υπάρχουν διαθέσιμες, καταλήγει να μην είναι καλύτερο από μια εφημερίδα.

Φανταστείτε ότι συναντάτε πρώτη φορά έναν άνθρωπο, ο τρόπος που θα του μιλήσετε θα εξαρτηθεί σε έναν τεράστιο βαθμό από κάποιους κανόνες που έχετε ήδη στο μυαλό σας. Αν θέλετε, για παράδειγμα, να μιλήσετε για τεχνολογία με μια γυναίκα μεγάλης ηλικίας, το πιθανότερο είναι ότι θα προσπαθήσετε να κάνετε πιο απλούς κάποιους όρους, για να κάνετε το θέμα πιο κατανοητό. Οι επισκέπτες περιμένουν μια παρόμοια εμπειρία όταν φτάνουν και σε ένα website. Σκεφτείτε πως στο διαδίκτυο αυτό γίνεται ακόμα πιο δύσκολο, λόγω της απόστασης και των ανθρώπων διαφορετικής κουλτούρας που μπορεί να δει ένα παγκόσμιο website.

Για να μπορέσουμε να πετύχουμε μια εμπειρία που θα μπορεί να συγκριθεί με την απευθείας επικοινωνία 2 ανθρώπων, ακόμα υπάρχει πολύ μεγάλο περιθώριο εξέλιξης και στον τομέα συλλογής δεδομένων αλλά κυρίως στον τομέα της ανάλυσης:

  • πρέπει να βρούμε τρόπους να συνδυάζουμε διαφορετικά είδη δεδομένων όπως εικόνες με κείμενο για να μπορεί να γίνει πιο ολοκληρωμένη και ακριβής ανάλυση όλων των διαθέσιμων πληροφοριών
  • να εκμεταλλευτούμε καλύτερα τις τεράστιες δυνατότητες που μας δίνει το γεγονός ότι περισσότεροι έχουμε έναν υπολογιστή στην τσέπη μας – τα κινητά μας – τις περισσότερες ώρες της ημέρας
  • Και σίγουρα να θεσπίσουμε ξεκάθαρα όρια, τα οποία δεν πρέπει να ξεπεραστούν για να μην καταπατηθούν τα προσωπικά στοιχεία με κακόβουλο τρόπο

Νομίζω ότι δεν υπάρχει κάποιος τομέας στον οποίο να μην μπορεί να γίνει συλλογή και ανάλυση δεδομένων με στόχο την βελτίωση. Το μοναδικό όριο στην εξέλιξη των analytics είναι η φαντασία μας και η αποφασιστικότητα μερικών ανθρώπων που θα εξελίξουν την επιστήμη. Γι’ αυτό όσοι ασχοληθούμε με αυτήν ας σκεφτούμε έξω από το κουτί Think outside the box (όπως είναι και το σημερινό μήνυμα) για να μπορέσουμε τα βρούμε λύσεις που θα κάνουν την εμπειρία του διαδικτύου και τον ηλεκτρονικό κόσμο που ζούμε ακόμα πιο φιλικό προς όλους μας.

Written By

Panagiotis (pronounced Panayotis) is a passionate G(r)eek with experience in digital analytics projects and website implementation. Fan of clear and effective processes, automation of tasks and problem-solving technical hacks. Hands-on experience with projects ranging from small to enterprise-level companies, starting from the communication with the customers and ending with the transformation of business requirements to the final deliverable.