Αφορμή για το παρόν άρθρο αποτέλεσε ο @RedEmerald (ποιός άλλος, αφού μιλάμε για στατιστικά;), η σημασία που αποδίδει στο NetRtg και η «τεράστια» συσχέτισή του (~93%) με το ποσοστό νικών μίας ομάδας (win%). Από την άλλη, αφού το θετικό NetRtg σε έναν αγώνα σημαίνει αποκλειστικά νίκη (και συνεπώς αύξηση του win%), μου δημιουργήθηκε η απορία αν συνδέονται κάπως με το win% οι δύο παράγοντες που το καθορίζουν, δηλαδή το Ortg και Drtg, καθώς:
NetRtg = ORtg – Drtg
Για μισό λεπτό! Μιας και θυμάμαι τον εαυτό μου 2-3 χρόνια πίσω που άκουγα τα Red PointCast και όλα αυτά μου φαίνονταν ακαταλαβίστικα, ας ορίσουμε στα γρήγορα αυτούς τους τρεις παράγοντες:
*Ο λόγος που οι “ειδικοί” χρησιμοποιούν την αναγωγή σε 100 επιθέσεις/άμυνες είναι για να μην μας επηρεάζει ο ρυθμός (pace) επιθέσεων κάθε ομάδας, καθώς κάθε ομάδα αναλόγως της τακτικής της επιτίθεται πιο γρήγορα (και συνεπώς πιο πολλές φορές) ή πιο αργά (και συνεπώς πιο λίγες φορές).
Αυτούς τους αριθμούς μπορούμε να τους βρούμε σε διάφορα sites με στατιστικά, είτε ανά αγώνα είτε ως μέσους όρους ανά χρονιά, ομάδα και διοργάνωση. Τα στοιχεία που χρησιμοποίησα βρίσκονται στο badbasket.gr και αφορούν τους μέσους όρους των πέντε περιόδων από το 2016-17 μέχρι και το 2020-21, ανά ομάδα της Euroleague. Επιλέχθηκε ως αφετηρία η σαιζόν 2016-17, καθώς τότε άλλαξε το σύστημα διεξαγωγής της Euroleague καταργώντας το Top16 και εισάγοντας το «όλοι με όλους» στη regular season που ισχύει και σήμερα.
Μία δημοφιλής επιστημονική μέθοδος για να ελέγξουμε τη συσχέτιση δύο ή περισσότερων παραγόντων είναι η γραμμική παλινδρόμηση, η οποία προσπαθεί να δημιουργήσει μία γραμμική συνάρτηση που θα σχετίζει τους παράγοντες που μας ενδιαφέρουν μεταξύ τους (εν συντομία). Στη συγκεκριμένη περίπτωση** αναζητάμε μία συνάρτηση που θα συνδέει τα ORtg και DRtg με το win%.
**Μιας και θα διερωτηθούν οι πιο έμπειροι στη στατιστική, πριν την παλινδρόμηση πραγματοποιήθηκε έλεγχος των μεταβλητών ώστε να ακολουθούν την κανονική κατανομή.
Η διαδικασία αυτή πραγματοποιήθηκε σε τρία σετ δεδομένων:
Η συνάρτηση που προκύπτει από το στατιστικό μοντέλο σε κάθε σετ δεδομένων έχει την παρακάτω μορφή:
Rwin% = A*ORtg + B*DRtg + C
όπου με Rwin% συμβολίζουμε την «πρόβλεψη» του win% που μας δίνει το μοντέλο. Στον παρακάτω πίνακα φαίνονται για κάθε σετ δεδομένων οι τρεις συντελεστές A, B και C, ο βαθμός “επιβεβαίωσης” του μοντέλου R2, η απόλυτη τιμή του λόγου B/A των δύο αντίστοιχων συντελεστών και τέλος η τυπική απόκλιση του λάθους μεταξύ της «πρόβλεψης» και της πραγματικής τιμής του win%.
Dataset | A | B | C | R2 | |B/A| | Std. Error |
i. 2016-2021 RS+PlayOffs+Final4 | 2.16 | -2.41 | 77.76 | 89% | 1.1157 | 5.41 |
ii. 2016-19 & 2020-21 RS | 2.15 | -2.35 | 72.34 | 89% | 1.0930 | 5.66 |
iii. 2016-19 & 2020-21 RS+PlayOffs+Final4 | 2.18 | -2.32 | 65.66 | 89% | 1.0642 | 5.33 |
Πριν προχωρήσουμε στην ανάλυση των αποτελεσμάτων, θα ήταν καλό για την οικονομία της «κουβέντας» να επιλέγαμε ένα συγκεκριμένο σετ δεδομένων. Προσωπικά θεωρώ πως θα πρέπει να αγνοήσουμε τη σαιζόν 2020-21 (περίπτωση i), όπου δεν έπαιξαν όλες οι ομάδες μεταξύ τους δύο ματς και υπάρχουν διαφορές στη δυναμικότητα των αντιπάλων που αντιμετώπισε η κάθε μία, ενώ παράλληλα η σαιζόν δεν ολοκληρώθηκε ώστε να έχουμε πλήρη regular season, playoffs και final4. Όσον αφορά τις περιπτώσεις (ii) και (iii), η επιλογή είναι πολύ δύσκολη καθώς παρά το ότι η (ii) περιέχει τους ίδιους αριθμούς αγώνων για όλες τις ομάδες η (iii) μας δίνει ένα ελάχιστα μικρότερο περιθώριο λάθους. Ενώ η επιλογή μεταξύ τους είναι δύσκολη, με πολλά επιχειρήματα υπέρ της κάθε μίας, επιλέγω να αναπτύξω την πιο «συντηρητική» περίπτωση (iii) και στη συνέχεια ο καθένας μπορεί να εξάγει με αντίστοιχο τρόπο συμπεράσματα και για τα άλλα δύο σετ δεδομένων.
Στην περίπτωση (iii) η συνάρτηση παλινδρόμησης για τον υπολογισμό του win% διαμορφώνεται ως εξής:
Παρατηρούμε πως τα ORtg και DRtg διαθέτουν διαφορετικούς συντελεστές, γεγονός που προκαλεί μία κάποια έκπληξη καθώς φαίνεται η άμυνα να μετράει κάπως παραπάνω στο ποσοστό των νικών (ο λόγος |B/A| στη συγκεκριμένη περίπτωση υποδεικνύει μία παραπάνω συμβολή της άμυνας κατά 6.42%). Το R2 υποδεικνύει πως η διακύμανση της μεταβλητής win% εξηγείται από τις μεταβλητές ORtg και DRtg κατά 89%, ενώ το τυπικό λάθος βρίσκεται στο ±5.33. Μία γραφική απεικόνιση του πραγματικού win% (μπλε γραμμή) και του υπολογισμένου βάσει της παραπάνω συνάρτησης Rwin% (κόκκινη γραμμή) φαίνεται στο παρακάτω γράφημα.
Όπως παρατηρείται και στο γράφημα, η συνάρτηση αυτή επαλήθευσε σε πολύ ικανοποιητικό βαθμό το win% και στις τέσσερις περιόδους που εξετάστηκαν. Αυτό που εκπλήσσει είναι η ξεκάθαρη υπεροχή του DRtg έναντι του ORtg στη συμμετοχή στο ποσοστό νικών (κατά ~6.4%) στην περίπτωση (iii), ή ακόμα και μέχρι ~11.5% στις άλλες δύο περιπτώσεις!
Πριν όμως ξεκινήσουμε να αντιμετωπίζουμε ως προφητεία το “defence wins championships” του Michael Jordan – άλλωστε ο Air ήταν κάτι σαν θεότητα, όχι προφήτης – θα πρέπει να υπογραμμίσουμε κάποιες σημαντικές λεπτομέρειες για τη στατιστική και την εργαλειοποίησή της. Καταρχήν, τα δείγματα δεν είναι πάντα αντιπροσωπευτικά. Επίσης, θα πρέπει να είμαστε πολύ προσεκτικοί πριν αποπειραθούμε να ερμηνεύσουμε κάποιο αποτέλεσμα που βρίσκουμε από τη στατιστική ανάλυση. Επιπλέον, κάθε απόπειρα γενίκευσης ενός συμπεράσματος είναι μία πολύ επίπονη (έως και επικίνδυνη) διαδικασία που απαιτεί ιδιαίτερη προσοχή και μελέτη. Αυτά τα γράφω για να τονίσω το ότι δεν βρήκαμε κάποιον κανόνα να ισχύει γενικά στο μπάσκετ ή στην Ευρώπη ή γενικά στη διοργάνωση. Άλλωστε παρατηρήσαμε πως μικρές διαφορές στα σετ δεδομένων να οδηγούν σε σημαντικές διαφοροποιήσεις, ενώ να σας ενημερώσω πως στις χρονιές πριν το 2016 υπήρξαν περίοδοι στην Euroleague που η επίθεση συμμετείχε περισσότερο στο win% (όπως διαπίστωσα σε κάποιες απόπειρές μου να πάω προς τα πίσω χρονικά).
Επίσης, αυτό το άρθρο (του 2014) παρουσιάζει μία έρευνα για τη συμμετοχή της άμυνας στο NBA ανά περιόδους, αποδεικνύοντας πως δεν υπάρχει γενικός κανόνας, αλλά εξαρτάται από την περίοδο. Αυτό όμως που φαίνεται ξεκάθαρα είναι πως η αμυντική επίδοση μίας ομάδας την τελευταία πενταετία στην Euroleague είχε κάποια παραπάνω επίδραση στο ποσοστό νικών της από την επιθετική επίδοσή της. Προσωπικά, αν και αδυνατώ να καταλήξω με σιγουριά στην ακριβή τιμή (αν είναι ~6.4, ~9.3 ή ~11.5%), πιστεύω πως αυτή η αίσθηση για την ιδιαίτερη σημασία που έχει η άμυνα στην επίτευξη των στόχων μιας ομάδας μπορεί να ποσοτικοποιηθεί σε συγκεκριμένο χρονικό εύρος και να δώσει πολύ ικανοποιητικά αποτελέσματα.
Πριν τον επίλογο, θα πρέπει να υπενθυμίσουμε μία επιπλέον βασική αρχή της στατιστικής:
Το παιχνίδι είναι πολύπλοκο, αποτελείται από πάμπολλες μεταβλητές και ενδεχομένως μία μικρή δράση ή αλλαγή στρατηγικής μίας ομάδας να μεταβάλλει παράγοντες που ενώ εκ πρώτης όψεως φαίνονται ασήμαντοι, στην πράξη να είναι ιδιαίτερα σημαντικοί (θυμηθείτε λίγο το απλοϊκό παράδειγμα με τη θεωρία του χάους και το πέταγμα της πεταλούδας). Για αυτό και η λέξη «πρόβλεψη» χρησιμοποιήθηκε μόνο μέσα σε εισαγωγικά, καθώς χρειάζεται ιδιαίτερες και παρόμοιες συνθήκες για να επαληθευτεί.
Μαγικές συνταγές δεν υπάρχουν. Αυτό όμως που έχει καθήκον κάθε σοβαρός αθλητικός οργανισμός που θέλει να ανήκει σε ένα υψηλό επίπεδο, είναι να διερευνά με όσο το δυνατόν πιο επιστημονικό τρόπο το τι συμβαίνει γύρω του, να ανακαλύπτει και να κεφαλαιοποιεί γνώση η οποία θα τον πηγαίνει ένα βήμα μπροστά, δουλεύοντας προσεκτικά τις αδυναμίες του.
Εν κατακλείδι, παρά το ότι ως «φυσιολογικός άνθρωπος» δεν «τρελαίνομαι» να παρακολουθώ τις αμυντικές επιδόσεις της ομάδας, αναγνωρίζω τη σημασία που αποδίδουν πολλοί στη σωστή αμυντική λειτουργία. Επιπλέον, παρά το γεγονός ότι δεν καταλήγω απόλυτα στην ακριβή ποσοτικοποίηση της ιδιαίτερης συμβολής της στην επιτυχία μιας ομάδας, αισθάνομαι πως έκανα ένα μικρό βήμα προς αυτή την κατεύθυνση και θέλησα να το μοιραστώ μαζί σας. Το σίγουρο πάντως είναι πως από εδώ και πέρα θα παρακολουθώ με ιδιαίτερη προσοχή το αμυντικό effort της ομάδας μας. Ίσως τώρα να κατανοώ καλύτερα, με αριθμούς «στο περίπου», το πως «ο Παπ δρα ως συγκολλητική ουσία στην ομάδα» που υποστηρίζουν πολλοί, ενώ παράλληλα στο μυαλό μου στριφογυρίζει η στοιχειωμένη φράση «τα μικρά πράγματα που δε φαίνονται στη στατιστική» (δεν ξέρω για σας, εγώ πάντως ανατρίχιασα).
ΥΓ1: Εννοείται πως δίνουμε από τώρα ραντεβού τον Απρίλη για να δούμε «τι ψάρια έπιασε» το μοντέλο.
ΥΓ2: Τα παραπάνω αποτελέσματα επαληθεύτηκαν και με συσχετίσεις που λαμβάνουν υπόψη την παραπάνω συμβολή του DRtg στο win% και είναι στη διάθεση όποιου το επιθυμεί – δεν τα ανέφερα για λόγους απλότητας.
ΥΓ3: Έγραφα όλα αυτά για τη σημασία του DRtg και όσο σκεφτόμουν ότι δεν έχουμε άλλο καθαρό τριάρι εκτός του Παπ τόσο ίδρωνα!!! Ένα τριάρι ρε παιδιά! Είναι αμαρτία να κάψουμε τόσο καλή ομάδα για ένα κενό στο 3!
ΥΓ4: Θερμές ευχαριστίες στα παιδιά του Red Point Guard που φιλοξένησαν τις σκέψεις μου και για όλη τη δουλειά που κάνουν. Ευχές σε όλους για καλή σαιζόν, δύναμη και κάθε καλό στη ζωή τους!