Suite au Hackathon “Ao to AI” (comprendre Australian Open to Artificial Intelligence), je suis tombé sur plusieurs papier traitant dont la Data affecte déjà le sport et comment elle pourrait affecter le tennis dans un futur proche. Etant moi même en quelque sorte Data Scientist spécialisé en Python et SEO (en vérité c’est un peu plus complexe que ça, mais une ancre est une ancre), cela m’a plu de rassembler mes 2 passions sur ce même site !

Le tennis et la technologie : Elle est déjà parmi nous !

Les années 80 ont sans doute vu certaines des meilleures années de tennis jamais enregistrées. Que ce soit la finale épique Borg-McEnroe à Wimbledon, la rivalité Edberg-Becker, les innombrables batailles entre Navratilova et Evert, ou une nouvelle ère de travail acharné et de tennis régimentaire apportée par Lendl. De l’autre côté du filet, cette même décennie a vu l’avènement du magnétoscope, du Walkman, du CD, mais peut-être plus important encore, de l’ordinateur personnel d’IBM. Maintenant, vous vous demandez probablement pourquoi ces faits apparemment sans rapport ont été réunis ici ? Pourtant le rapport est devenu beaucoup plus flagrant dans les années 90 quand IBM est devenu le fournisseur officiel technique de l’information à Wimbledon, avec leur logiciel de statistique ‘ Slamtracker’ qui continue d’exister aujourd’hui (quand Roland Garros à lui décider d’arrêter ce même partenariat).

30 ans plus tard, l’utilisation de l’intelligence artificielle (IA) dans le sport est devenue une pratique courante, en particulier en golf ou en voile. Dans le tennis, la technologie Hawkeye a été révolutionnaire. Les caméras triangulaires sur le terrain sont capables d’enregistrer la trajectoire de la balle en 3D et le joueur en 2D. Il en résulte la précision fine et instantanée dont nous avons été les témoins au cours des 10 dernières années.

Le sport, le tennis, et le Big Data

Avec la grande quantité de données générées dans chaque tournoi, il est facile de construire un profil de données génériques pour les joueurs de tennis et de prédire, avec une certitude relative, la probabilité d’un coup gagnant, une faute directe et une faute provoquée basée sur certaines variables telles que la vitesse, la hauteur de balle et de rebond, la sécurité vis à vis des lignes et le type de coup choisi (avec moins de cinq pour cent de marge d’erreur !).

On imaginerai alors chaque coach équipé d’une fiche personnalisée par joueur qui dirait quelque chose comme “Sur balle de break, en servant le revers de Roger Federer, tu es sur à 99% qu’il va retourner chopé au centre sans prendre de risque” (pas besoin de Big Data, cette stat a été vraie durant de nombreuses années). Sauf que comme l’ATP enregistre aussi les stats des joueurs de futur et de challenger, un grand joueur devant affronter un joueur de seconde zone serait tout de suite au fait des forces et des faiblesses de son adversaire !

Et de fait, plus tôt cette année, l’Open d’Australie a annoncé ‘From AO to AI’, un hackathon, qui avait pour but d’identifier le meilleur modèle et algorithme pour prédire avec précision le résultat du point suivant. Bien que cela se soit avéré extrêmement excitant, sa limitation et celle de la technologie dans le tennis en général, jusqu’à présent, a été son utilisation pour l’analyse rétrospective ou la prédiction de résultats statiques, qui sont ” immuables “. En aucun cas, il n’y a une assistance active dans l’amélioration de la qualité du jeu avec des modèles dynamiques de résultats alternatifs, c’est-à-dire où les joueurs peuvent réellement utiliser les données pour être dans un contrôle accru du jeu. Et nous ne parlons pas de pourcentages de premier service et de fautes sur le revers ou le coup droit. Cela va bien au-delà !

Ce que le Machine Learning pourrait apporter au tennis :

Connaître les coups potentiels et les points faibles de l’adversaire fournirait un avantage compétitif pour un joueur et pourrait être la dernière pièce du puzzle pour le tennis – un profil de données par joueur et entièrement personnalisé. Cela permettrait de générer des scénarios de matchs spécifiques basés sur des données historiques détaillées – du joueur, de son adversaire, de leurs rencontres précédentes, de leur forme actuelle et des conditions du tournoi.

Aujourd’hui, le tennis est passé d’un sport physique à un jeu de confiance, de ténacité et d’endurance. Le nombre de personnes employées maintenant dans le staf d’un joueur du Top 10 est une indication des divers éléments qui préparent à la victoire – un entraîneur, un physiothérapeute, un préparateur physique, un psychologue du sport et même un chef en cuisine ! Si vous ajoutez à cela un Data Analyst, les nombres durs et froids pourraient simplement embrouiller encore plus le cerveau d’un joueur (Bon courage au futur Data Analyst de Sir Andy Murray !).

Comment la Data pourrait s’inviter au tennis :

La réalité du haut niveau c’est que ce sont les plus petits détails qui déterminent le résultat des matchs. Tous les joueurs évoluent dans un mouchoir de poche. Avec la technologie d’aujourd’hui, l’utilisation de la Data inhérente au tennis peut mettre en évidence et d’une certaine manière des points et des faits que même un entraîneur de tennis de haut niveau ne pourrait ni comprendre ni imaginer. Imaginez maintenant un grand joueur qui est soutenu par un grand coach, qui a son propre ‘Data Coach’ qui lui fournit des analyses de données et des tendances pour formuler et communiquer des plans de jeux gagnants !

Cependant, cela laisse bien des questions en suspens. Si un algorithme identifie mathématiquement une séquence qui gène réellement un joueur tel que, disons, Rafael Nadal, combien de temps mettrait un tel champion à s’adapter et corriger sa faiblesse ? Ou justement, parlant de joueurs hors norme comme Nadal, Federer, Djokovic… Combien de joueurs seront capables de mettre en application les plans de jeux trouvé par la machine ? Sans doute très peu !

Ma conclusion : plus que les joueurs, les journalistes et les parieurs ont plus à gagner avec le big Data

Bref, pour moi, le Big Data et le Machine Learning pourrait avoir à court terme 2 principaux utilisateurs et gagnants : les journalistes d’abord, qui pourrait étayer leurs commentaires avec des analyses statistiques poussées, et bien sur ceux qui font des pronostics sur les matchs de Tennis : les parieurs qui pourrait être eux les véritables gagnants de l’histoire avec la possibilité de réduire le risque inhérent aux paris sportif en ligne.

En tout cas, je passe une annonce, si un joueur de haut niveau à besoin de l’aide pour mettre en place une analyse Data, qu’il me contacte !