Il tuo Sportwatch ti sta mentendo?
🤖🧠 Viaggio tra i modelli di calcolo che predicono le nostre performance e ci fanno da coach virtuali
🏃🏻♂️🏃🏻♂️ Lunedì: fine della prima uscita settimanale.
Corsetta in pausa pranzo, volume ancora bassissimo, per evitare ricadute con la mia tendinite achillea. Termino questi sei kilometri facili facili, apro la porta e mi siedo per togliere le scarpe.
Avvio la sincronizzazione tra i dati del mio orologio e l’applicazione sul telefono che raccoglie questi dati, li rielabora e mi restituisce infografiche sui miei progressi. Mi trovo di fronte a una dettagliatissima schermata che mi racconta tutto del mio allenamento. Beh, intanto il passo al kilometro si sta abbassando, mentre la frequenza cardiaca resta stabile. Ottimi segnali.
Con disappunto, però, noto che l’indicazione sul mio stato di salute podistica generale è calata di 0.10 punti - più precisamente da 91 a 90.9.
Accigliato e sconfortato, clicco sulla voce race predictor: si tratta di uno strumento incorporato all’orologio che incrociando una serie di parametri dovrebbe restituire la mia velocità sui 5k, 10k, mezza maratona e maratona.
I risultati mi lasciano sbalordito: secondo questo strumento il tempo in cui io ad oggi correrei una maratona è di 3 ore e 2 minuti. Una follia, quasi 20 minuti in meno del mio personale.
Ma com’è possibile? Sono stato fermo quasi due mesi e mezzo per infortunio e sto tornando lentamente in strada con corse mai superiori all’ora di tempo, come può essere questa la proiezione del mio tempo in maratona dopo che l’orologio stesso mi ha segnalato allarmatissimo di essere in una profonda fase di deallenamento?
Come sempre c’è una spiegazione razionale
L’algoritmo che alimenta le previsioni di gara del mio orologio, probabilmente prende in considerazione dati fino a sei mesi fa: e sei mesi fa correvo intense sessioni di allenamento, spesso registrando segmenti di dieci kilometri in tempi prossimi ai quaranta minuti. Per non parlare di una mezza maratona corsa in meno di un’ora e trenta.
La ricetta perfetta per fregare ancora, a quasi cinque mesi di distanza da quei bei tempi andati, i complessi calcolatori che dovrebbero predire il mio stato di salute podistica.
Questi pensieri hanno portato a una serie di domande.
Cosa c’è dietro i software che danno vita agli orologi e gadget sportivi sui nostri polsi? Quali parametri tengono in considerazione? Qual è la precisione di questi strumenti? Ci sono dilemmi etici dietro la collezione e l’utilizzo di dati su larga scala?
In questa puntata
L’industria dei wearable sportivi
Quali sono i modelli più accurati per la predizione della performance sportiva e quali dati prendono in considerazione?
Gli orologi ci mentono?
Una premessa. La vastità di campi di applicazione dei wearable sportivi è talmente ampia che per trattare comprensivamente il tema sarebbe necessario, forse, un libro. In questo episodio di A cosa penso quando corro? ci occuperemo, più nello specifico, del legame tra oggetti tech e podismo.
Di cosa parliamo quando parliamo di gadget?
Qualche settimana fa parlavamo dell’esplosione post pandemica del business dell’abbigliamento sportivo, del suo giro d’affari miliardario e del potenziale impatto distruttivo sull’ambiente di una cattiva gestione di rifiuti, eccessi, recessi derivanti da questo settore.
Con l’esplosione post pandemica della corsa è inevitabilmente scoppiata anche la vendita di gadget tecnologici legati al running e allo sport in generale.
Come riportato da questo report, protagonisti assoluti sono Smartwatch e Sportwatch, che da soli costituiscono il 45% delle revenue del settore (dati del 2022). Ma gli orologi (o wristwear) sono solo la punta di un iceberg che va spaventosamente sotto le acque superficiali dell’analisi delle performance per come la maggior parte di noi è abituatə a pensarla.
Fasce cardio, bracciali; solette intelligenti, ma anche calze percorse da miriadi di sensori, fino ad adesivi per la pelle che misurano la perdita di fluidi dal corpo durante l’attività - sono commercializzati da un noto brand di bevande sportive.
Per il settore dei device tecnologici ad uso sportivo e salutistico è stato stimato un market size di oltre un miliardo e mezzo di dollari nel 2022; entro il 2030 ci si aspetta una crescita annua media che si assesta attorno al 14%.
La proiezione dei ricavi derivati dalla vendita di wearable, software e servizi annessi per l’anno 2030 è di oltre quattro miliardi di dollari.
Su cosa si sfidano i produttori?
Fino al 2022/2023 il 45% del mercato è stato dominato dalla vendita di hardware, la cui produzione, distribuzione e smaltimento risponde alle stesse problematiche note per device elettronici di uso comune.
Oggi il campo di battaglia su cui si sfidano i grandi brand si sta rapidamente spostando alla corsa ai software e alla sostenibilità economica (ed etica) dei servizi legati alla distribuzione di questi.
I brand che producono hardware legano al proprio oggetto un pezzo di software - di solito un’applicazione - che si integra e interagisce con una variegata serie di dati all’interno dell’ecosistema entro la quale vive.
Una fiorente economia fatta di tanti SaaS (Software as a Service) legati al running pervade i nostri store digitali con sfavillanti piani d’abbonamento - per citarne una su tutte la popolarissima Strava ha una versione gratuita e una piano pro che dà accesso a una serie di funzionalità come mappe, segmenti, piani di allenamento, mentre app come Garmin Connect sono gratuite per il semplice fatto di essere inutili senza un dispositivo hardware della stessa marca (nel caso del podismo di solito un orologio) per farle funzionare.
Proprio questi software, forti della mole di informazioni qualitative che ognunə di noi può portare circa i propri allenamenti stanno rivoluzionando il modo che abbiamo di prepararci alle nostre gare, e vivere la corsa.
Modelli sempre più complessi, raffinati e un uso sempre più massiccio di Machine Learning e Intelligenze Artificiali stanno cambiando il modo in cui anche amatori con budget relativamente ristretti possono accedere a protocolli di allenamento e predittori della performance relativamente accurati.
D’altra parte, noi amatori costituiamo l’80% del mercato di riferimento: i produttori lo sanno bene e ci lusingano con la promessa di insights incredibili sulle nostre performances. Tutto questo in cambio di denaro e… dati!
A questo punto sorge la grande domanda: come si arriva dal dato nudo e crudo ai widget presenti negli orologi sportivi? Oppure ai race predictor, strumenti che ad oggi azzeccano le tempistiche di gara con una precisione quantificabile in secondi? E che sulla base dei parametri forniti sono in grado di restituire veri e propri protocolli di allenamento?
Nel reame dei dati sulla corsa
Dati. Dati, e ancora dati - ho già detto dati?
Per fornire un output quanto più preciso possibile sulle performance podistiche, i software incrociano una serie di informazioni sul nostro stato di salute a quantitativi enormi di dati provenienti da runner di tutto il mondo. Presente quando l’app di allenamento chiede accesso ai dati di salute? Età, sesso, peso, frequenza cardiaca media, ore di sonno, numero di passi giornalieri, ecc.
Tutto delle nostre performance e del nostro stato di salute viene quantificato prima, per essere misurato poi. Che ci piaccia o no, è uno step cruciale nella definizione di qualsiasi piano di allenamento, o previsione di performance: ricordiamo sempre il famoso assunto per cui se qualcosa è misurabile, allora è migliorabile.
Un modello con un margine di errore del 2%
Thorsten Emig e Jussi Peltonen sono i ricercatori che hanno messo a punto uno dei predittori di maggiore successo (si parla di un’accuratezza del 2% in più o in meno rispetto al tempo finale per maratoneti che corrono entro le 3 ore) sono bastate 1.6 milioni di sessioni di running, provenienti da 14 mila maratoneti, per un totale di 20 milioni di kilometri percorsi.
L’accesso ai dati è stato possibile dal produttore di misuratori sportivi Polar, che ha messo a disposizione il proprio database.
Lo studio sarebbe stato impossibile senza la smania (e necessità) dei runner di registrare le proprie attività.
Questo modello tiene in considerazione:
VO2Max (un parametro che indica quanto ossigeno puoi consumare in un’unità di tempo: lo registri con i famosi test delle scuole medie, come il test di Cooper, o il test dei 6 minuti);
Un elemento chiamato fattore di Endurance: il numero dei minuti corsi al limite della soglia anaerobica diviso sei.
Provo a spiegare il concetto di soglia anaerobica in maniera semplice. Immagina la soglia anaerobica come un ristorante all-you-can-eat: il cameriere ogni tot tempo porta un piatto. Finché riesci a mangiare quello che ti viene servito prima che arrivi un nuovo piatto, sei al di sotto della soglia anaerobica; a un certo punto, però, il cameriere accelererà il ritmo, i piatti cominceranno ad accumularsi e tu non riuscirai a stare dietro al passo del cameriere.
Quando si accumulano troppi piatti e tu ti senti saziə, avrai raggiunto la tua soglia anaerobica.Ora sostituisci il mangiare con il correre, il cameriere con il sangue, il cibo con l’acido lattico nei muscoli e il gioco è fatto. Se qualche fisiologə avesse un’analogia migliore o volesse correggermi, vi aspetto nei commenti.
Come auspicabile, il modello ha alcune limitazioni di natura esterna: non tiene in considerazioni fattori come il meteo, il tipo di terreno su cui si corre la gara, i dislivelli positivi o negativi, il pacchetto completo di emozioni che si provano sulla linea di partenza.
Un modello basato sulla critical speed
Un altro modello molto popolare è basato sul concetto di critical speed: la velocità massima che riusciresti a sostenere per circa quaranta minuti.
Per ottenere una stima, i ricercatori Barry Smyth e Daniel Muniz-Palmares si sono serviti di dati Strava e dei dati di circa 25,000 atlete e atleti (il 22% donne, il 78% uomini) che avrebbero corso nelle maratone di Dublino, Londra e New York.
I ricercatori hanno isolato le migliori performance registrate entro un range che varia tra i due e i venti minuti: di solito 400 metri, 800 metri, 1000 metri, miglio (1600 metri), 3000 metri e per i più veloci anche 5000 metri.
A partire da questi dati la stima sul passo gara per la maratona - e quindi sul tempo finale - si ottiene considerando che i professionisti corrono le loro gare al 96% della critical speed.
E qui nascono i problemi.
Il margine di errore della predizione di questo modello si assesta attorno al 7%. Su un tempo medio di 3 ore per la maratona il 7% è un intervallo di 14 minuti.
Un’eternità: in 14 minuti si legge una puntata intera di A cosa penso quando corro? è c’è pure il tempo per far sapere a tutti di essere arrivatə sanə e salvə al traguardo.
L’inghippo sta nel fatto che sostenere uno sforzo al 96% della critical speed è roba da professionistə. Runner più normali riescono a tenere mediamente l’85% della critical speed per tempi che sono di molto dilatati, e comunque solitamente superiori alle tre ore - portando perciò a predizioni molto meno accurate.
Ma quindi gli orologi ci mentono?
Beh, sì, gli orologi ci mentono. Ma non lo fanno apposta: e soprattutto lo fanno sempre meno. Anzi, ci sono da apprezzare i contributi che nuove categorie di ricercatori e studiosi stanno apportando al running, soprattutto a livello amatoriale.
In un universo sportivo che è stato ed è dominato a ragione dal contributo di fisiologi e medici dello sport, in cui spesso vediamo gli atleti d’elite fare cose spaventose come i test di laboratorio con misuratori, tapis roulant, maschere dalle strane fogge, matematici e statistici sono alla rincorsa di un posto d’onore nel cuore di centinaia di migliaia di runner amatori, che, come ricorda Thorsten Emig (docente di fisica all’Università di Parigi-Saclay e mente dietro a uno dei modelli predittivi) “molto semplicemente in laboratorio non hanno il tempo di andarci”.
Grazie all’affinamento di modelli sempre più precisi, matematica, statistica, big data, affiancate al lavoro di medici dello sport e fisiologi, stanno democratizzando l’accesso a dati sempre più puntuali sulle performance podistiche, eliminando progressivamente barriere d’accesso economiche e discrepanze qualitative tra i dati a disposizione dei professionisti e quelli a disposizione degli amatori.
Quali passi in avanti?
Dormo tra due cuscini per quello che riguarda il progresso scientifico attorno a questo tema, e la progressiva erosione dei margini di errore dei modelli nella loro interezza. È molto probabile che la scienza faccia il suo corso e arrivi a restituirci predizioni di gara e piani di allenamento tailor made precisissimi.
Mi concentrerei, piuttosto, sul come questi passi in avanti scientifici verranno fatti.
L’elefante nella stanza è sempre lo stesso: il tema dell’accesso ai dati. Come verrà gestito e regolamentato l’utilizzo di dati direttamente o indirettamente legati alla nostra salute? L’Europa regola l’industria con provvedimenti come il GDPR per la fruizione dei dati personali a finalità di ricerca (che prevede data protection by design and default, linee guida specifiche per l’utilizzo di dati sulla salute e molto altro).
I progressi esponenziali conquistati nel campo delle Intelligenze artificiali costringono a continui aggiornamenti: la questione è complicata e sicuramente fuori dalla mia portata. Il tema specifico dell’utilizzo di dati di healthcare utilizzati per alimentare algoritmi di machine learning è affrontato in questo recente studio.
Un altro importante aspetto è la nostra educazione verso l’interpretazione di questi dati.
Il dato è un numero. Raccontare quello che questo numero rappresenta interpretandolo e contestualizzandolo all’interno di un orizzonte ampio - prendendo in esame fattori esterni alle variabili utilizzate dai modelli - è una prerogativa umana, oltre che essere una grande responsabilità.
Per nostra fortuna, nel contesto sportivo siamo chiamati a valutare dati relativamente innocui, che tutt’al più ci diranno che siamo più lentə di quanto pensassimo, o ci faranno finire una gara sotto tono.
Impariamo a utilizzare in maniera intelligente i dati che ci vengono messi a disposizione dai software, mettendoli in prospettiva rispetto a come ci sentiamo, alle nostre sensazioni, al nostro istinto. Nel processo decisionale che ci indica come e a quale intensità correre la nostra gara, abbiamo ancora un ruolo predominante e la decisione finale non sarà mai appannaggio di una AI o di un algoritmo.
Impariamo a fare pace con le bugie degli orologi e prendiamo i numeri che ci vengono restituiti con il giusto peso: sono strumenti, indicazioni, indicatori in certi casi molto utili. Tracce, che ci possono aiutare nell’individuare il nostro percorso sportivo. Nessun atleta - o almeno nessun atleta amatoriale - dovrebbe essere confinato entro le cifre delle sue performance.
Non sei la tua critical speed, né la proiezione del tuo tempo in maratona.
Quali sono le tue esperienze con gli orologi sportivi?
Hai ricevuto feedback accurati dal tuo orologio? Hai ricevuto consigli di allenamento o veri e propri planning che si sono rivelati efficaci?
Parliamone nei commenti!
Letture e fonti
Il modello di Emig e Peltonen, con un margine di errore del 2%: è spiegato in questo articolo.
Il modello di Smyth e Muniz-Palmares, spiegato in questo articolo.
Qui, la ricerca di mercato con i dati sui wearables e gli orologi sportivi.
I due contributi sulla protezione dati: qui una visione panoramica sui dati di *healthcare* e qui le specifiche del garante italiano. Se chiunque volesse integrato o correggere quanto da me riportato nelle poche e parziali righe in cui ho toccato il tema, è benvenutə nei commenti.
Le ispirazioni di questa puntata
Ad ispirare la puntata è stata una recentissima uscita di
di (La giusta misura) e la lettura di due puntate di di ( Benvenuti nell'era dell'io quantificato e Caro il mio Garmin, io e te dobbiamo parlare).Per quanto parziali, queste riflessioni sui dati non sarebbero possibili senza letture stimolanti come quelle di
di .🏃🏻♂️ Ti è piaciuta A cosa penso quando corro? Come puoi sostenere il progetto
Se non lo hai ancora fatto, iscriviti alla Newsletter: ogni iscrizione è importante, mi motiva a credere in questo progetto.
Condividi A cosa penso quando corro? con amici, parenti, contatti, su Instagram, Twitter, Facebook, in un balletto su TikTok. Vedi tu!
Il mio profilo Instagram: @ban.zo_
Il mio profilo Strava: Lorenzo Bandini
Se questa puntata ti è piaciuta e ti va di sostenere questo progetto, sostieni A cosa penso quando corro? letteralmente al prezzo di un caffè al bar.
Come sempre, l’immagine finale è di Dall-E. Il prompt è il seguente: oil painting in the style of van gogh of an android running in a futuristic cyberpunk city
Non solum mi mente, sed etiam mi prende per il culo. La previsione gara del mio Garmin sui 10km era di 46 minuti circa, ho corso appena sotto i 48 e risultato? Il giorno seguente, elaborati i nuovi dati, la previsione da 46 è scesa a 45.
Ma che puntata fenomenale! La rileggerò con calma in questi giorni. Ma sai che le mie prime riflessioni sull’incertezza dei dati sono arrivate proprio dalla mia esperienza con la corsa? Certe cose bisogna provarle in prima persona per capirle :)