Sei sulla pagina 1di 9

Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 1

Utilización de deep learning para prescribir


entrenamiento amateur de triatlón
Autor, Ing.Gabriel Della Mattia (ednacore)

grupo dicho aprendizaje con el objeto de bajar la aparición


de enfermedades o lesiones leves/serias.
Punto de vista personal. PVP
(g1) se lo sometió a planes de entrenamiento supervisados
-Abstracto— por el modelo IR + red neuronal entrenada (explicados en el
Esta revisión cubre el análisis y planificación de apartado Framework).
entrenamiento de tiratrón asistido por computadora en el
campo de los entrenamientos en deportes de resistencia. Los (g2) se lo sometió a planes de entrenamiento supervisados
avances recientes en el aprendizaje automático, por el modelo IR (explicado en apartado Framework)
especialmente con respecto al aprendizaje profundo, ayudan dejando de lado la red neuronal entrenada.
a identificar, clasificar y cuantificar patrones en sesiones de
entrenamiento como también en el comportamiento del
mismo sometido a la vida cotidiana en atletas amateurs. -Resultados-
En el núcleo de estos avances se encuentra la capacidad de
explotar las representaciones jerárquicas de características Los 40 atletas (ambos grupos) completaron el estudio, luego
aprendidas exclusivamente de los datos, en lugar de las de dos años (2017(aprendizaje RNA) – 2018(estudio).
características diseñadas a mano de acuerdo con el En el primer grupo (g1) donde se encontraba la tasa de
conocimiento específico del dominio. recurrencia de enfermedad y lesión leve más alta (p  > 0,57)
disminuyo (p < 34) mientras que el grupo (g2) donde la
-Métodos- tasa de recurrencia era baja (p  < 0,31) aumento (p > 0,37)
Ambos grupos mejoraron su performance (g1) (2% +/- 0.5)
Se tomo como muestra inicial atletas amateurs mientras que el (g2) (1.4% +/- 0.12) esto puede dar a
aparentemente sanos y entrenados (n=60) cuyas base de entender que la continuidad en el entrenamiento del (g1)
datos de entrenamientos y métricas de vida cotidiana ofreció una mejora cualitativa al proceso.
cumplían la condición excluyentes (días registrados >
90%). De estos 60 se separaron aquellos que habían logrado
mejoras en su performance y personal best en la carrera -Conclusiones-
objetivo quedando para la muestra en 47 atletas.
Introducimos los fundamentos de los métodos de
De estos 47 atletas se separo en dos sub grupos: aprendizaje profundo y revisamos sus éxitos con
determinadas pruebas de campo y carreras objetivo A, la
Grupo 1 (g1) detección de posibles enfermedades/lesiones y caídas en el
(N=20) alta concurrencia de enfermedades o lesiones leves rendimiento fueron abordadas con el uso de la red neuronal
(p  > 0,57) dentro de las 10 semanas más importantes para la planteada, pudiendo solucionar un problema concurrente en
carrera objetivo. 3000 registros de información. los amateurs a la hora de aumentar la carga en busca de un
objetivo.
Grupo 1 (g2)
(N=20) baja concurrencia de enfermedades o lesiones leves El aprendizaje profundo (Deep Learning) se está
(p  < 0,31) dentro de las 10 semanas más importantes para la convirtiendo rápidamente en un estado de la técnica, lo que
carrera objetivo. 3000 registros de información. lleva a un mejor rendimiento en diversas aplicaciones
deportivas
Ambos grupos en el primer ano su planificación de Concluimos discutiendo temas de investigación y sugiriendo
entrenamientos fue supervisada por el modelo IR direcciones futuras para una mejora adicional.

Los ciclos de alta carga estudiados fueron dos (uno por año)
y cada uno tenían una duración de 10 semanas para ambos
grupos y la composición de tipo de entrenamiento fue igual
e individualizado por zonas/ niveles de potencia para todo el
grupo.

El primer año sirvió para el aprendizaje de la red neuronal y


el segundo año para el estudio realizado aplicando en un
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 2

ciclo menstrual femenino, estado de enfermedad. El rango


Introducción (FRAMEWORK) de la métrica se encuentra en valores absolutos del 1 al 10
siendo 1 el peor estado de todas las métricas. La variabilidad

S i bien no se pretende desplazar la autoridad, experiencia


del entrenador este tipo de herramienta pueden ser
complemento para la toma de dicciones antes de planificar
del ritmo cardiaco también ha sido llevada a ese rango por
medio de un resta aritmética simple en el caso del resultado
de estrés que brinda los nuevos gadget garmin.
una temporada o para probar simulaciones whatIF.

El framework está compuesto por un colector y clasificador


de datos obtenidos de distintos gadgets que luego serán
procesados para obtener distintas métricas y estas luego
volcadas a un modelo de impulso respuesta + una red
neuronal.

1-Colección y clasificador de datos.


2-Procesamiento de datos.
3-Modelado.
4-Red Neuronal Artificial.

Han sido filtrados aquellos atletas inconsistentes en la carga


diaria de estas métricas como también aquellos que
cometían muchos errores en su carga.
De esta forma quedando un universo de 47 casos sobre 100
iniciales.
Uno de los problemas detectados es la inconstancia en la
carga de estos valores aun teniendo una aplicación móvil
para dicho fin, la espera de gadgets con resultados
1-Colección y clasificador de datos automáticos es una ventaja para este tipo de control.

La colección de datos se realizo por medio de gadgets Otro problema detectado es la calidad de medidas de
comerciales (Garmin) obteniendo su archivo de formato FIT potencia y pulso por errores en calibración o interferencias
(ANT-FS) los cuales son procesados con un parser y de las frecuencias de transmisión de estos sensores que se
volcados a una base de datos valores brutos. encuentran de las frecuencias de los routers hogareños, baja
calidad de la señal y otros problemas mecánico -
electrónico. Por dicha razón se confecciono un filtro para
eliminar picos absurdos.

Con el fin de filtrar datos y poder detectar problemas en la


calibración del instrumento de medida se confección una
GAN o bien Generative Adversarial Networks

Estas son redes de confrontación generativa con


arquitecturas neuronales profundas generalmente dos redes
que se enfrentan entre sí. Estas redes pueden imitar
Graf This is ANT web site. cualquier distribución de datos es decir que pueden crear
clones de cualquier dominio en este caso la vamos a usar
Los canales se dividen en dos clases A y B siendo la clase para lapsos de tiempos y conjunto de datos de 3seg tomados
A aquellos con B (bias) más importantes. de 1hz.

También se tomo en cuenta un subconjunto de datos sub-


objetivos pero normalizados de distintas métricas de la vida
cotidiana: Horas de sueño, calidad de sueño, estrés laboral,
estado muscular, variabilidad de ritmo cardiaco (HRV) ,
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 3

Una red neuronal, llamada generador, genera nuevas


instancias de datos, mientras que la otra, el discriminador,
las evalúa para determinar su autenticidad; es decir, el
discriminador decide si cada instancia de los datos que
revisa pertenece o no al conjunto de datos de entrenamiento
real (time-3seg).
Con este algoritmo podemos normalizar y estar seguro que
por ejemplo si el atleta viene produciendo 200w-201-199w
y de repente se encuentra un 500w y luego un 202w hay
presencia de un pico no deseado y coloca un valor (1)
razonable con la serie. Como también detectar cambios 2-Procesamiento de datos.
grandes en el comportamiento de la potencia por posibles
problemas con el instrumento de medición. Para obtener métricas objetivas los datos brutos obtenidos
por los gadgets se los procesa lo cual obtendremos un
r2
conjunto de métricas clase A.
 0
F ( r ,  ) dr d  [ r2 / ( 2  0 )]
(1)

 exp (   | z j  zi | ) 
1
J 1 (  r2 ) J 0 (  ri ) d . TSS : Training Stress Score [ref 1]
0
NP : Potencia Normal [ref 1]
IFR : Intensidad relativa al FTP [ref 1]
Tensor-Flow ejemplo

Se puede observar que la cadencia es 0 pero hay un pico de


potencia de 506w
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 4

Mas adelante vamos a ver como trabajar con este proceso.


3-Modelado.
Limitaciones del modelo del modelo
El modelo que utilizamos para modelar en un sentido
general la cinética de la fatiga humana, adaptación es el de
El modelo IR dice que el rendimiento en un momento dado
impulso-respuesta (IR) Crarke & Skiba el cual incluye la
P (t) es igual al nivel de rendimiento inicial del atleta P(0)
ecuación de HILL que convierte el modelo de Barnister no
más la aptitud acumulada en ese momento menos la fatiga
saturable en uno saturable como muestra la figura obtenida
acumulada en ese momento. Las constantes de condición
del propio paper de los autores. física.
Graf from Clarke and Skiba 2011-

Si las constantes de condición física y de fatiga realmente se


mantienen constantes (es decir, el modelo es invariante en el
tiempo), esencialmente dice que el rendimiento en cualquier
momento es la suma directa de la condición física - la
fatiga. En este sentido, para un atleta determinado, si
aumentamos la CTL de 50 a 70, al mismo nivel de fatiga,
debería resultar en el mismo salto de rendimiento como si
aumentara la CTL de 120 a 140. Pero analizando esto
mediante test de 20min realizados cada vez que el CTL
aumenta 20 puntos (unas 4 semanas) se puede observar que
a medida que un atleta se pone en forma, las ganancias de
rendimiento son cada vez más difíciles de conseguir incluso
hay un punto de inflexión donde caen.
La de ecuación HILL (Hellard et al) se la utiliza para
representar la noción de que el cuerpo tiene una capacidad
finita para adaptarse a la carga de entrenamiento.

Esta ecuación es incluida en la formula nativa de impulso


respuesta que se describe a continuación.
Por dicha razón este modelo no refleja un mapa completo
del estado del atleta función del tiempo. En el modelo IR,
los impulsos de entrenamiento son proporcionales a las
cargas de entrenamiento, por lo tanto, las cargas mayores
inducen una mayor capacidad física y la adquisición de
Para determinar los parámetros K1,K2 y T1 y T2 que son fatiga. Sin embargo, estudios anteriores informaron que el
individuales para cada atleta podemos utilizar el solver que impacto de las cargas de entrenamiento en el rendimiento
propone Skiba [3] o bien realizar una regresión logística puede tener un límite superior por encima del cual el
utilizando el módulo sklearn en python. entrenamiento no provoca una mayor adaptación.

Busso 2003 [6] observo que no es consistente que los


parámetros permanezcan constantes a medida que la carga
aumenta, esta suposición lineal aborda un problema.
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 5

En resumen: Por medio de una red neuronal podemos


estimar de forma bastante precisa que volumen máximo
puede adaptar el atleta sin perder performance . También
4-Red neuronal artificial podemos describir el comportamiento esperado de la
performance a medida que aumenta el volumen, de esta
Abordaje del problema. forma detectar problemas que requieren parar (STOP ) y
dejar que el cuerpo se acople para volver a incrementar
Ya existía un trabajo de Edelmann-Nusser et al donde uso dentro del plan anual de entrenamiento.
capas de percepron para modelar la performance de
nadadores olímpicos que producía un error en la predicción Como STOP se debe tener en cuenta cualquier test, o
de 0,04%. El modelo de Nusser requería de muchos datos lo intervalos regulares que no estén relacionado con lo
que llevado a la práctica para muchos atletas podría esperado y tomar acción manual al respecto. La experiencia
ocasionar un overfiting y en última instancia, este método del entrenador juega un rol tan importante como siempre
Demostró ser exitoso, pero, como señalaron los autores, dado que esta es una herramienta de ayuda y no de decisión
puede haber sido fortuito que el comportamiento adaptativo final no supervisada.
de ambos atletas fue similar y por otro lado la cja negra que
significa una red neuronal anularía la posibilidad de actuar Las causas inherentes que afectan sobre todo a los atletas
sobre un efecto no deseado. amateurs es la vida cotidiana, la calidad de sueño, las horas
de descanso, el stress laboral por dicha razón procedemos a
Por esta razón el motivo de este documento es mostrar a la explicar la segunda red que brinda soporte a la identificación
red neuronal como complemento de análisis de el modelo IR de riesgo de lesiones, enfermedades y es el activador del
y poder brindar información en las fallas explicadas STOP descripto en el párrafo anterior.
anteriormente.
Se intento utilizar una red neuronal para acomodar las
relaciones no lineales algo que el modelo IR.

Fig11- Esquema de red.

De esta forma poder tener control de los riesgos de retroceso


de adaptación cuando se aumenta el volumen. Al armar el
plan anual poder predecir cómo se comportaran las distintas
fases y el alcance de volumen de las mismas parece
contribuir en las buenas prácticas del proceso.

Cuanto debe durar la fase dos [8] y que mejora de potencia


se espera obtener, cuánto debe durar la fase tres [9] y que
mejora y cual es limite esperado.
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 6

Utilización de una red neuronal artificial para predecir,


5-Metricas de la vida cotidiana modificar o no próximo estimulo.
MVD
Las MVD (métricas vitales diarias) son un conjunto de datos
objetivos y subjetivos que pretenden dar una visión a la vida
extra deportiva del atleta, tratándose de atletas amateurs con
carga laboral y familiar compleja.
El problema principal es que cada parámetro del modelo
debe estimarse dentro de un nivel de confianza aceptable y
que el número de parámetros amplía el intervalo de
confianza de las estimaciones (generalmente computado con
técnicas estadísticas por ende reduce el número de grados de
libertad

Fig 12 Código Python uso de la ML

Esta red entrega dos valores, vamos a utilizar el valor prob


de éxito (Kz) como parámetro de decisión, y como se puede
ver en la (fig 11) se puede ejecutar automáticamente o bien
bajo última decisión del coach. La red neuronal ya tiene un
aprendizaje general este se puede utilizar en gran medida en
aquellos atletas que recién empiezan con este programa de
supervisión y aun no tienen un set de datos individual como
para generar su propia red ML.
Para que la red individual tenga buena precisión se requiere
más de un año de datos. No ha sido aun probado el éxito de
la red en atletas que no tienen un set de datos individual,
recién a fines de 2019 se podrá tener un panorama al
respecto. Solo 47 casos tienen un dataset individual con su
respectiva ML, el resto se encuentra procesado bajo la ML
genérica.
Normalizacion de metrica. Uno de los problemas es de infraestructura, actualmente
todo este modelo se encuentra funcionando en Microsoft
Azure lo que representa un costo elevado para un valor de
servicio económico. Futuras implementaciones serán
llevadas a cavo bajo el modelo r #FederatedLearning de
esta forma bajar los costos y aumentar la velocidad de
proceso.

Ciclo de vida de la ML, vida útil del aprendizaje.


6-Aprendisaje de la RNA
Se contaba con un set de 40 atletas verificados y se debía
decidir cuáles iban a formar parte del aprendizaje y cuáles
del test de prueba, se separo en un grupo de 30 para
aprendizaje y 10 quedaron para prueba. La clasificación fue
variada poniendo los casos más comunes como aprendizaje
y los menos normales como test esto podía evitar un
overfiting y así fue la tasa de error fue acorde a la de
aprendizaje.

ML anterior (ver codigo python fig 12)


dataset = pd.read_csv('D:\dataset_cargas.csv')
observaciones = dataset['OBS']
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 7

A medida que el atleta se somete a un plan de entrenamiento Rampas de carga semanales 21 días antes de un Ironman,
la idea es que mejore su aptitud física, si bien el cálculo de mismo atleta. Las dos primeras curvas sin uso de la RNA la
las métricas de entrenamiento son ajustadas en el tiempo y ultima grafica usando la RNA.
en el caso que las condiciones de estilo de vida no hayan
cambiado significativamente es necesario ensenarle cada
ano el comportamiento inducido de esta forma se establece
como ciclo de vida de cada ML entre 10 meses y 14 meses
de generación de nuevos datos a partir de la vieja ML.

7-Conclusion y punto de vista


personal
El complemento que proporciona este tipo de herramientas a
la planificación de entrenamientos en deportes de resistencia
es amplia, desde poder planificar en forma individual base a
su historial de datos, evitar lesiones por sobre carga y
enfermedades típicas encontradas cuando se produce un
overraching prolongado. En los primeros años como
entrenador he encontrado gran aparición de síntomas de
Graf Ironman ramp rate Race-21 dais 2015-2016-2027
enfermedad y problemas musculares no graves pero que
hacían perder la continuidad del ciclo en desarrollo, desde la
utilización de estas herramientas la tasa de enfermedad ha
disminuido y las lesiones musculares leves han bajado,
8-Curvas de influencia con ajuste
como también se acomodaron mejor los periodos de carga y de constantes RNA
adaptación.

El Si logramos obtener un buen ajuste de las constantes K y


T podemos obtener unas curvas de influencia bastante
precisas, estas curvas nos van a informar dos puntos muy
importantes dentro de la planificación de un objetivo. La
primer información que nos brinda es el día o entorno de de
días que el entrenamiento más incidencia positiva tendrá el
día de la carrera y por otro lado al contrario informara el dia
o entorno donde ya el entrenamiento empieza a ser
Lesiones leves: Contracturas, Tendinitis aquilea, tendinitis
irrelevante y tal vez negativo para la carrera.
pata de ganso, desgarro grado 1
Perdidas de entrenamiento 2 a 7 días (running)

Lesiones serias: desgarro grado 2, lesión no detectada.


Perdidas de entrenamiento 7 a 14 días (running)
*Se ha detectado una lesión que aun no se pudo solucionar y
el atleta se encuentra si solución al respecto.

Enfermedad: Gripe (82%), Anginas (6%) y diarrea(12%)


Días sin entrenar: 3 a 5 off total
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 8

9-Sobre ajuste (overfting) de la RNA


El efecto de sobreentrenar un algoritmo de aprendizaje con
unos ciertos datos para los que se conoce el resultado
deseado. El algoritmo de aprendizaje debe alcanzar un
estado en el que será capaz de predecir el resultado en otros
casos a partir de lo aprendido con los datos de
entrenamiento, generalizando para poder resolver
situaciones distintas a las acaecidas durante el
entrenamiento. Sin embargo, cuando un sistema se entrena
demasiado (se sobreentrena) o se entrena con datos extraños,
el algoritmo de aprendizaje puede quedar ajustado a unas
características muy específicas de los datos de
entrenamiento que no tienen relación causal con la función
objetivo. Durante la fase de sobreajuste el éxito al responder
las muestras de entrenamiento sigue incrementándose
mientras que su actuación con muestras nuevas va
empeorando. Por dicha razón en un principio se habían
utilizado mas capas y más datos de ingreso, pero el error de
validación se incremento mientras que el de entrenamiento
bajo por lo que se detecto una situación de sobreajuste. La
medida a tomar fue paramétrica todo en una variable única
MVD con ámbito [1..100]. También se redujo la cantidad de
épocas a la mitad y las capas ocultas como muestra la
siguiente figura.
Rev experimental del proceso <Punto de vista personal – Sujeto a cambios futuros> 9

Fuentes utilizadas y citadas.

Principal.

Rationale and resources for teaching the mathematical modeling of


athletic training and performance
David C. Clarke1 and Philip F. Skiba2

[7] Coggan AR. Training and racing using a power meter: an introduction.
Revised 25 March 2003 [online]. Available from URL:
http://www.midweekclub.ca/articles/coggan. pdf [Accessed 2008 May 4]

EFFECTS OF A 6-WEEK PERIOD OF POLARIZED OR THRESHOLD TRAINING


ON PERFORMANCE AND FATIGUE IN ELITE SWIMMERS.
Pla R, Le Meur Y, Aubry A, Toussaint JF, Hellard P.

THE ANALYSIS AND UTILIZATION OF CYCLING TRAINING DATA.


Jobson SA1, Passfield L, Atkinson G, Barton G, Scarf P.

MODELING OF PERFORMANCE AND ANS ACTIVITY FOR PREDICTING FUTURE


RESPONSES TO TRAINING.

Chalencon S1, Pichot V, Roche F, Lacour JR, Garet M, Connes


P, Barthélémy JC, Busso T.

ADEQUACY OF A SYSTEMS STRUCTURE IN THE MODELING OF TRAINING


EFFECTS ON PERFORMANCE.

Busso T1, Carasso C, Lacour JR.

Posibles mejoras futuras.


Memoria episódica Deep Q-Networks

https://arxiv.org/abs/1805.07603

IA Papers

Adversarial Neural Audio Synthesis


https://ai.google/research/pubs/pub47863

Increasing the Representation Accuracy of Quantum


https://ai.google/research/pubs/pub47848

Potrebbero piacerti anche