Skip to main content

Recerca

Víctor Martínez, l'estudiant, al centre, acompanyat per Martí Casals i Jordi Cortés

Martí Casals, coautor d’un treball sobre una revisió sistemàtica de paquets del programari estadístic R en el camp de l’esport

24.11.2022
Share
Recerca

El boom de l’estadística esportiva i la seva comunitat està evolucionant ràpidament. El creixement de nous grups de recerca i nous graus o postgraus en l’àmbit d’estadística esportiva o anàlisi de l’esport és cada vegada més freqüent, sobretot a països com els Estats Units, Anglaterra i Austràlia. Actualment, les millors lligues professionals de l’esport demanen cada vegada més especialistes en anàlisi de dades d’esport amb habilitats de pensament estadístic i computacionals, i amb domini de programes estadístics com la R. 

En aquest context, investigadors de la UVic-UCC, la UB i la UPC han publicat un treball consistent en una revisió sistemàtica sobre paquets de R en el camp de l’esport a la revista International Journal of Sports Science & Coaching. R és un programari estadístic de codi obert en desenvolupament constant que ha guanyat molta popularitat dins de les comunitats estadístiques i anàlisis de dades en les ciències de l’esport. El treball presenta per primera vegada una revisió sistemàtica de paquets d’esport dins del repositori CRAN de R seguint les directrius de la guia PRISMA

L’origen, un TFG

L’estudi va sorgir d’un treball de fi de grau (TFG) del grau en Estadística (interuniversitari UPC-UB). El treball va ser realitzat per l’estudiant Víctor Martínez (UB-UPC), i codirigit per Jordi Cortés (Departament d'Estadística i Investigació Operativa, DEIO-UPC i membre del grup de recerca GRBIO en Bioestadística i Bioinformàtica) i per Martí Casals (INEFC de la UB, Centre d'Estudis en Esport i Activitat Física de la UVic-UCC i professor de la Facultat de Medicina de la UVic-UCC). Posteriorment, es van integrar a aquest projecte professionals estadístics i científics esportius reconeguts, com Klaus Langohr (DEIO-UPC i membre del grup GRBIO) i Jose Fernández (científic de dades de l’esport amb experiència en els Houston Astros de la Major League Baseball). Destaca la col·laboració de Michael López, director sènior de dades i anàlisis de futbol americà a la National Football League i antic professor d’estadística al Skidmore College, guardonat l’any 2020 amb el Premi Col·laborador Significatiu d'Estadística en Esports de l'Associació Americana d'Estadística. 

Des del 2010 hi ha hagut una tendència creixent en la creació de paquets de R relacionats amb l'àmbit de l’esport. Es van detectar un total de 81 paquets actius d’esports a CRAN creats posteriorment al 2006. L'ús de paquets R relacionats amb l'esport és més prevalent en esports professionals com el bàsquet o el futbol. No obstant això, aquesta revisió mostra que hi ha una manca de paquets enfocats a l’esport femení i amateur. Igualment, hi ha un marge de millora important en la part de metodologia estadística implementada en aquestes llibreries.

L’estadística esportiva és especialment adequada per al seu ús a l'educació a causa de la riquesa i la disponibilitat de dades, el coneixement preexistent de l'esport entre els alumnes, i la facilitat amb què es pot utilitzar per promoure l'alfabetització de les dades. Aquesta investigació assenyala el fet que hi ha una important oportunitat per millorar l'educació estadística a partir de dades i problemes reals de l'esport mitjançant el programari R. 

En aquest estudi s'han compartit les dades i el codi de les anàlisis, permetent així la seva reproductibilitat. També s’ha creat una aplicació dinàmica R-Shiny de consulta en aquest enllaç.

Vols publicar a l'Apunt?

Contacta'ns