Hacer y aprender más con los datos: análisis multi-variado. El ejemplo de la WNBA y sus jugadoras

Los datos son capaces de brindar aprendizajes y enseñanzas que no son perceptibles con el análisis de una o dos variables. Esta es la calve del análisis multi-variado. Para ejemplificarlo, tomamos estadísticas de las jugadoras de básquet femenino en la WNBA y realizamos un diagrama de dispersión a través de Python. El punto de partida, obvio, fue comparar a A’ja Wilson (la MVP de la temporada) y Caitlin Clark (la novata que batió récords).

Tras iterar y profundizar en los datos de cada una de estas jugadoras, se construye un mapa que ilustra su modo de anotar puntos. Resulta que Clark anota triples, con una gran visión para asistir y una clara debilidad por las pérdidas de balón. Y Wilson anota dobles: alta y potente bajo las canastas. Y esto se destaca al observar los datos de la WNBA. El grupo azul, jugadoras que encestan en mayor proporción triples (con Jones, Taurasi, Ionescu, Sabally, Ogunbowale, entre otras) revela que anotar desde el perímetro es difícil de defender. Por otro lado, el grupo amarillo (de Wilson junto a B. Stewart, Collier, Hamby y Ogwumike) se beneficia de la resistencia de la pintura.

Si solo miramos los números de dobles y triples de cada jugadora, observamos el rendimiento individual, pero no comprendemos cómo se compara con el resto de la liga ni si existen patrones grupales. La técnica multi-variada del clustering (agrupamiento) identifica grupos naturales de jugadoras con estilos de anotación similares, permitiendo ver tendencias colectivas que no se aprecian al mirar jugadoras una por una. El diagrama de dispersión con clusters revela zonas de concentración y outliers para identificar casos excepcionales.

El cluster azul (especialistas en triples) muestra quiénes realmente se destacan en el tiro de tres, incluso si alguna jugadora aislada tiene un buen promedio de triples, pero pertenece a un grupo que en general no lo hace. El cluster naranja (especialistas en dobles) agrupa a quienes dominan cerca del aro, como A’ja Wilson y Brittney Griner, lo que permite realizar hallazgos, al comparar sus características dentro de un mismo perfil de jugadora. El cluster rojo (perfil mixto) ayuda a identificar a las jugadoras que no encajan claramente en los extremos y que podrían tener un rol diferente. Por ejemplo, Clark, Plum y Ogunbowale aparecen claramente como outliers en el cluster azul, lo que sería difícil de notar solo con tablas de datos.

La técnica de clústeres permite identificar perfiles de jugadoras bien definidos, lo que facilita el diseño de estrategias personalizadas (para el deporte, y por analogía, en el marketing o la investigación de mercado).

Una buena visualización transforma datos complejos en insights accionables. En este caso, permite a entrenadores, analistas o empresas, identificar fortalezas, debilidades y oportunidades de mejora según el perfil de cada jugadora o segmento. Este tipo de análisis demuestra el poder de ir más allá de los promedios y los rankings generales. Al visualizar los datos por segmentación multivariada, es posible descubrir patrones y oportunidades que no se ven a simple vista.

Open chat
Hola👋
¿Podemos ayudarte?