
Google Cloud Platform es una herramienta para analizar grandes bases de datos y crear modelos estadísticos que pueden predecir hechos futuros –algo así como lo que se utiliza para la predicción del tiempo-. Google, en su caso, ha utilizado sus ordenadores para predecir los resultados de los últimos partidos de fútbol del Mundial y curiosamente, los ha acertado. Esta fiabilidad ha hecho que muchos recuerden al famoso “pulpo Paul”, aunque aquí hablamos de ciencia de datos aplicada a gran escala.
La última ronda del Mundial de Fútbol ha sido todo un éxito para Google. Tal y como apuntan en el blog de Google Cloud Platform, los resultados de octavos de final de esta competición han sido acertados de lleno por parte de los superordenadores de la compañía –sí, incluso la derrota del equipo estadounidense-. Si no lo creéis, no tenéis más que ver –a partir del minuto 25– la conferencia del servicio en la que confirmaron las predicciones el día 26 de junio.
Gracias a los datos recogidos en todas las ligas donde juegan algunos de los jugadores del Mundial de Fútbol, Google fue capaz de examinar el comportamiento de estos en partidos previos, prediciendo así su rendimiento en futuros partidos. Además, se integraron bases históricas proporcionadas por Opta con varias temporadas del fútbol profesional y registros de la fase de grupos del torneo para enriquecer el modelo. Estas predicciones también se han basado en el entusiasmo y el apoyo de las hinchadas a cada una de las selecciones, cuantificando los aficionados desplazados para capturar la conocida “ventaja de jugar en casa”.
¿Cómo realizó Google estas predicciones?
La canalización de datos se apoyó en servicios nativos de la nube: Google Cloud Dataflow para importar y transformar los datos de forma escalable, y Google BigQuery para procesarlos y consultar millones de filas en segundos. Sobre estos conjuntos, los ingenieros entrenaron modelos de aprendizaje automático que ponderan rendimiento histórico, calidad del rival, forma reciente, estado de los jugadores y señales externas como el apoyo de la afición. La combinación de múltiples variables permitió generar probabilidades de victoria desde la fase de grupos con gran estabilidad.
Desde el buscador animan a cualquier interesado a usar estas herramientas para crear sus propias predicciones. Incluso compartieron el código fuente en Python en un repositorio público de GitHub, facilitando reproducir el flujo completo: ingestión con Dataflow, análisis en BigQuery y puesta en producción de los modelos.
Predicciones de cuartos de final
Ahora bien, ¿se ha tratado de suerte o realmente los modelos construidos por Google tienen un acierto del 100% a la hora de hablar de la Copa del Mundo de la FIFA? Pues bien, si estás interesado en apostar en los próximos partidos, es decir, en la ronda de cuartos de final, atención a los resultados que Google Cloud Platform ha predicho:
Brasil vs. Colombia: Brazil (71%)
Francia vs. Alemania: Francia (69%)
Holanda vs. Costa Rica: Holanda (68%)
Argentina vs. Bélgica: Argentina (81%)
Además de estos cruces, el sistema de Google llegó a acertar 13 de 14 encuentros modelados desde la fase de grupos, superando el 90% de acierto en su cómputo. En uno de los escenarios más mediáticos, “la nube” estimó que Alemania ganaría por poco la final (en torno al 55% de posibilidades) y adelantó que Brasil también ganaría su partido correspondiente dentro de la misma fase eliminatoria.
En estas predicciones lo cierto es que Francia destaca como el resultado más sorprendente ya que la mayoría de casas de apuestas abogan por una victoria de Alemania. ¿Volverá a acertar Google? Si vas a “fiarte” de las predicciones de sus superordenadores, esperamos que comentéis más abajo y que, tras los partidos, sepamos si habéis sido afortunados ganadores en alguna casa de apuestas.
Este caso es un ejemplo nítido de cómo BigQuery, Dataflow, señales como la cantidad de aficionados desplazados y datos profundos de Opta permiten transformar estadísticas dispersas en probabilidades accionables. La lección principal es que, aunque ningún modelo ofrece certeza absoluta, la combinación de datos de calidad y cómputo en la nube puede ofrecer una ventaja real frente a la intuición o los pronósticos tradicionales.
