El fútbol reproducido en 3D a partir de una simple foto

Lo puso a prueba durante este Mundial de Qatar el diario The New York Times, y no nos extraña que se convierta en algo común de la práctica periodística en los próximos años. Fueron una serie de artículos interactivos que permiten al lector de este periódico ver las jugadas claves en formato 3D. Para lograrlo, solo es necesario una foto por supuesto, así como un modelo de aprendizaje automático de visión por ordenador de código abierto y, por último, herramientas colaborativas. Veamos cómo lo hizo uno de los rotativos más importantes del mundo, durante el pasado Mundial. El modelo se llama Icon.
3D a partir de una foto
Icon es un modelo de aprendizaje automático de código abierto, cuyos autores están relacionados con The New York Times. Sus promotores eligieron el fútbol porque «las poses son predecibles; las personas suelen estar de pie, de pie o corriendo, y rara vez se contorsionan en poses extremas», aseguran en el departamento de I+D del periódico.
Los futbolistas se representaron como bocetos y no mediante «figuras fotorrealistas». El objetivo de tal decisión era mostrar «al lector que se trataba de una representación de la obra y no un intento de crear una reconstrucción realista».
Flujo de trabajo
Esta es la descripción general del proceso, publicada por el departamento de I+D del periódico neoyorquino. En el proceso se emplean unas pocas horas desde que se produce la jugada hasta que el modelo 3D sale publicado en la web del periódico
- Un periodista desde Qatar fotografía un partido. Captura imágenes en ráfagas de alta velocidad. Su propósito es anticiparse a momentos importantes, para lo que toma las instantáneas desde una visión amplia del campo. El fotógrafo acuerda con la redacción en los EEUU cuál es el momento clave del partido. En ese momento, transmite la foto.
- «A partir de esa foto, calculamos la posición 3D de la cámara del fotógrafo», aseguran. Tal cálculo se realiza de manera matemática, teniendo en consideración el tamaño de la portería y el área chica como guías geométricas. «Una vez que conocemos la posición de la cámara, proyectamos la imagen en la dimensión 3D que representa el campo y las gradas donde se jugó el partido».
- Posteriormente se recorta la fotografía de cada jugador. Tal acción se realiza con el modelo de aprendizaje automático Icon , que es el que crea los modelos 3D estimados de los jugadores «para garantizar una reconstrucción precisa».
- A partir de este momento, se componen los modelos de jugadores resultantes en la escena 3D del campo. Se configuran a mano la posición, la rotación y la escala de los jugadores «para que coincidan con la proyección de origen». Cada modelo de jugador se compara con otras imágenes tomadas desde diferentes ángulos en el mismo momento.
- Finalmente, «ensamblamos todos los activos creados en una historia utilizando nuestro motor de historias WebGL interno, llamado Threebird, que permite que varios periodistas colaboren en la escena 3D simultáneamente». Por último, «se anima la cámara, se agregan sombreadores, se incorporan anotaciones y se optimiza y publica el paquete».
Proceso colaborativo
Una de las claves de este trabajo es su vertiente colaborativa desde que se efectúa la fotografía in situ hasta que la imagen en 3D se publica. La base de este trabajo en equipo es una herramienta interna llamada Threebird, como ya hemos citado, que también se utilizó para la cobertura de los Juegos Olímpicos de 2022 por parte del periódico. Así funciona:
«Threebird es una herramienta visual colaborativa basada en la web para diseñar gráficos interactivos en 3D. En lugar de que varios editores trabajen en un archivo en Maya o Blender pasando sucesivamente el proyecto entre sí, Threebird permite que varias personas colaboren simultáneamente dentro de un editor basado en web. Así es posible realizar la animación de modelos 3D, editar sombreadores, crear caminos de cámara etc. Threebird aprovecha la biblioteca de código abierto Theatre.js para proporcionar una interfaz de usuario amigable para los artistas y para el diseño de animación. La herramienta hace que la visualización previa de la pieza web final publicada sea más rápida y reduce drásticamente la fricción de colaborar en historias 3D».