Nvidia se propuso revolucionar el mercado de las imágenes mediante un proceso de inteligencia artificial (IA), para convertir cualquier foto bidimensional en 3D.

Si bien en la actualidad no es demasiado complicado lograr una foto 3D con una cámara especializada los resultados dejan mucho que desear si no se utilizan equipos profesionales.

NVIDIA en un comunicado presume de "convertir una colección de fotografías en una escena 3D en cuestión de segundos".

Fue así que la firma experta en placas gráficas presentó una nueva tecnología llamada Instant Neural Radiance Field (NeRF) que entrena a los algoritmos de IA para crear objetos 3D a partir de fotos bidimensionales.

Conocido como "renderizado inverso", el proceso usa IA para "aproximarse a la forma en que se comporta la luz en el mundo real permitiendo a los investigadores reconstruir una escena 3D con un puñado de imágenes 2D tomadas desde distintos ángulos".

La red neuronal llena los espacios en blanco del panorama de 360 ​​grados y pronostica el color de la luz que emana desde cualquier dirección, desde cualquier punto del espacio 3D, para lograr resultados más realismo. En el video facilitado por la empresa se aprecia cómo cuatro fotos tomadas desde puntos de vista diferentes se fusionan en una imagen tridimensional.

Instant NeRF utiliza técnicas de aprendizaje profundo para que con un equipo relativamente accesible cualquiera pueda lograr una imagen 3D casi en el acto, facilitando la creación de contenidos para entornos virtuales. Pero hay más usos.

Posible usos de NeRF

Instant NeRF podría usarse para entrenar robots y automóviles autónomos para comprender el tamaño y la forma de los objetos del mundo real. Para ello se usarían la captura de imágenes en 2D o secuencias de video. También se podría aprovechar en arquitectura y entretenimiento para generar rápidamente representaciones digitales de entornos reales que los creadores pueden modificar y construir.

Nvidia se especializa en hardware 3D para consolas y computadoras

Según la compañía "el modelo requiere solo unos segundos para entrenarse en unas pocas docenas de fotos fijas, además de datos sobre los ángulos de cámara desde los que se tomaron, y luego puede renderizar la escena 3D resultante en decenas de milisegundos", acelerando el proceso en 1000x.

La empresa explica sobre este proceso que "en una escena que incluya gente u otros elementos en movimiento, cuanto más rápidas sean las fotos, mejor". En este sentido, si hay demasiada movilidad durante el proceso de captura en 2D, la escena 3D generada por la IA "será borrosa", informó Clarin. 

Te puede interesar