Desarrollado por Google DeepMind, Project Genie se basa en las últimas investigaciones de 'modelos de mundos' de la compañía, incluido el sistema Genie 3, presentado por primera vez el año pasado.
A diferencia de las herramientas generativas tradicionales que producen imágenes estáticas a escenas pre-renderizadas, Google afirma que Genie genera entornos dinámicamente en tiempo real, prediciendo cómo evolucionan los mundos a medida que los usuarios se mueven e interactúan en ellos.
El acceso a Project Genie está actualmente limitado a los suscriptores de Google AI Ultra en Estados Unidos mayores de 18 años.
Google describe el lanzamiento como un prototipo de investigación inicial, no como un producto de consumo terminado.
La herramienta se entrega a través de una aplicación web y combina Genie 3 con otros modelos de Google, como Gemini y Nano Banana Pro.
En esencia, Project Genie ofrece tres capacidades principales: diseño de mundos, exploración de mundos y remezcla de mundos.
Los usuarios pueden diseñar mundos usando indicaciones de texto o imágenes, definiendo personajes, entornos y perspectivas antes de entrar en escena.
Una vez dentro, esos mundos son completamente navegables, y el sistema genera nuevos terrenos e interacciones sobre la marcha a medida que el usuario explora.
Las creaciones existentes también se pueden remezclar, lo que permite a los usuarios desarrollar a partir de indicaciones compartidas o ejemplos seleccionados, y exportar videos cortos de sus mundos.
Google posiciona el proyecto como parte de su impulso a largo plazo hacia sistemas de IA de propósito general que puedan modelar dinámicas complejas del mundo real.
Modelos de mundos como Genie 3 se consideran una base potencial para aplicaciones que abarcan desde la robótica y la simulación hasta el diseño de juegos, la animación y la exploración histórica.
La compañía ha tenido cuidado de enfatizar las limitaciones actuales de la tecnología, que los entornos generados pueden no siempre seguir la física del mundo real, el control de los personajes puede ser impreciso y las sesiones individuales tienen una duración máxima de 60 segundos.
Algunas funciones demostradas en investigaciones anteriores, como los eventos activados por indicaciones que alteran el mundo durante la exploración, aún no están incluidas.
Project Genie se encuentra dentro de Google Labs y su objetivo es recopilar comentarios sobre cómo se podrían usar los modelos de mundo interactivos en contextos creativos y de investigación.
Google afirmó que el acceso se ampliará a otras regiones con el tiempo, con el objetivo a largo plazo de que la tecnología esté disponible para un público más amplio una vez que los modelos subyacentes maduren.