La creciente demanda de activos 3D de alta calidad en industrias como los videojuegos, la realidad virtual y la publicidad, requiere herramientas avanzadas como 3DTopia-XL para la creación eficiente y automatizada de contenido.
Los modelos generativos 3D han logrado avances importantes, pero aún enfrentan desafíos en la optimización, la fidelidad geométrica y la creación de activos para representaciones físicas detalladas (PBR).
Para superar estas limitaciones, se presenta 3DTopia-XL, un modelo generativo diseñado para escalar la generación de activos 3D con alta calidad, velocidad y precisión.
3DTopia-XL: Un modelo llamativo y escalable
3DTopia-XL emplea una representación basada en primitivos llamada PrimX, que permite codificar en un formato tensorial compacto la forma, el albedo y el material de los objetos.
Gracias a esta estructura, el modelo puede generar geometrías de alta resolución con propiedades de renderizado PBR, esenciales para obtener resultados visuales de calidad profesional.
Aparte, el modelo aprovecha un Transformador de Difusión (DiT), el cual implementa:
- Compresión de parches primitivos: optimiza el uso de recursos en la generación.
- Difusión primitiva latente: permite generar activos con texturas y materiales detallados de forma rápida y precisa.
El proceso de eliminación de ruido en 3DTopia-XL tarda aproximadamente cinco segundos en producir un activo PBR listo para su integración en cualquier pipeline de gráficos, partiendo de una entrada de texto o imagen.
Difusión Primitiva: La clave de la escalabilidad
La representación PrimX es la pieza clave para maximizar la escalabilidad del modelo.
Cada activo generado consiste en una malla texturizada con tokens volumétricos anclados a la superficie del objeto.
Cada token en el modelo PrimX contiene una carga útil voxelizada que codifica información tridimensional (SDF), color (RGB) y datos de material, permitiendo representar con precisión la forma y las propiedades físicas de los objetos.
Galería: De imagen a 3D con 3DTopia-XL
3DTopia-XL genera la creación de activos 3D de alta fidelidad a partir de una sola imagen o una descripción textual, generando modelos listos para ser importados a software de modelado como Blender.
La combinación de precisión geométrica y rapidez en el procesamiento hace de 3DTopia-XL una herramienta versátil para estudios de animación y diseño, cerrando la brecha entre la generación automatizada y la calidad profesional exigida en aplicaciones del mundo real.
Este avance sitúa a 3DTopia-XL como una solución eficiente y escalable para la creación de contenido 3D optimizados, acelerando significativamente el proceso de producción de activos 3D complejos y listos para ser utilizados en cualquier escenario gráfico.
Pueden ver el paper y toda la información en este enlace.
More Stories
Amazon desafía a Nvidia con sus propios chips de IA
Inteligencia artificial en el juego en equipo: MARLadona
El Proyecto Astra de Google se retrasa hasta 2025