Pasar al contenido principal

ES / EN

La llegada de Sora y el golpe de la IA a la creatividad
Vie, 23/02/2024 - 08:30

Felipe Silberstein

Felipe Silberstein crédito Apply Digital
Felipe Silberstein

Jefe de Estrategia de Plataformas en Apply Digital
 

Solo hace unos días, la industria digital recibió con asombro una muestra de Sora, un sistema de inteligencia artificial que permite la generación de videos a partir de la redacción de un comando en forma de texto. 

Y aunque ya existían otros modelos de IA capaces de generar videos, la diferencia de Sora está en la impresionante capacidad y resultados que entrega el modelo, utilizando toda la tecnología y aprendizajes de OpenAI, dueño de ChatGPT y el text-to-image Dall-E.

Los “antiguos” motores de generación de videos trabajan en base a un entrenamiento de imágenes (eje X, Y), mientras que Sora incorpora un tercer eje, logrando que el resultado final sea más consistente y cercano a una toma real, además de entregar consistencia para personajes en diferentes tomas. A estos modelos, que integran y sintetizan conocimientos procedentes de una amplia gama de fuentes para formar una mejor comprensión del mundo, se les está llamando "General World Models".

El entrenamiento de los lenguajes de IA permiten no solo entender lo que la persona está pidiendo en su texto, sino además cómo adaptarlo al mundo real. 

Ahora, solo se necesita un comando y un modelo de lenguaje que entienda lo que estoy diciendo para crear lo que quiera. Lo que resulta de ese comando puede ser un texto diferente (ChatGPT), una imagen (Dall-E, MidJourney), código (CodeGPT, Copilot de Github), sonidos (ElevenLabs) o un video, como es el caso de Sora o Runway, empresa fundada por chilenos.

Esto, sin duda, va a revolucionar varias industrias, como la de los videojuegos. Además de que se espera que estos sean mucho más realistas y complejos, mostrando personajes en escenarios reales o virtuales y realizando movimientos específicos, también podrás alterarlos y personalizarlos como jugador.

En general, con la inmediatez de la generación de imágenes, videos y música, es muy probable que se vayan generando nuevos formatos y nuevas formas de consumir contenido, lo único que quedará obsoleto será la palabra espectador, ya que tendrá un rol activo en la generación del contenido. 

Esto también se verá en cómo nos relacionamos con cosas mucho más cotidianas como una tienda digital. Y es que con Sora ya no es necesario depender de la información del usuario o tener buenas técnicas de predicción para entregar un contenido personalizado; ahora, el input vendrá directamente del comprador, haciendo más cercano el concepto de “Comercio Conversacional”.

Por ejemplo, una mujer buscando unos zapatos que hagan match con su vestido rojo podrá pedirle al e-commerce que le sugiera unos zapatos que combinen con su vestido rojo y que genere un pequeño video para decidir su compra.

Sin lugar a dudas, el text-to-image/video/code, etc., es la gran revolución que hemos visto en los últimos 16 meses con la salida de ChatGPT.     

Ahora bien, es importante recordar que este tipo de modelos son, al fin y al cabo, herramientas. La clave está en saber manejar estas herramientas y darles un uso creativo para nuestro beneficio. 

Por lo mismo, son los altos mandos de las empresas los que deben definir estrategias claras del uso y expectativas de la Inteligencia Artificial para incentivar su adopción. Esto no es un tema tecnológico, sino estructural y estratégico de toda la empresa. No basta con tener un chatbot potenciado con IA, sino que tener estrategias que cubran aspectos técnicos y legales, con objetivos específicos de corto y largo plazo. 

Además, es muy importante que en el diseño de esta estrategia se involucren todas las áreas de la empresa, ya que una cosa tenemos por sentado, es que estas tecnologías cambiarán la forma de hacer las cosas en todos los ámbitos. 

Es más, Recursos Humanos, Finanzas, áreas comerciales y las áreas operativas debieran ser las que lideren el diseño de esta estrategia para que después sea implementada por el área de innovación o tecnología, no al revés.