OpenAI Sora y el futuro del Diseño Multimedia
Espíritu creador
abr 01, 2024
Por Universidad Anáhuac Querétaro
Tiempo de lectura 5 minutos
Como buen Gen Z, seguramente ya has utilizado alguna vez ChatGPT y descubierto todas las funciones que, de forma moderada, puedes aprovechar con su uso, como resumir información compleja y hasta obtener recomendaciones de entretenimiento. Pues resulta que OpenAI, el mismo grupo responsable de crear ChatGPT ha vuelto con otro producto innovador: Sora, el nuevo productor de inteligencia artificial de diseño multimedia.
Hoy queremos arrojar un poco de luz sobre Sora y las funcionalidades que tiene para el campo del diseño multimedia, sobre todo en una era en la que la comunicación visual es más vital que nunca.
Además, exploraremos el papel de la formación universitaria en la adquisición de las competencias para utilizar la IA y, sobre todo, la delantera que el programa de la Licenciatura en Diseño Multimedia de la Universidad Anáhuac Querétaro se está llevando a nivel nacional. En fin, veremos un poco todo, ¿listo? Comencemos.
La revolución creativa de Sora en el Diseño Multimedia
En medio del boom de la inteligencia artificial en el que vivimos, muchos siguen teniendo reservas sobre hasta qué punto deberíamos de aprovechar este tipo de tecnología, si es que deberíamos usarla para empezar. Sin embargo, es conveniente entender las aplicaciones que tiene para el desarrollo de soluciones de diseño. ¿Quién sabe? Tal vez terminemos por aprender algo fascinante
¿En qué consiste OpenAI Sora?
Primeramente, Sora es un modelo de difusión, lo que significa que elimina “el ruido” de las imágenes para, eventualmente, generar imágenes naturales. A través de instrucciones que el usuario le proporciona, este modelo de tipo “text-to-video” es capaz de crear videos de hasta un minuto de longitud, y mantener ciertos estándares de calidad y coherencia con dichas instrucciones.
Así, Sora se suma a otros modelos de generación multimedia, como DALL-E 3, StageDiffusion y Midjourney, que han roto paradigmas en cuanto a lo que un diseñador multimedia puede y debe hacer. Las innovaciones en el modelo de aprendizaje automático han permitido que Sora demuestre ciertas mejoras respecto a otros modelos, como:
- Consistencia temporal y de movimiento: Sora considera varias tomas de video al mismo tiempo, lo que permite que los objetos se mantengan consistentes aún cuando desaparecen de cuadro.
- Combina funciones de modelos de difusión y de transformer: esto posibilita crear “piezas” de contenido, organizadas de forma adecuada, para la generación de videos. Ambas cualidades ayudan a ahorrarnos ciertos pasos y resolver problemas de computación de modelos anteriores.
- Videos con mayor fidelidad: Sora también utiliza una técnica para reformular el prompt o las instrucciones proporcionadas por el usuario, para volverlas tan precisas como sea posible, y así optimizar la generación de imágenes.
Aplicaciones (y limitaciones) de Sora
En general, utilizar Sora está siendo de mucha utilidad para quienes quieren crear contenido multimedia, específicamente videos, desde cero, o incluso enriquecer y optimizar videos ya existentes.
Redes sociales
El destino por excelencia de Sora son las redes sociales, sobre todo Instagram y TikTok, donde la duración de los videos no suele exceder un minuto, y coincide con la longitud máxima que Sora permite hasta ahora.
Marketing y publicidad
En este ámbito, la creación y producción de videos puede llegar a ser muy costosa, por lo que Sora se perfila como una opción realmente atractiva para reducir la inversión de tiempo y dinero. La generación de imágenes difíciles de recrear por estos motivos, como tomas aéreas o en localizaciones aisladas, es especialmente valiosa.
Prototipado y visualización de conceptos
En industrias como el diseño industrial, la arquitectura o simplemente en toda aquella que requieras presentar un concepto difícil de replicar de buenas a primeras, Sora podría ser tu aliada. Puedes crear mockups con relativa destreza y aunque, al final, el producto no tenga tanto que ver con las imágenes creadas por Sora, sí que puede impulsar una presentación de prototipo inicial.
Limitaciones actuales de Sora
Por ahora, OpenAI advierte sobre el estado temprano de Sora y varias áreas de oportunidad que deberían mejorarse con el tiempo. Algunas de ellas tienen que ver con la fiabilidad dudosa con que este modelo interpreta ciertas reglas del “mundo real”, como la ley de causa-efecto o incluso, la ley de exclusión de Pauli, que dicta que dos objetos no pueden estar al mismo tiempo en un mismo lugar.
Esto último es bastante común en la generación de imágenes y se conoce coloquialmente como “alucinación de IA”, pues da como resultado imágenes que no se apegan a los principios de la naturaleza, ni son coherentes con la realidad.
Implicaciones éticas y de seguridad en la era de la IA
La dificultad con que el modelo propuesto por Sora aún no logra crear imágenes 100% libres de inconsistencias deriva en problemas serios que ya han sido llevados al terreno del debate ético, de seguridad y privacidad tecnológica.
En particular, los detractores de la IA condenan el uso que se le puede dar para crear desinformación, ya sea intencional o no intencionalmente. En la era de exceso de información en la que vivimos, la verificación de datos es cada vez más difícil e impráctica, por lo que muchos se aprovechan de la capacidad de la herramienta para crear imágenes relativamente convincentes para su propio beneficio.
El problema es todavía mayor cuando llega a alterar la percepción de las personas sobre, por ejemplo, una figura pública, como un presidente o un evento histórico. Es ahí donde la manipulación de la información puede también persuadir a las personas y su toma de decisiones. No por nada Eske Montoya Martínez, directora de gobernanza y ética de la IA en DigiDiplomacy, advirtió que “la IA ya está modificando estrategias de campaña, la participación de los votantes y el propio tejido de la integridad electoral”.
El valor irreemplazable del experto en Diseño Multimedia
Por muy incierto que parezca el futuro, de una cosa sí estamos seguros: que las capacidades humanas para la innovación, la creatividad y la imaginación no tienen límites. Es por esto que en la Universidad Anáhuac Querétaro creemos firmemente en el potencial de los estudiantes de la Licenciatura en Diseño Multimedia para volverse expertos en la producción de diversos medios que destaquen por su estética, funcionalidad y legibilidad.
Gracias a una formación que combina la teoría del arte y el diseño, con la práctica extensiva en diversos medios, los diseñadores se desenvuelven sin problema en los siguientes rubros:
- Las ilustraciones análogas y digitales
- Motion graphics
- Animación 2D y 3D
- Aplicaciones móviles
- Interfaces de usuario y sitios web
- Realidad virtual y realidad aumentada
- Producción audiovisual
Además, y esto es vital, a diferencia de Sora (o de cualquier otra herramienta de IA), los diseñadores multimedia poseen la capacidad crítica de entender su realidad y tomar decisiones relevantes, que además de útiles provoquen un verdadero impacto en su audiencia. Como ves, el diseño es mucho más que combinar imágenes de forma más o menos atractiva: es utilizar tanto tu talento y pasión para crear algo nuevo y bello.
Ya lo sabes: en la Anáhuac Querétaro creemos en ti por quien eres y lo que aportas al mundo. ¡Imagínate lo que podrás lograr al unirte a nuestra comunidad universitaria y convertirte en un León! La oportunidad está aquí y hoy tú también puedes diseñar el futuro que tanto anhelas.
Para descubrir más sobre nuestro programa en Diseño Multimedia, contáctanos y estaremos listos para resolver todas tus dudas.