Gemini Omni: el nuevo modelo de IA de Google para revolucionar la creación de video

Modelo Omni de Google generando un video hiperrealista a partir de texto e imágenes

Revolución en IA: Google prepara Omni, un modelo que superaría a Veo en generación de video.

Medios como 9to5Google reportan que un usuario de Reddit, identificado como «Zacatac_391», descubrió una notificación push en la app de Gemini que lo invitaba a probar el nuevo motor de video. El hallazgo sugiere que la compañía está a punto de lanzar una actualización clave para sus herramientas multimedia.

videos verticales Veo 3.1 Google

Veo 3.1 ya permite convertir fotos en videos verticales, con mejoras en coherencia de identidad y resoluciones de 1080 píxeles a 4K.

Las capturas compartidas por el usuario revelan que Omni permitiría remezclar clips existentes, editar mediante indicaciones de texto y crear proyectos desde cero con plantillas. Además, el sistema integraría capacidades para generar videos hiperrealistas con audio a partir de texto o imágenes fijas.

El modelo promete avances en áreas críticas donde otros fallan: ajustes de iluminación, reflejos, continuidad entre escenas y texto legible en el video. Zacatac_391 habría probado Omni con dos ejercicios prácticos.

En el primero, el usuario solicitó un video de un profesor escribiendo una expresión matemática de identidades trigonométricas en una pizarra, explicando cada paso. El resultado, según los reportes, cumplió con precisión las instrucciones.

El segundo ejemplo fue más ambicioso: «crea una escena con dos hombres sentados a una mesa en la terraza de un restaurante elegante junto al mar. Están en una mesa redonda con un bonito mantel blanco y todos los accesorios elegantes: cubiertos, servilletas de lujo y un centro de mesa. Uno de ellos es un hombre distinguido: un afroamericano maduro de unos 50 años, con barba corta y porte seguro, vestido con un traje sofisticado y a medida. El otro es su amigo. Ambos se acercan a la mesa para comer un plato de espagueti. Al principio, intercambian breves saludos y comienzan a comer espagueti con tranquilidad, conversando entre bocado y bocado».

El debate ético en la industria del entretenimiento

Las capacidades de Omni han generado asombro en redes sociales, pero también han reavivado la polémica sobre el uso de IA en el cine y el streaming. Empresas como Disney y Netflix ya emplean estas tecnologías para optimizar procesos internos, personalizar recomendaciones y reforzar estrategias de marketing.

Sin embargo, actores, guionistas y otros profesionales denuncian que estas herramientas amenazan sus ingresos y reducen la demanda de trabajo creativo humano. La tensión ha escalado a los tribunales: en junio de 2025, Disney y Universal Pictures demandaron a Midjourney, acusándola de ser un «pozo sin fondo de plagio» capaz de producir «copias infinitas» de obras protegidas. Warner Bros. Discovery se sumó recientemente con una denuncia similar.

El entrenamiento de los modelos y la polémica por los datos

Google, al igual que otras empresas con sistemas como Veo, no ha detallado cómo entrena sus modelos de generación de video. Un informe de CNBC reveló que la compañía ha utilizado la extensa biblioteca de YouTube, que supera los 20,000 millones de materiales, para mejorar sus herramientas de IA, incluyendo Gemini y Veo 3.

La empresa asegura que solo emplea «una parte» del contenido y que respeta acuerdos con creadores para proteger la propiedad intelectual. «Siempre hemos utilizado contenido de YouTube para mejorar nuestros productos, y eso no ha cambiado con la IA. También reconocemos la necesidad de establecer salvaguardas, por lo que hemos invertido en protecciones que permitan a los creadores mantener el control sobre su imagen y semejanza en esta nueva era», declaró un vocero.

No obstante, varios creadores afirman no haber sido informados sobre estas prácticas ni sobre los convenios mencionados. ¿Logrará Google equilibrar innovación y transparencia en la era de la IA generativa?

El precedente legal que podría frenar (o acelerar) a Gemini Omni

Mientras Google avanza con Omni, el modelo choca con un escenario legal en ebullición. Las demandas de Disney, Universal y Warner Bros. contra herramientas como Midjourney no son casos aislados: marcan una tendencia donde los estudios buscan sentar jurisprudencia sobre el uso de obras protegidas en el entrenamiento de IA. En 2023, un fallo en EE.UU. determinó que el *scraping* masivo de imágenes para entrenar modelos generativos podía violar derechos de autor si no se demostraba *fair use*. Omni, al depender de datos de YouTube, hereda este riesgo.

El conflicto trasciende lo judicial. Analistas del sector señalan que, si los tribunales fallan a favor de los demandantes, empresas como Google podrían verse obligadas a negociar licencias masivas con creadores, encareciendo el desarrollo de sus modelos. En el extremo opuesto, una victoria para las plataformas de IA consolidaría el actual *statu quo*, donde el entrenamiento con contenido público —aunque no siempre autorizado— sigue siendo la norma.

¿Hacia un modelo de suscripción para creadores?

La presión legal podría impulsar a Google a adoptar un sistema de compensación directa. Ya hay precedentes: en 2024, Adobe lanzó un fondo de 100 millones de dólares para remunerar a artistas cuyos trabajos se usaran en Firefly. Omni, al integrarse en Gemini, podría seguir este camino, pero con un desafío adicional: escalar el pago a millones de creadores de YouTube sin ahuyentar a los usuarios finales.

Referencia de contenido: consultar fuente original aquí
Etiquetado: