Gemini Omni llegó para cambiar todo lo que sabías sobre la IA de Google

Una imagen de un estudio de producción audiovisual con una aplicación de IA en el centro, rodeada de texto, imágenes, audio y clips de video.

Google I/O 2026: El gigante tecnológico presentó uno de los lanzamientos más ambiciosos de su historia reciente, un ecosistema de inteligencia artificial que cambiará la forma en que interactuamos con la IA.

En medio de una cascada de anuncios, hubo uno que se robó toda la atención: Gemini Omni, el nuevo modelo que promete redefinir por completo cómo los usuarios interactúan con la IA de Google.

Y no es exageración. Esto es algo genuinamente diferente.

Lo que hace a Gemini Omni distinto a todo lo anterior

Los modelos generativos de video, como el propio Veo de Google, funcionaban con lógica de "entrada de texto, salida de video". Pero Gemini Omni es lo que Google llama un modelo "nativamente multimodal", puede recibir texto, imágenes, audio y clips de video simultáneamente para generar contenido mucho más rico y preciso.

Además, el modelo llega integrado con todo el conocimiento y el razonamiento de Gemini, lo que significa que no solo "genera imágenes bonitas". Entiende el contexto, razona sobre él y luego produce el contenido.

Y la cerecita del pastel es que Google confirmó que Gemini Omni reemplazará a Veodentro de la aplicación de Gemini.

Crear, editar y clonarte: las tres superpotencias de Gemini Omni

Una vez que te sumerges en lo que Gemini Omni puede hacer, el modelo se revela como una especie de estudio de producción audiovisual metido dentro de una app.

Lo primero es la generación de video multimodal. Puedes combinar instrucciones escritas, fotografías de referencia, música y clips previos para construir escenas completas desde cero.

Lo segundo es la edición avanzada de videos existentes, que es quizás el caso de uso más disruptivo. Gemini Omni no solo crea contenido nuevo; también puede tomar una grabación que hiciste con tu celular y modificarla en profundidad.

Lo tercero es la función Avatar, que es donde el modelo se pone verdaderamente futurista. Con solo un prompt de texto, Gemini Omni puede generar videos usando la voz, apariencia y estilo del usuario sin que este tenga que grabarse frente a ninguna cámara.

Disponibilidad de Google Gemini Omni

El acceso inicial no es universal, pero Google ya activó Gemini Omni Flash —el primer modelo de la familia Omni— en la aplicación de Gemini, en Google Flow y en YouTube Shorts.

Sin embargo, Google tiene claro que necesita llevar esto a la mayor cantidad de personas posible, así que algunas funciones de Omni, especialmente las relacionadas con la creación de Shorts, llegarán de forma gratuita a YouTube en los próximos meses.

Lo que hay que tener presente es que Gemini Omni apenas empieza. Por ahora el foco está puesto en la generación y edición de video, pero Google adelantó que más adelante el modelo también podrá crear imágenes y audio con la misma lógica multimodal.

Referencia de contenido: consultar fuente original aquí
Etiquetado:

Deje un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *