Hace unos días supimos que Google estaba integrando resúmenes de vídeo en NotebookLM y ahora la compañía ha mejorado esa función con los vídeos cinematográficos.
La empresa ha integrado Gemini 3, Nano Banana Pro y Veo 3 para poder crear narrativas estructuradas, animaciones fluidas y elementos visuales detallados, siempre adaptados al material subido.
Esto cambia la manera en que los usuarios interactúan con sus propios documentos, permitiendo que la información estática cobre vida a través de representaciones visuales complejas.
Hasta hace poco, NotebookLM era conocido principalmente por su capacidad para generar resúmenes de audio sumamente realistas, donde dos voces sintéticas discutían el contenido de los archivos cargados por el usuario.
Sin embargo, la exigencia de formatos más dinámicos ha llevado al equipo de desarrollo a implementar una solución que no solo se escucha, sino que también se ve.
Estas nuevas presentaciones de vídeo no son meras sucesiones de diapositivas estáticas con una voz de fondo; se trata de una composición orquestada que utiliza modelos de última generación para crear una narrativa visual coherente y estéticamente cuidada.
El núcleo de esta mejora técnica reside en la combinación de varios modelos de inteligencia artificial que trabajan en sintonía.
El principal director de esta orquesta es Gemini 3, la versión más reciente y sofisticada del modelo de lenguaje de Google. Gemini 3 no se limita a procesar texto, sino que actúa como un arquitecto narrativo que analiza las fuentes proporcionadas por el usuario, identifica los puntos clave y diseña una estructura de guion que servirá de base para el contenido multimedia.
Este modelo es capaz de entender el contexto profundo de los documentos, extrayendo matices que antes podrían haber pasado desapercibidos en un resumen convencional.
Junto a Gemini 3, encontramos la intervención de Veo 3, el modelo especializado en la generación de vídeo de alta calidad.
Mientras que el primero se encarga de la lógica y la estructura, el segundo asume la responsabilidad de la creación visual. Veo 3 permite generar animaciones fluidas y entornos visuales que se adaptan al tono del contenido analizado.

Nueva opción de vídeo en Notebook LM
El Androide Libre
Si el usuario sube un informe técnico sobre ingeniería, el sistema puede optar por una estética más sobria y esquemática; si se trata de un relato creativo o un estudio histórico, la visualización puede adoptar un estilo más artístico y envolvente.
Se integran otros componentes técnicos como Nano Banana Pro, que optimizan el rendimiento del sistema para que la generación de estos contenidos sea eficiente y accesible desde diversos dispositivos.
La coordinación entre estos modelos garantiza que el vídeo resultante mantenga una consistencia interna absoluta, evitando las distorsiones visuales que suelen plagar a las herramientas de generación de imágenes por inteligencia artificial menos avanzadas.
Por el momento, el despliegue de estas funcionalidades está siguiendo una estrategia gradual.
Google ha confirmado que las Visiones Cinematográficas en Vídeo están disponibles inicialmente para los suscriptores de Google AI Ultra.
Este nivel de suscripción garantiza el acceso a la mayor potencia de cómputo necesaria para procesar las peticiones de vídeo en la nube.
Además, el servicio se ha lanzado en inglés, aunque se espera que la expansión a otros idiomas, incluido el español, se produzca en los próximos meses a medida que los modelos se ajusten a las particularidades lingüísticas y culturales de cada región.
Por último, el acceso está restringido a usuarios mayores de 18 años, una medida común en el lanzamiento de herramientas de generación de contenido multimedia para asegurar un uso responsable de la tecnología.
