
Google dio un paso clave en la evolución de su Inteligencia Artificial y puso a disposición del público una nueva función de Gemini que promete cambiar la forma en que interactuamos con los contenidos audiovisuales. Esta mejora representa un avance notable en accesibilidad, practicidad y comprensión visual.
A partir de ahora, los usuarios pueden enviar videos a la IA y recibir explicaciones detalladas sobre lo que sucede en pantalla, sin necesidad de ver el material completo. Y lo mejor: está disponible sin costo, tanto en la versión web de Gemini como en sus aplicaciones para celulares Android y dispositivos iPhone.
El funcionamiento es intuitivo. Al iniciar una conversación con Gemini, el usuario debe tocar el ícono de “+” que aparece en la parte inferior del chat, elegir si desea cargar el archivo desde la galería de imágenes o desde una carpeta del dispositivo, y luego seleccionar el video.
Una vez cargado, se escribe la consulta relacionada con el contenido del video. No hace falta usar comandos técnicos ni frases estructuradas: Gemini entiende preguntas naturales, como “¿Qué hace la persona del video?”, “¿Qué objetos se ven?”, o “¿De qué se está hablando?”.
Cabe mencionar que, si bien los archivos muy largos pueden tardar un poco más en procesarse, la herramienta mantiene un buen nivel de fluidez y ofrece respuestas claras, incluso cuando el contenido tiene varios elementos en simultáneo.
Esta nueva herramienta puede ser útil en distintas situaciones del día a día. Si alguien graba una clase, un taller o una capacitación, pero no puede prestar atención en el momento, puede enviarle ese video a Gemini para pedirle un resumen con los temas principales o incluso consultar si hay partes relevantes que se haya perdido.
También puede ser de gran ayuda en el ámbito educativo. Un estudiante que no entiende una explicación en video puede pedirle a Gemini que le aclare conceptos complejos, que le resuma los puntos clave o que le traduzca alguna parte que esté en otro idioma. Es una forma rápida y eficaz de resolver dudas sin necesidad de detenerse a mirar todo el contenido completo.
En el plano doméstico, el uso también tiene muchas aplicaciones. Si un electrodoméstico comienza a fallar y la persona graba el funcionamiento para mostrarlo a un técnico, puede usar Gemini como una primera consulta: preguntar si nota algún comportamiento anómalo o si puede identificar el problema.
Además, la herramienta también puede cumplir un rol clave en accesibilidad, especialmente para personas con discapacidad visual. Si reciben un video cuyo contenido no pueden ver, pueden consultarle a Gemini para que les describa lo que aparece y así acceder a la información visual.