Google lanzó este miércoles su nuevo modelo de inteligencia artificial (IA) llamado Gemini, al cual se podrá acceder desde la plataforma Bard o en teléfonos celulares, que puede comprender imágenes, audio y video por parte de los usuarios, a la vez que se trata “del primer modelo que supera a los expertos humanos en comprensión masiva de lenguajes multitarea”, aseguraron desde la multinacional.
En medio de la carrera tecnológica, el nuevo modelo de lenguaje Google promete ser la IA más avanzada hasta la fecha en su competencia con el conocido ChatGPT, de la empresa Open IA, ya puede utilizarse en tres tamaños, donde se espera que para principios del 2024 se publique la versión más compleja de este programa.
“Creemos en hacer que la IA sea útil para todos. Es por eso que lanzamos Gemini, nuestro modelo más capaz inspirado en la forma en que las personas entienden e interactúan con el mundo”, sostuvo Google en su cuenta de la red social X y destacaron que la plataforma multimodal puede procesar y generar texto, código, imágenes, audio y vídeo desde distintas fuentes de datos.
Según Google, el desempeño de Gemini Ultra supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje.
A partir de este miércoles, la versión Gemini Pro está disponible para los usuarios mientras que el año que viene se presentará Bard Advanced con Gemini Ultra para tareas aún más complejas.
“Cada cambio tecnológico es una oportunidad para avanzar en los descubrimientos científicos, acelerar el progreso humano y mejorar vidas. Creo que la transición que estamos viendo ahora con la IA será la más profunda de nuestras vidas, mucho mayor que el paso anterior a los dispositivos móviles o a la Web”, aseguró el director ejecutivo de Google y Alphabet, Sundar Pichai, en la web de la plataforma.
“La IA tiene el potencial de crear oportunidades (desde las cotidianas hasta las extraordinarias) para personas de todo el mundo. Traerá nuevas olas de innovación y progreso económico e impulsará el conocimiento, el aprendizaje, la creatividad y la productividad a una escala nunca antes vista”, agregó.
Pichai aseguró que ya hay millones de personas utilizando los programas de IA “para hacer cosas que no podían ni siquiera imaginar hace un año” y destacó que “apenas estamos comenzando a arañar la superficie de lo que es posible”.
“Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva de lenguajes multitarea, que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética junto conocimientos y habilidades para la resolución de problemas”, aseguraron desde la compañía.
Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, afirmó que “siempre creí que si pudiéramos construir máquinas más inteligentes, podríamos aprovecharlas para beneficiar a la humanidad de maneras increíble”.
“Durante mucho tiempo, hemos querido construir una nueva generación de modelos de IA, inspirados en la forma en que las personas entienden el mundo e interactúan con él. Buscamos que la IA que se sienta menos como un software inteligente y más como algo útil e intuitivo: un ayudante o asistente experto”, indicó y sostuvo que “hoy estamos un paso más cerca de esta visión al presentar Gemini, el modelo más capaz y general que jamás hayamos construido”.