ChatGPT de OpenAI se ha convertido en un nombre familiar cuando se trata de herramientas de inteligencia artificial, pero Google no se queda al margen. Con su nueva y brillante marca Gemini y su servicio Gemini Advanced, Google ha desatado un poderoso contendiente para el buque insignia de OpenAI.
Google afirma que Gemini Advanced (una evolución de su anterior chatbot Bard) supera a GPT-4, pero ¿lo hace? Si solo le sobran 20 dólares al mes, ¿qué herramienta de IA multimodal de pago debería utilizar?
Dejemos esto de lado: aquí no hay un “mejor” claro. Lo que distingue a estos chatbots no es necesariamente cuál es objetivamente “más inteligente”, sino qué características, capacidades de nicho e integraciones externas se alinean mejor con sus herramientas y flujo de trabajo existentes.
Si una de estas poderosas herramientas vale sus $ 20 al mes depende completamente de las herramientas que ya usa y de las tareas con las que necesita ayuda, y estamos aquí para ayudarlo a decidir con los detalles esenciales.
Generación de imágenes: realismo versus flexibilidad
Tanto Gemini como ChatGPT Plus pueden transformar tus palabras en representaciones visuales. A diferencia de Stable Diffusion y otros generadores de imágenes, estos dos entienden las indicaciones del lenguaje natural. El enfoque actual de Gemini es lograr realismo, pero no llega al modelo ImageFX separado de Google, que, incluso en versión beta, nos dejó boquiabiertos y eventualmente podría implementarse en Gemini Advanced. Pero esos dos sólo pueden generar imágenes cuadradas de 1024×1024.
Dall-E 3 de OpenAI renuncia al realismo por una mayor flexibilidad. Puede especificar las dimensiones de la imagen (cuadrada, vertical, 16:9, etc.), una gran ayuda si necesita imágenes adaptadas a sitios web o diseños específicos y desea omitir el recorte manual. Pero tiene un estilo de dibujos animados característico que hace que las imágenes de Dall-E sean fáciles de detectar a kilómetros de distancia.
Elegir uno u otro depende de tus objetivos. Anhelar fotografías de productos casi perfectas para una tienda en línea aún puede requerir herramientas especializadas como las que ofrecen Adobe o Corel. Pero para ilustraciones caprichosas o imágenes divertidas de lluvia de ideas, cualquiera de estos contendientes podría ser suficiente, dejando espacio para sus preferencias personales de estilo.
Comodidad de voz: en casa o en movimiento
A veces, desea escuchar las respuestas de su IA, ya sea para permitirle realizar múltiples tareas o simplemente para darle un descanso de mirar una pantalla. Gracias a su conexión con el ecosistema de Google, Gemini ofrece una función de lectura en voz alta sin interrupciones. Sin embargo, ChatGPT Plus tiene su propia ventaja: una aplicación móvil nativa que permite mantener conversaciones prácticamente en cualquier lugar. En términos generales, la voz de OpenAI parece más humana, pero sólo está disponible a través de un teléfono inteligente.
La elección se reduce a cómo trabajas. Si su uso de la IA se realiza principalmente en un escritorio donde la integración con otras herramientas de Google es útil, Gemini gana. Pero para aquellos que están en constante movimiento, tener esos chats narrados mientras mantienen el teléfono en el bolsillo puede inclinarlos hacia ChatGPT Plus. Esto puede parecer importante para las personas con discapacidad visual, pero muchos prefieren otros métodos de texto a voz (TTS) que reproducen contenido a velocidades extremadamente altas porque consideran que la cadencia de una “voz natural” es demasiado lenta. En esos casos, ambos sitios son compatibles con TTS, por lo que es un lavado.
Necesidad de la velocidad
Echemos un vistazo debajo del capó, por así decirlo. Si bien su “poder cerebral” (contexto simbólico) parece comparable, hay una gran diferencia en la velocidad: Gemini Ultra es extremadamente rápido en comparación con GPT-4 (o Claude AI de Anthropic). Con Gemini Ultra obtienes resultados de calidad GPT-4 con velocidades GPT-3.5.
Por ejemplo: Descifrar utilizó el mensaje “Tómese su tiempo y escriba un ensayo sobre por qué las criptomonedas pueden desempeñar un papel importante en la configuración del futuro de las transacciones económicas”. Gemini Advanced tardó 12,14 segundos en escribir el ensayo completo, mientras que GPT-4 tardó casi un minuto (53,13 segundos, para ser exactos). La versión anterior del chatbot de OpenAI, GPT-3.5 Turbo, tardó el 11.06 en escribir su ensayo.
Asuntos de privacidad
Una de las mayores preocupaciones generales sobre la IA es la privacidad: dónde se transmiten, guardan y acceden a las indicaciones y otra información que usted proporciona. ChatGPT mantiene sus chats durante 30 días y los utiliza para mejorar sus respuestas, pero las personas preocupadas por la privacidad pueden ser cautelosas. Google, por otro lado, almacena el tuyo durante 18 meses.
Ambos servicios plantean diferentes preocupaciones sobre la privacidad, por lo que esta elección depende tanto de sus sentimientos sobre los datos como de las funciones. Afortunadamente, ambos también tienen una opción para eliminar chats y una opción para compartirlos.
La victoria de nicho de ChatGPT: análisis de PDF
Si vive y respira archivos PDF, este concurso es claro: ChatGPT Plus puede profundizar en esos documentos para extraer información, responder sus preguntas sobre el documento y, en general, ahorrarle tiempo. Google, probablemente por motivos legales o técnicos, no ha integrado este tipo de funciones en Gemini. Esto podría no ser un problema si sus archivos PDF son fragmentos cortos de texto que puede simplemente copiar y pegar. Pero para aquellos que hacen malabarismos con el papeleo, las tablas o los estudios de investigación de los clientes, podría ser un factor decisivo.
Esto no es necesariamente un revés permanente para Gemini, pero por ahora, aquellos que trabajan mucho con archivos PDF tienen una razón de peso para optar por las capacidades mejoradas de ChatGPT. Además, Claude AI puede analizar archivos PDF de forma gratuita y su modelo es casi tan bueno y preciso como el GPT-4.
Guerras de búsqueda
Si la calidad de los resultados de búsqueda integrados en sus sesiones de chatbot es importante, el enlace nativo de Gemini a Google gana sin lugar a dudas.
Gemini Advanced permite a los usuarios obtener respuestas en tiempo real, y el modelo obtiene datos de la Búsqueda de Google sobre la marcha. Otra característica extremadamente útil es que Gemini Advanced tiene un botón que permite a las personas usar la Búsqueda de Google para verificar todos los datos en una interacción. Esto minimiza el impacto de las alucinaciones ocasionales y ayuda con la búsqueda de fuentes y la verificación de hechos.
ChatGPT se apoya en Bing, que, aunque mejora, no puede competir con el dominio de Google.
Es importante tener en cuenta que cada respuesta proporcionada por un chatbot tiende a incluir alucinaciones. Esa es la naturaleza de la IA generativa. Si un modelo no puede alucinar, reproducirá información ya existente por defecto. La verificación de hechos es extremadamente importante cuando se interactúa con modelos de IA.
Qué tiene ChatGPT Plus que Gemini Advanced no tiene
Integraciones de ecosistema abierto y de terceros: ChatGPT Plus se distingue por su integración con aplicaciones de terceros, tanto complementos como GPT generados por el usuario. Esto crea infinitas posibilidades para que los usuarios agreguen complementos que interactúen directamente con su asistente de inteligencia artificial, optimizando los flujos de trabajo y desbloqueando funcionalidades especializadas. Cambiar a Google Gemini te parecerá una degradación si estás acostumbrado a trabajar con Canva o Zapier e integrarlos con ChatGPT en tu flujo de trabajo.
Conversaciones personalizadas (y rentables): La tienda GPT tiene como objetivo recompensar a los creadores, prometiendo innovación y crecimiento continuos dentro del ecosistema ChatGPT. Si quieres ganar dinero creando chatbots personalizados o quieres probar conversaciones específicamente personalizadas con GPT que aseguren que tu chatbot sepa más sobre un tema específico, adopte un estilo específico y pueda ser más personalizado que cualquier otra opción… entonces no busques en ningún lado. más y pague por ChatGPT Plus.
Ediciones a mitad de una conversación para mayor eficiencia: Con ChatGPT Plus, puedes ajustar un mensaje anterior incluso dentro de una conversación de varias partes. Por ejemplo, imagine una interacción de seis disparos con seis comandos y seis respuestas. En ChatGPT, el usuario puede editar el cuarto comando y ChatGPT generará una nueva respuesta considerando solo todo el contexto anterior a esa interacción. Esto ahorra mucho esfuerzo y hace que la sesión sea más eficiente. Con Google, los usuarios necesitarían iniciar una nueva sesión si se dieran cuenta de que cometieron un error en un comando anterior.
Esta función de ChatGPT Plus ahorra valiosos tokens y evita reiniciar sesiones enteras, optimizando la interacción y manteniendo su flujo creativo.
Qué gas Gemini Advanced no tiene ChatGPT Plus
Almacenamiento en la nube incluido y extras: La suscripción a Google One de 2 TB incluida es un ahorro sustancial para quienes ya están dentro del ecosistema de Google. Planes similares cuestan alrededor de $10 mensuales en iCloud y $12 en Dropbox. Para estos usuarios, cambiar a Gemini Advanced reduce efectivamente los costos, ya que sería solo $10 adicionales en promedio para un chatbot de IA de primer nivel en lugar de los $20 que los usuarios pagarían si usaran ChatGPT Plus junto con un servicio en la nube.
Desarrollado por Google para mayor precisión: Gemini Advanced verifica sus respuestas con el vasto conocimiento de la Búsqueda de Google en tiempo real. Esto significa información precisa y actualizada al alcance de su mano, respaldada por la confiabilidad y relevancia de Google. ChatGPT con Bing no es tan preciso.
Borradores instantáneos y refinamiento de estilo: Gemini Advanced te permite personalizar estilos de respuesta (formal, informal, elaborado) con solo hacer clic en un botón. ¡No se necesitan indicaciones adicionales! Para refinar su trabajo, Gemini también ofrece múltiples borradores con diferentes frases o enfoques, lo que le permite comparar y mejorar rápidamente sus resultados.
Google Apps como su patio de juegos de IA: puede sumergirse en Google Docs, planificar viajes, jugar con YouTube, editar contenido y colaborar con la ayuda de la integración directa de Gemini Advanced. Además, esas nuevas y poderosas herramientas de edición de fotografías que obtienes en Google Photos (Magic Eraser para eliminar objetos usando IA, camuflaje, herramientas de iluminación, mejoras HDR y más) se vuelven aún más poderosas cuando tu IA puede ayudar a modificar los parámetros de la imagen.
Un veredicto… una especie de
Si ya paga por ChatGPT Plus y utiliza sus funciones con frecuencia, es posible que Gemini no aporte suficiente novedad a su caso de uso para justificar otros $20 mensuales. Del mismo modo, si sus necesidades son bastante modestas (ayuda con la redacción, lluvia de ideas creativa), cualquiera de estos servicios sería adecuado.
Pero si desea comenzar a pagar por cualquiera de los dos, esos extras serán el factor decisivo. 2 TB de almacenamiento en la nube, precisión de búsqueda, la suite de Google: ¿te inclinan firmemente en una dirección o la promesa de la integración de aplicaciones de terceros de OpenAI te deja con ganas de experimentar? La elección realmente recae en usted porque cuando se trata de IA, “depende” sigue siendo la respuesta honesta.
Editado por Ryan Ozawa.