¿Pueden los modelos de inteligencia artificial de código abierto, descentralizados y rudimentarios competir con modelos propietarios bien financiados como el poderoso GPT-4 de OpenAI? La pregunta frecuente alimentó un animado debate en Twitter después de que un ex investigador de inteligencia artificial de Google eligiera un bando.

Arnaud Benard, cofundador de Galileo AI, lanzó el guante y dijo: “Si crees que los modelos de código abierto superarán a GPT-4 este año, estás equivocado”. Citó el talento y los recursos de OpenAI y la naturaleza sólida de GPT-4 como un producto más allá de un LLM, y afirmó que los proyectos de código abierto podrían tener dificultades para pasar de ser retadores a campeones de la IA.

No es sorprendente que el tuit de Benard provocara reacciones encontradas, que iban desde un apoyo vociferante hasta un feroz desacuerdo.

Ryan Casey, un popular entusiasta de la IA que escribe el boletín “Beyond The Yellow Woods”, ofreció una visión más optimista sobre el potencial de la IA de código abierto, afirmando: “El código abierto igualará o superará [private models] “Este año”, según sus cálculos. “Si hay demanda, habrá innovación”.

Por otro lado, el estratega de IA Jeremi Traguna señaló que “los modelos de OpenAI siguen moviéndose”, y agregó que “los modelos de código abierto tendrán dificultades para mantener la velocidad para alcanzar un objetivo en movimiento en el momento en que el objetivo esté en la posición para ser alcanzado”. “. En otras palabras, si bien los modelos de código abierto podrían estar alcanzando a GPT-3.5 en la era de GPT-4, es posible que haya un GPT-5 cuando tengamos LLM generalistas que sean comparables a GPT-4.5 Turbo.

Jon Howells, analista de tecnología, cree que los recursos no son el único estándar que separa los LLM de código abierto de los de código cerrado.

“Mistral tiene una financiación enorme, un gran equipo y recientemente ha lanzado un modelo de código abierto que supera a GPT-3.5”, escribió. “Ellos o un equipo similar lanzarán un modelo de código abierto de nivel GPT-4 a finales de este año”.

Mistral AI, una startup francesa, obtuvo reconocimiento después de lanzar su Mixtral LLM, que ofrece un rendimiento mejorado con respecto a GPT-3.5 en muchos casos de uso.

En una discusión, el cofundador de Nous Research, “Teknium”, planteó un punto importante, aunque filosófico. “Cada aumento de capacidad en el sistema operativo (código abierto) es algo permanente que nunca se puede quitar del mundo y que se puede utilizar de manera confiable para siempre”, dijo. Básicamente, mientras haya algún avance en la tecnología de inteligencia artificial de código abierto, ninguna empresa puede restringir su acceso.

¿Abierto o cerrado? Un debate interminable

El debate sobre el código abierto versus el código cerrado recuerda las primeras batallas entre sistemas operativos Windows y Linux. Santiago Pino, de ML School, escribió que los modelos patentados de IA pueden conquistar a los consumidores en general como lo hizo Windows, pero que el software de código abierto proporciona personalización y control que pueden ser extremadamente útiles para los usuarios corporativos.

Pino destacó cuántas empresas comienzan a experimentar con ChatGPT pero luego migran a modelos de código abierto, que pueden ajustar y personalizar según sus necesidades específicas y requisitos de cumplimiento de datos. Las soluciones de código abierto evitan la dependencia de los proveedores y brindan transparencia, afirmó.

“Los modelos cerrados y propietarios pueden ganar a los individuos, pero la mayoría de las empresas no quieren enviar sus datos a Microsoft o Google. Quieren control. Los modelos de código abierto son la respuesta”, dijo en un tweet días antes de que el hilo de Bernard se volviera viral.

Este tipo de visión fue compartida en el debate sobre el tweet de Bernard por Sciumo Inc., una empresa de desarrollo de software, que enfatizó el potencial de nicho de los modelos de código abierto: “(Los modelos de código abierto) competirán donde importa: problemas específicos de dominio con datos de dominio específicos y experiencia que (OpenAI) no tiene”.

Furkan Gözükara, un ingeniero informático conocido por sus cursos SECourses en su canal de YouTube, también se encuentra entre los que tienen una postura más matizada. Hablando a Descifrarestuvo de acuerdo con Bernard y dijo que “solo en tareas específicas los LLM de código abierto aprobarán OpenAI”.

Gözükara da el ejemplo de una empresa que “capacita a LLM en (sus) propios documentos”. Sí, OpenAI tiene la capacidad de personalizar los GPT en función de instrucciones y documentos específicos, pero el manejo de datos confidenciales para terceros siempre es una preocupación. Esa preocupación se confirmó recientemente cuando se reveló que los GPT personalizados revelaban datos confidenciales a usuarios externos.

Yan Lecun, jefe de desarrollo de IA de Meta y feroz defensor del código abierto, ha declarado en repetidas ocasiones que “los modelos básicos de IA de código abierto acabarán con los modelos de IA cerrados y propietarios”. Google, otro gigante de la IA, también reconoce la amenaza que plantean los sistemas abiertos. -AI de fuente: “Los modelos de código abierto son más rápidos, más personalizables, más privados y libra por libra más capaces”, decía un memorando de Google filtrado en 2023.

Queda por ver si los modelos de código abierto igualarán o superarán a GPT-4 y futuras iteraciones este año. Sin embargo, las perspectivas de los expertos de ambos lados revelan una tensión intrigante. Los modelos de código cerrado pueden tener una ventaja en recursos y una rápida iteración, pero las herramientas de código abierto están evolucionando rápidamente y ofrecen capacidades permanentes y personalización. Por ahora, la comunidad de IA puede observar cómo se desarrolla la competencia y disfrutar de los beneficios de utilizar la mejor tecnología disponible.

Editado por Ryan Ozawa.

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada.





Fuente Traducida decrypt.co