El desarrollador de robótica Figure causó sensación el miércoles cuando compartió una demostración en video de su primer robot humanoide en una conversación en tiempo real, gracias a la IA generativa de OpenAI.
“Con OpenAI, la Figura 01 ahora puede tener conversaciones completas con las personas”, Figura dicho en Twitter, destacando su capacidad para comprender y reaccionar ante las interacciones humanas al instante.
La compañía explicó que su reciente alianza con OpenAI aporta inteligencia visual y lingüística de alto nivel a sus robots, lo que permite “acciones robóticas rápidas, de bajo nivel y diestras”.
En el video, la Figura 01 interactúa con el ingeniero senior de inteligencia artificial de su creador, Corey Lynch, quien somete al robot a varias tareas en una cocina improvisada, incluida la identificación de una manzana, platos y tazas.
La Figura 01 identificó la manzana como alimento cuando Lynch le pidió al robot que le diera algo de comer. Luego, Lynch hizo que la Figura 01 recogiera basura en una canasta y le hiciera preguntas simultáneamente, mostrando las capacidades multitarea del robot.
En Twitter, Lynch explicado el proyecto de la Figura 01 con más detalle.
“Nuestro robot puede describir su experiencia visual, planificar acciones futuras, reflexionar sobre su memoria y explicar su razonamiento verbalmente”, escribió en un extenso hilo.
Según Lynch, alimentan imágenes de las cámaras del robot y transcriben texto del habla capturada por micrófonos integrados a un gran modelo multimodal entrenado por OpenAI.
La IA multimodal se refiere a la inteligencia artificial que puede comprender y generar diferentes tipos de datos, como texto e imágenes.
Lynch enfatizó que el comportamiento de la Figura 01 fue aprendido, corrió a velocidad normal y no se controló de forma remota.
“El modelo procesa toda la historia de la conversación, incluidas imágenes pasadas, para generar respuestas lingüísticas, que se responden al ser humano a través de texto a voz”, dijo Lynch. “El mismo modelo es responsable de decidir qué comportamiento aprendido de bucle cerrado ejecutar en el robot para cumplir un comando determinado, cargar pesos particulares de la red neuronal en la GPU y ejecutar una política”.
Lynch explicó que la Figura 01 está diseñada para describir su entorno de manera concisa y puede aplicarse “sentido común”para tomar decisiones, como inferir que los platos se colocarán en una rejilla. También puede convertir declaraciones vagas, como el hambre, en acciones, como ofrecer una manzana, mientras explica sus acciones.
El debut provocó una respuesta apasionada en Twitter, muchas personas quedaron impresionadas con las capacidades de la Figura 01 y más de unos pocos la agregaron a la lista de hitos en el camino hacia la singularidad.
Por favor, díganme que su equipo ha visto todas las películas de Terminator”, respondió uno.
“Tenemos que encontrar a John Connor lo antes posible”, añadió otro.
Para los desarrolladores e investigadores de IA, Lynch proporcionó una serie de detalles técnicos.
“Todos los comportamientos están impulsados por políticas transformadoras visomotoras de redes neuronales, que asignan píxeles directamente a acciones”, dijo Lynch. “Estas redes captan imágenes integradas a 10 Hz y generan acciones de 24 grados de libertad (posturas de muñeca y ángulos de las articulaciones de los dedos) a 200 Hz”.
El impactante debut de la Figura 01 se produce cuando los formuladores de políticas y los líderes globales intentan lidiar con la proliferación de herramientas de inteligencia artificial en la corriente principal. Si bien la mayor parte de la discusión se ha centrado en grandes modelos de lenguaje como ChatGPT de OpenAI, Gemini de Google y Claude AI de Anthropic, los desarrolladores también están buscando formas de darle a la IA cuerpos robóticos humanoides físicos.
Figure AI y OpenAI no respondieron de inmediato a Descifrar petición de comentario.
“Uno es una especie de objetivo utilitario, que es por lo que Elon Musk y otros están luchando”, dijo anteriormente el profesor de ingeniería industrial de UC Berkeley, Ken Goldberg. Descifrar. “Gran parte del trabajo que se está realizando en este momento (por qué la gente está invirtiendo en estas empresas como Figure) es que la esperanza es que estas cosas puedan funcionar y ser compatibles”, dijo, particularmente en el ámbito de la exploración espacial.
Junto con Figure, otros que trabajan para fusionar la IA con la robótica son Hanson Robotics, quien en 2016 presentó su robot de IA Desdemona.
“Incluso hace unos años, habría pensado que tener una conversación completa con un robot humanoide mientras planifica y lleva a cabo sus propios comportamientos aprendidos sería algo que tendríamos que esperar décadas para ver”, dijo el ingeniero senior de IA de Figure AI. Corey Lynch dijo en Twitter. “Obviamente, muchas cosas han cambiado”.
Editado por Ryan Ozawa.
Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada.