En septiembre, OpenAI presentó una nueva versión de ChatGPT diseñada para aplicar razonamiento en tareas relacionadas con las matemáticas, la ciencia y la programación informática.
A diferencia de las versiones anteriores del chatbot, esta nueva tecnología podía dedicar tiempo a “pensar” cómo resolver problemas complejos antes de presentar una respuesta.
Pronto, la empresa declaró que su nueva tecnología de razonamiento había superado a los principales sistemas del sector en una serie de pruebas que le dan seguimiento al progreso de la inteligencia artificial.
Ahora otras empresas, como Google, Anthropic y la china DeepSeek, ofrecen tecnologías similares.
Pero lo que nos preguntamos es si la IA puede razonar realmente como un ser humano.
¿Qué significa que una computadora piense?
¿Se acercan realmente estos sistemas a la verdadera inteligencia?
¿Qué significa que un sistema de IA razone?
Razonar solo significa que el chatbot le dedica más tiempo a resolver un problema.
“Hay razonamiento cuando el sistema hace un trabajo adicional después de que se formula la pregunta”, explicó Dan Klein, profesor de informática en la Universidad de California, campus Berkeley, y director de tecnología de la empresa emergente de IA Scaled Cognition.

Puede dividir un problema en pasos individuales o intentar resolverlo por prueba y error.
El ChatGPT original respondía preguntas inmediatamente.
Los nuevos sistemas de razonamiento pueden analizar un problema durante varios segundos (o incluso minutos) antes de responder.
¿Puedes ser más concreto?
En algunos casos, un sistema de razonamiento refina su enfoque para la resolución de preguntas e intenta mejorar repetidamente el método que ha elegido.
Otras veces, puede probar varias formas distintas de abordar un problema antes de decidirse por una de ellas.
O puede volver a revisar lo que analizó unos segundos antes, solo para verificar si era correcto.
Básicamente, el sistema hace todo lo posible para responder tu pregunta.
Es algo así como un alumno de primaria que trata de encontrar la manera de resolver un problema de matemáticas y garabatea varias opciones diferentes en una hoja de papel.
¿Qué tipo de preguntas requieren que un sistema de IA razone?
Podría razonar sobre cualquier cosa.
Pero el razonamiento es más eficaz cuando planteas preguntas relacionadas con las matemáticas, la ciencia y la programación informática.
¿En qué se diferencia un chatbot razonador de los chatbots anteriores?
A los chatbots anteriores podías pedirles que te mostraran cómo habían llegado a una respuesta concreta o que comprobaran su propio trabajo.
Como el ChatGPT original había aprendido de textos de Internet, en los que la gente mostraba cómo había llegado a una respuesta o comprobado su propio trabajo, también podía hacer este tipo de autorreflexión.
Pero un sistema de razonamiento va más allá.
Puede realizar este tipo de operaciones sin que nadie se lo pida.
Y puede hacerlo con mecanismos más amplios y complejos.
Las empresas lo llaman sistema de razonamiento porque da la sensación de que funciona más como una persona que está pensando cómo solucionar un problema difícil.
¿Por qué es importante ahora el razonamiento de la IA?
Empresas como OpenAI creen que es la mejor forma de mejorar sus chatbots.
Durante años, estas empresas se basaron en un concepto sencillo:
cuantos más datos de Internet les dieran a sus chatbots, mejor funcionaban esos sistemas.
Pero en 2024 agotaron casi todo el texto de Internet.
En consecuencia, necesitaban una nueva estrategia para mejorar sus chatbots.
Así que empezaron a construir sistemas de razonamiento.
¿Cómo se construye un sistema de razonamiento?
El año pasado, empresas como OpenAI empezaron a emplear mucho una técnica llamada aprendizaje por refuerzo.
A través de este proceso, que puede durar meses, un sistema de IA logra aprender comportamientos mediante un proceso extenso de prueba y error.
Por ejemplo, si trabaja con miles de problemas matemáticos, puede aprender qué métodos conducen a la respuesta correcta y cuáles no.
Los investigadores han diseñado mecanismos complejos de retroalimentación que le muestran al sistema cuándo hace algo bien y cuándo lo hace mal.
“Es un poco parecido a adiestrar a un perro”, explicó Jerry Tworek, investigador de OpenAI.
“Si el sistema lo hace bien, le das una galleta. Si no lo hace bien, le dices:
(The New York Times demandó en diciembre a OpenAI y a su socia, Microsoft, por infracción de derechos de autor de contenidos periodísticos relacionados con sistemas de IA).
¿Sí funciona el aprendizaje por refuerzo?
Funciona bastante bien en ciertas áreas, como las matemáticas, la ciencia y la programación informática, porque son áreas en las que las empresas pueden definir claramente el buen y el mal comportamiento.
Los problemas matemáticos tienen respuestas definitivas.
El aprendizaje por refuerzo no funciona tan bien en áreas como la escritura creativa, la filosofía y la ética, donde es más difícil precisar qué distingue lo malo de lo bueno.
Los investigadores afirman que, en general, este proceso puede mejorar el desempeño de un sistema de IA, incluso cuando responde preguntas que no son de matemáticas ni de ciencias.
“Aprende gradualmente qué patrones de razonamiento lo conducen en la dirección correcta y cuáles no”, señaló Jared Kaplan, director científico de Anthropic.
¿Es lo mismo hablar de aprendizaje por refuerzo que de sistemas de razonamiento?
El aprendizaje por refuerzo es el método que utilizan las empresas para construir sistemas de razonamiento.
Es la etapa de entrenamiento que, en última instancia, les permite razonar a los chatbots.
¿Estos sistemas de razonamiento siguen cometiendo errores?
Todo lo que hace un chatbot se basa en probabilidades.
Elige el camino más parecido a los datos de los que aprendió, ya sea que se trate de datos obtenidos de Internet o generados mediante aprendizaje por refuerzo.
A veces elige una opción equivocada o que no tiene sentido.
¿Es el camino para crear una máquina que iguale la inteligencia humana?
Los expertos en IA tienen opiniones distintas al respecto.
Estos métodos todavía son relativamente nuevos, así que los investigadores aún no comprenden sus límites.
En el campo de la IA, los métodos nuevos suelen progresar muy rápidamente al principio y luego bajan el ritmo.
c.2025 The New York Times Company