Un estudio reciente cuestiona la capacidad real de razonamiento genuino de los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) y determina que tienen limitaciones, además de que su rendimiento se deteriora a medida que se proporcionan preguntas más complejas.