Investigadores automatizan el diseño de estrategias de razonamiento con LLM

1 junio, 2026

Marcela Osorio7 min de lectura0 comentarios

Keyword Investigadores automatizan diseño estrategias razonamiento7 min de lecturaActualizado hace 2 meses

Un nuevo marco llamado AutoTTS permite optimizar el uso de computación en modelos de lenguaje, mejorando su rendimiento y reduciendo costos operativos.

Investigadores automatizan el diseño de estrategias de razonamiento con LLM y reducen el uso de tokens en un 69.5%

El avance de la IA obliga a mirar más allá de la novedad: lo importante es entender cómo impacta en trabajos, empresas y estrategias digitales.

Para ampliar el contexto, también puede leerse Cómo implementar modelos de Qualcomm AI Hub para clasificación y detección.

Un equipo de investigadores de Meta, Google y diversas universidades ha presentado un avance significativo en la optimización de modelos de lenguaje. A través del marco AutoTTS, han logrado automatizar el diseño de estrategias de escalado en tiempo de prueba, permitiendo a las organizaciones reducir drásticamente el uso de tokens y los costos operativos asociados con la implementación de modelos avanzados de razonamiento.

El escalado en tiempo de prueba (TTS) se ha establecido como un método efectivo para mejorar el rendimiento de los grandes modelos de lenguaje (LLM) en aplicaciones del mundo real. Este proceso otorga ciclos adicionales de computación en el momento de la inferencia, permitiendo que el modelo genere múltiples caminos de razonamiento o evalúe sus pasos intermedios antes de alcanzar una respuesta final. Sin embargo, las estrategias TTS se habían diseñado históricamente de manera manual, dependiendo en gran medida de la intuición humana para dictar las reglas del razonamiento del modelo.

Para abordar este cuello de botella, el equipo de investigación ha introducido AutoTTS, un marco diseñado para descubrir automáticamente las estrategias TTS óptimas. Esta aproximación automatizada permite a las organizaciones optimizar dinámicamente la asignación de computación sin necesidad de ajustar manualmente las heurísticas. Durante las pruebas experimentales, AutoTTS logró reducir el uso de tokens y los costos operativos de la implementación de modelos de razonamiento avanzado en un 69.5% sin comprometer la precisión.

Investigadores automatizan diseño estrategias razonamiento: Desafíos del Escalado en Tiempo de Prueba

El principal desafío en el diseño de estrategias TTS radica en determinar cómo asignar de manera óptima esta computación adicional. Anteriormente, los investigadores diseñaban estas estrategias manualmente, basándose en conjeturas para construir heurísticas rígidas. Los ingenieros debían hipotetizar las reglas y umbrales que dictan cuándo un modelo debe ramificarse en nuevos caminos de razonamiento, profundizar en un camino existente, podar una rama poco prometedora o detener el razonamiento por completo. Este proceso de ajuste manual estaba limitado por la intuición humana, lo que dejaba sin explorar una gran cantidad de enfoques posibles, a menudo resultando en compromisos subóptimos entre la precisión del modelo y los costos computacionales.

Las estrategias TTS actuales pueden ser mapeadas a un espacio de control de ancho-profundidad, donde el “ancho” es el número de ramas de razonamiento exploradas y la “profundidad” es hasta dónde se desarrollan cada una. Métodos como la auto-consistencia (SC) muestrean un número fijo de trayectorias y votan mayoritariamente la respuesta, mientras que la consistencia adaptativa (ASC) ahorra recursos al detenerse una vez que se alcanza un umbral de confianza. El enfoque de sondeo paralelo toma un enfoque más granular, podando ramas poco prometedoras mientras profundiza en las demás. Todos estos métodos son elaborados a mano, y esa es la limitación que AutoTTS está diseñado para romper.

Automatizando el Descubrimiento de Estrategias con AutoTTS

AutoTTS reconfigura la manera en que se optimiza el escalado en tiempo de prueba. En lugar de considerar el diseño de estrategias como una tarea humana, AutoTTS lo aborda como un problema de búsqueda algorítmica dentro de un entorno controlado. Este marco redefine los roles tanto del ingeniero humano como del modelo de IA. En lugar de crear reglas específicas sobre cuándo un LLM debe ramificar, podar o detener el razonamiento, el papel del ingeniero se transforma en construir el entorno de descubrimiento. El humano define los límites, incluyendo el espacio de control de estados y acciones, los objetivos de optimización que equilibran precisión y costo, y los mecanismos de retroalimentación específicos.

Un LLM explorador, como Claude Code, diseña la estrategia. Este explorador actúa como un agente autónomo que propone iterativamente “controladores” TTS. Estos controladores son políticas o algoritmos definidos por código que dictan cómo un modelo de IA asigna su presupuesto computacional durante la inferencia. El explorador prueba y refina estos controladores basándose en la retroalimentación hasta descubrir una política óptima de asignación de recursos.

Mecanismos Clave de la Estrategia AutoTTS

AutoTTS ha encontrado formas no evidentes de gestionar la computación, lo que permite una mayor precisión y ahorro de costos. Por ejemplo, un controlador óptimo descubierto por AutoTTS, denominado Controlador de Momentum de Confianza, utiliza varios mecanismos innovadores:

Detención basada en tendencias: A diferencia de las estrategias diseñadas a mano que instruyen al modelo a detenerse al alcanzar un umbral de confianza instantáneo, el agente de AutoTTS descubrió que la confianza instantánea puede ser engañosa. El controlador sigue un promedio móvil exponencial de confianza y solo se detiene si el nivel de confianza general es alto y la tendencia no está en declive activo.
Control de ancho-profundidad acoplado: Las algoritmos diseñados manualmente suelen tratar la “ampliación” de nuevas ramas de razonamiento y la “profundización” de las ramas actuales como decisiones separadas. AutoTTS descubrió un bucle de retroalimentación cerrado donde ambas acciones están vinculadas. Si la confianza de las ramas actuales se estanca o retrocede, el controlador activa automáticamente la creación de nuevas ramas.
Asignación de profundidad consciente de la alineación: En lugar de dar a todas las ramas activas un presupuesto computacional igual, el controlador identifica dinámicamente qué ramas están de acuerdo con la respuesta líder actual y les otorga ráfagas de computación adicionales.

Resultados y Beneficios en el Mundo Real

Para probar si una IA podía descubrir de manera autónoma una mejor estrategia de escalado en tiempo de prueba, los investigadores establecieron un riguroso marco de evaluación. Los experimentos se llevaron a cabo en modelos Qwen3 que varían de 0.6B a 8B parámetros, y se evaluó la capacidad del sistema para generalizar en una versión destilada de 8B del modelo DeepSeek-R1. El agente explorador fue inicialmente encargado de descubrir una estrategia óptima utilizando el benchmark de razonamiento matemático AIME24. Esta estrategia se probó luego en dos benchmarks matemáticos reservados, AIME25 y HMMT25, así como en el benchmark de razonamiento general a nivel de posgrado GPQA-Diamond.

El controlador descubierto por AutoTTS se enfrentó a cuatro algoritmos de escalado en tiempo de prueba diseñados manualmente. Cuando se configuró en un modo equilibrado y consciente de los costos, el controlador descubierto por AutoTTS redujo el consumo total de tokens en aproximadamente un 69.5% en comparación con SC@64, manteniendo la misma precisión promedio en los cuatro modelos Qwen. Con un presupuesto de inferencia mayor, AutoTTS logró superar la precisión máxima más allá de todas las líneas de base diseñadas a mano en cinco de ocho casos de prueba.

Implicaciones para la Industria de la IA

Estos experimentos subrayan dos beneficios operativos importantes para quienes desarrollan aplicaciones de IA en empresas. Primero, AutoTTS no solo ahorra dinero en el consumo de tokens, sino que también eleva el rendimiento máximo alcanzable del modelo base. El controlador diseñado por IA es excepcionalmente bueno para detectar ramas de razonamiento ruidosas o poco productivas y redirigir continuamente su presupuesto computacional hacia las ramas que generan las señales de razonamiento más útiles.

En segundo lugar, debido a que el marco se basa en un entorno de reproducción fuera de línea, todo el proceso de descubrimiento costó solo $39.90 y tomó 160 minutos. Esto significa que las estrategias de razonamiento optimizadas, adaptadas a modelos propietarios y tareas internas, ahora están al alcance de los equipos empresariales, sin necesidad de un presupuesto de investigación dedicado.

Tanto el marco AutoTTS como el Controlador de Momentum de Confianza están disponibles en GitHub, y el CMC puede usarse como un reemplazo directo para otros controladores TTS.

El tema genera alto interés porque la IA está cambiando herramientas cotidianas, flujos de trabajo y modelos de negocio a gran velocidad.

Oportunidades para empresas y profesionales

La oportunidad no está en automatizar todo, sino en usar inteligencia artificial para trabajar mejor, con más velocidad y mejor criterio.

FAQ

Preguntas frecuentes

¿Qué es la inteligencia artificial en el contexto del diseño de estrategias de razonamiento?

La inteligencia artificial se refiere a sistemas que pueden automatizar procesos, como el diseño de estrategias de razonamiento en modelos de lenguaje, mejorando la eficiencia y reduciendo costos.

¿Cómo afecta la automatización en la inteligencia artificial al uso de tokens?

La automatización en la inteligencia artificial, a través de marcos como AutoTTS, ha permitido reducir el uso de tokens en un 69.5%, optimizando los costos operativos.

¿Qué es AutoTTS y cómo se relaciona con la inteligencia artificial?

AutoTTS es un marco que automatiza el diseño de estrategias de escalado en modelos de lenguaje, mejorando el rendimiento de la inteligencia artificial en aplicaciones del mundo real.

Marcela Osorio

Editor digital

Marcela Osorio es una autora argentina especializada en Inteligencia Artificial, Marketing Digital y Tendencias Digitales. Con una mirada crítica y actual, explora las intersecciones entre la tecnología y el mundo del marketing, aportando insights valiosos para profesionales del sector. Su trabajo se enfoca en desmitificar conceptos complejos y ofrecer herramientas prácticas para adaptarse a un entorno digital en constante evolución. Desde Argentina, Marcela contribuye a la conversación sobre el futuro digital con pasión y compromiso.

396 notas

Ver biografía y artículos →

Recomendadas

Más noticias de este autor

Desarrollador adapta MiniCPM5‑1B y logra un modelo local de razonamiento de solo

Seguimiento del tema

Esta cobertura puede ampliarse con nuevas fuentes, consultas de búsqueda y artículos relacionados dentro del mismo eje editorial.

Ver más de Inteligencia Artificial Volver al inicio Ir a comentarios