Datalab presenta Lift: modelo abierto que convierte PDFs en JSON estructurado
Datalab lanzó Lift, un modelo visual de 9.000 millones de parámetros que transforma documentos PDF e imágenes en datos estructurados JSON según esquemas definidos, con alta precisión y código abierto.

Datalab anunció el lanzamiento de Lift, un modelo visual de pesos abiertos diseñado para extraer información estructurada directamente desde archivos PDF e imágenes. Con 9.000 millones de parámetros y un enfoque basado en esquemas JSON, esta herramienta promete mejorar la automatización documental en entornos empresariales, técnicos y de análisis de datos.
La compañía Datalab presentó Lift, su primer modelo visual orientado exclusivamente a la extracción estructurada de información. Este sistema permite convertir documentos PDF e incluso imágenes en archivos JSON que cumplen con un esquema definido por el usuario. Dicho enfoque, denominado ‘decodificación restringida por esquema’, garantiza que cada salida respete una estructura coherente, reduciendo errores y mejorando la fiabilidad de los resultados.
Datalab presenta Lift: Un salto técnico en la extracción de datos
Lift fue desarrollado con 9.000 millones de parámetros y se destaca por operar con pesos abiertos, lo que significa que puede ser implementado localmente por empresas o investigadores sin depender de una API cerrada. Datalab ya había incursionado en herramientas de reconocimiento óptico de caracteres (OCR) como Chandra, Marker y Surya. Con Lift, la firma consolida su liderazgo en soluciones de extracción automatizada de información a partir de documentos.
El modelo acepta como entrada un esquema JSON estándar y devuelve un archivo que se ajusta a esa estructura, asegurando compatibilidad con flujos de trabajo existentes. Según los ensayos internos en un conjunto de 225 documentos, Lift alcanzó un 90,2% de precisión en campos individuales, superando a competidores como NuExtract3 y Qwen3.5-9B en el segmento de modelos autoalojables.
Para profundizar el contexto, también se puede leer: Google lanza DiffusionGemma: modelo de IA 4 veces más rápido.
Para profundizar el contexto, también se puede leer: Vercel lanza Eve: marco de agentes de IA de código abierto.
Una de las innovaciones más interesantes de Lift radica en su uso de ‘abstención entrenada’. Si un campo solicitado no está presente en el documento, el sistema no inventa un valor, sino que devuelve null. Este comportamiento minimiza los riesgos de datos falsos y facilita la validación posterior.
Procesamiento de documentos y rendimiento
Lift puede analizar documentos de múltiples páginas en una sola pasada, capturando información que se extiende entre secciones. Este enfoque mejora la velocidad operativa: el tiempo medio de procesamiento por documento se sitúa en 9,5 segundos, aproximadamente tres veces más rápido que Gemini Flash 3.5, otro modelo destacado en la categoría.
La herramienta incorpora dos modos de inferencia. El primero, local, se ejecuta mediante HuggingFace, ideal para entornos de prueba o investigación. El segundo, remoto, funciona a través de un servidor vLLM recomendado para implementaciones de producción que requieren mayor escala. Todo el código se distribuye bajo licencia Apache 2.0, mientras que los pesos del modelo se rigen por una licencia OpenRAIL-M modificada, que permite usos comerciales con ciertas condiciones.
El modelo convierte los esquemas definidos en estructuras Pydantic que luego se normalizan a un formato JSON estricto. Durante la generación, el servidor compila la gramática del esquema y controla cada token emitido, asegurando que solo se produzcan valores válidos. Este control token a token garantiza que el resultado final sea un JSON correctamente estructurado, aunque no valida la veracidad del contenido de cada campo.
Por qué esta noticia es relevante
La presentación de Lift marca un hito en la automatización de extracción documental. En un contexto donde las empresas buscan reducir tiempos de revisión manual y errores en la digitalización de grandes volúmenes de información, una solución abierta y configurable representa una alternativa atractiva frente a servicios cerrados o de alto costo. Lift ofrece la posibilidad de construir pipelines internos que mantengan el control total sobre datos sensibles.
El modelo también impulsa una discusión sobre la precisión frente a la verificación humana. Datalab reconoce que, si bien Lift alcanza altos niveles de exactitud por campo, la exactitud por documento completo (donde todos los campos deben ser correctos simultáneamente) aún se mantiene en torno al 20,9%. Esto pone en evidencia los desafíos de lograr automatización total sin supervisión en documentos extensos o complejos.
Aplicaciones prácticas y casos de uso
Lift permite implementar flujos de trabajo eficientes en distintos sectores. En la gestión de facturas, por ejemplo, es posible definir campos como número de factura, importe total y lista de ítems, mientras que si un identificador fiscal no aparece, el sistema devuelve un valor nulo sin generar un error. En análisis de contratos, el modelo puede unir información que se encuentra separada en varias páginas. En pipelines contables o de cuentas por pagar, su capacidad para mantener coherencia entre campos ausentes evita inconsistencias silenciosas que suelen generar pérdidas de tiempo en validaciones manuales.
El flujo de trabajo recomendado por Datalab incluye definir cuidadosamente el esquema JSON, realizar la extracción y luego validar los resultados. En caso de detección de campos nulos o errores de compilación de esquema, el sistema puede redirigir esos casos a revisión humana. Esta combinación entre automatización y control incrementa la calidad del dataset final.
Compatibilidad técnica y herramientas
Lift puede ejecutarse mediante línea de comandos en Python 3.12 o superior. Cada archivo procesado genera dos salidas: una en formato .json con los datos extraídos y otra con metadatos que incluyen cantidad de páginas, tokens procesados y posibles errores. Datalab también ofrece una aplicación denominada Schema Studio, basada en Streamlit, que permite crear y probar esquemas personalizados. Para entornos de producción, el contenedor Docker lift_vllm ajusta automáticamente el tamaño de lote según la GPU disponible, con soporte para modelos de Nvidia como H100, A100, L40s, A10, L4, 4090, 3090 y T4.
La flexibilidad de instalación y la posibilidad de autoalojamiento convierten a Lift en una herramienta atractiva para desarrolladores, startups y equipos de análisis que deseen mantener soberanía sobre sus datos. Además, la publicación del código y pesos bajo licencias abiertas fomenta la colaboración y la auditoría independiente, factores esenciales para el desarrollo responsable de tecnologías de extracción de información.
Cómo encaja dentro de la evolución del sector
El campo de los modelos de extracción estructurada ha crecido notablemente en los últimos años. Soluciones como NuExtract o Qwen3.5-9B introdujeron enfoques híbridos de visión y lenguaje, pero Lift refuerza la tendencia hacia modelos más especializados y autoalojables. Este enfoque responde a la necesidad de muchas compañías de evitar dependencias con proveedores externos y de cumplir normativas de privacidad o confidencialidad documental.
En el ámbito del procesamiento de documentos, la precisión estructural resulta tan importante como la semántica. Lift se diferencia porque aplica la validación de esquema durante la generación, no después. Este cambio metodológico reduce drásticamente los errores de formato y simplifica la integración con sistemas de bases de datos, ERP o CRM que exigen estructuras rígidas.
Además, Datalab complementa su ecosistema con herramientas de OCR abiertas, lo que posiciona a la empresa como un referente en soluciones de digitalización inteligente. Para el sector tecnológico, esto implica un paso adelante hacia la interoperabilidad y la transparencia en la manipulación de datos no estructurados.
Qué puede ocurrir a partir de ahora
Con la liberación de Lift, es probable que surja una ola de proyectos de extracción personalizada en empresas, instituciones académicas y administraciones públicas. La posibilidad de adaptar el modelo a esquemas propios y ejecutarlo en servidores locales abre la puerta a aplicaciones en sectores como legaltech, fintech, salud, educación o gobierno electrónico.
Datalab planea potenciar su API alojada con funciones adicionales como verificación por campo, citas automáticas y puntuaciones de confianza, orientadas a reducir la necesidad de revisión manual. A medida que evolucione el entrenamiento y se amplíen los conjuntos de datos, se espera una mejora progresiva en la precisión por documento completo.
Para la comunidad técnica, Lift representa un nuevo estándar en extracción estructurada reproducible. Su combinación de velocidad, apertura y control granular de esquema lo convierte en un aliado útil tanto para proyectos de investigación como para implementaciones empresariales.
Preguntas frecuentes
¿Qué diferencia a Lift de otros modelos de extracción de datos?
Lift usa decodificación restringida por esquema y abstención entrenada, lo que evita errores estructurales y datos inventados.
¿Cómo se ejecuta Lift?
Puede ejecutarse localmente mediante HuggingFace o en modo remoto a través de un servidor vLLM recomendado para producción.
¿Es gratuito para uso comercial?
La versión abierta permite uso personal y académico; el uso comercial exige cumplir términos de la licencia OpenRAIL-M modificada.
Más noticias de este autor
Seguimiento del tema
Esta cobertura puede ampliarse con nuevas fuentes, consultas de búsqueda y artículos relacionados dentro del mismo eje editorial.



