LG AI Research revela su avanzado modelo de razonamiento
LG AI Research ha presentado EXAONE Deep, un modelo de razonamiento que sobresale en la resolución de problemas complejos en matemáticas, ciencias y programación. Este modelo está diseñado para competir directamente con los modelos líderes, destacándose por su habilidad avanzada en estos dominios.
Desafío global en modelos de razonamiento
LG AI Research subraya el reto global de crear modelos de razonamiento avanzados, señalando que solo unas pocas organizaciones con modelos fundamentales están actualmente en esta área compleja. EXAONE Deep busca competir directamente con estos modelos líderes, exhibiendo una capacidad de razonamiento competitiva.
Mejoras en las capacidades de razonamiento
LG AI Research ha centrado sus esfuerzos en mejorar drásticamente las capacidades de razonamiento de EXAONE Deep en dominios clave. El modelo también demuestra una fuerte habilidad para entender y aplicar conocimientos en una amplia gama de temas.
Benchmark de rendimiento en matemáticas
El modelo EXAONE Deep 32B superó a un modelo competidor, a pesar de ser solo el 5% de su tamaño, en un exigente benchmark de matemáticas. Además, las versiones de 7.8B y 2.4B obtuvieron el primer lugar en todos los principales benchmarks de matemáticas para sus respectivos tamaños de modelo.
Excelencia en ciencias y programación
En ciencias y programación, los modelos EXAONE Deep (7.8B y 2.4B) han ocupado el primer lugar en todos los benchmarks principales. En la evaluación LiveCodeBench, el modelo alcanzó una puntuación de 59.5, indicando su potencial para aplicaciones de alto nivel en estos dominios.
Reconocimiento internacional
Las capacidades del modelo EXAONE Deep 32B ya han obtenido reconocimiento internacional. Poco después de su lanzamiento, fue incluido en la lista de 'Modelos de IA Notables' por la organización de investigación sin fines de lucro con sede en EE.UU., Epoch AI.
Dominio en matemáticas
EXAONE Deep ha demostrado habilidades excepcionales de razonamiento matemático en sus varios tamaños de modelo (32B, 7.8B y 2.4B). Los tres modelos superaron a los modelos globales de razonamiento de tamaño comparable en evaluaciones basadas en el currículo de matemáticas del año académico 2025.
Rendimiento en ciencias y programación
EXAONE Deep también ha demostrado capacidades notables en razonamiento científico profesional y programación de software. El modelo 32B obtuvo una puntuación de 66.1 en la prueba GPQA Diamond, evaluando habilidades de resolución de problemas en física, química y biología a nivel doctoral.
Conocimiento general mejorado
Más allá de sus capacidades especializadas de razonamiento, EXAONE Deep también ha mostrado un rendimiento mejorado en la comprensión del conocimiento general. El modelo 32B alcanzó una puntuación de 83.0 en el benchmark MMLU, posicionándose como el modelo doméstico de mejor rendimiento en esta evaluación integral.
Innovación continua hacia el futuro
LG AI Research cree que los avances en el razonamiento de EXAONE Deep representan un salto hacia un futuro donde la IA puede abordar problemas cada vez más complejos y contribuir a enriquecer y simplificar la vida humana a través de la investigación y la innovación continuas.
EXAONE Deep de LG demuestra un rendimiento sobresaliente en matemáticas, ciencias y programación, superando a modelos de mayor tamaño en diversos benchmarks. Su inclusión en la lista de modelos de IA notables subraya su reconocimiento internacional, confirmando su potencial en múltiples áreas.