Multiverse Computing, compañía especializada en compresión de modelos de IA, ha lanzado dos nuevos modelos de IA: versiones comprimidas al 80% de Llama 3.1-8B y Llama 3.3-70B. Los desarrolladores de IA pueden incorporar inmediatamente los modelos a cualquier aplicación, ya sea local, local o en la nube.
CompactifAI es el compresor de IA patentado por Multiverse. Se trata del primer compresor de su clase, que utiliza redes tensoriales de inspiración cuántica para lograr que los sistemas de IA sean más eficientes y portátiles, reduciendo el tamaño hasta un 93% con solo una caída del 2-3% en la precisión, una hazaña asombrosa si se compara con la pérdida de precisión del 20-30% estándar del sector, con técnicas de compresión del 50-60%.
Multiverse Computing fue fundada en 2019 por pioneros en software de inspiración cuántica para desarrollar soluciones novedosas a problemas empresariales complejos. En 2023, la empresa comenzó a aplicar su tecnología básica para abordar la crisis energética de la IA con CompactifAI.
Los proveedores de LLM han recurrido a técnicas como la poda y la cuantización para comprimir modelos, pero aún tienen que erradicar el compromiso entre tamaño y rendimiento. Por ejemplo, Llama3.1-8B Slim de CompactifAI requiere 300 veces menos tokens de entrenamiento que CAI Llama3 de Meta, y 3 veces menos tokens de entrenamiento que Llama3.1-Minitron de Nvidia, al tiempo que obtiene mejores resultados en las pruebas comparativas. En el caso de Llama3.3-70B Slim de CompactifAI, las pruebas comparativas muestran un aumento de las capacidades de razonamiento manteniendo la precisión original.
Multiverse Computing tiene su sede en Donostia- San Sebtasián y cuenta con oficinas en Europa, Estados Unidos y Canadá. La empresa ya presta servicio a más de 100 clientes en todo el mundo, entre ellos Iberdrola, Bosch y el Banco de Canadá. Multiverse Computing ha recaudado 100 millones de dólares hasta la fecha con inversiones de Columbus Venture Partners y el Gobierno de España, entre otros.
Noticia original: Multiverse Computingn