JARVICE AI simplifica el trabajo de los científicos de datos y los administradores de infraestructuras de IA al proporcionar un acceso de orquestación «único y seguro» a clústeres de GPU o proveedores de nube dispersos geográficamente.
La solución es una extensión integral de la plataforma HPC empresarial JARVICE™ XE de Eviden. Con nuevas capacidades, esta plataforma está diseñada para la IA y puede orquestar marcos de MLOps con un solo clic en infraestructuras avanzadas de IA, ya sea en las instalaciones, en la nube o en arquitecturas federadas. La oferta cuenta con rendimiento bare metal y flexibilidad para ejecutar GPU, CPU, IPU o cualquier otro recurso de aceleración de IA emergente. JARVICE AI aprovecha el amplio mercado de aplicaciones HyperHub™ y lo amplía con un catálogo de aplicaciones y marcos específicos de IA en los ámbitos de IA generativa, operaciones de modelos y LLM. Además, puede admitir aplicaciones y marcos de IA personalizados.
Con su programador de cargas de trabajo avanzado integrado, JARVICE AI da cabida a un conjunto diverso de necesidades de programación de IA concurrentes desde una única plataforma, incluida la formación a gran escala para marcos de IA generativa, tareas de inferencia de baja latencia y flujos de trabajo MLOps complejos, ofreciendo altos niveles de eficiencia para la utilización del clúster y la movilidad de la carga de trabajo.
"Al combinar y simplificar la gestión y el despliegue de aplicaciones de IA y HPC bajo un único panel de vidrio en todos los puntos finales de computación de la organización, JARVICE AI proporciona una experiencia de usuario segura y escalable para científicos, investigadores e ingenieros. Con JARVICE AI e HyperHub, las organizaciones pueden responder a las necesidades de rápida evolución de las cargas de trabajo de IA con confianza y facilidad, sin importar lo que traiga el futuro", dijo Leo Reiter, CTO de Nimbix Cloud.
"JARVICE AI me entusiasma como usuario de JARVICE desde hace 6 años para la formación de modelos de aprendizaje profundo a gran escala. Es fácil de usar, unifica los flujos de trabajo de MLOps en cualquier infraestructura en un único panel de vidrio e introduce una nueva programación avanzada de cargas de trabajo: es una oferta muy atractiva para la empresa", afirma Tanmay Bakshi, ML & Software Architect, IBM Automation y Google Developer Expert for Machine Learning en IBM.
Disponibilidad:
JARVICE AI estará ampliamente disponible en el tercer trimestre de 2024, con acceso anticipado a los clientes a partir de ahora. Eviden lo expuso en ISC24 en Hamburgo, Alemania.