Cómo acelerar las iniciativas de ML con virtualización de datos, las claves del DataOps y la tecnología de grafos, estrategias sobre data literacy y otras tendencias que se abordaron en el Data&cIA Congress 2021

La semana pasada tuvo lugar Data&cIA Congress 2021, el mayor evento profesional en España sobre Big Data e IA aplicado al negocio. Durante la jornada se pusieron sobre la mesa las diferentes problemáticas a las que se enfrentan los CDO´s (Chief Data Officer) y responsables del desarrollo de la Inteligencia Artificial de las empresas. Abordó el sector desde 9 niveles diferentes: Data Ethics, Gobierno del Dato, Inteligencia Artificial, Arquitectura de datos, El futuro del dato; Visualización de datos; Startups; MLOps y Data Literacy.

Estas son algunas de las conclusiones y tendencias clave que pusieron en común las empresas y players del sector que participaron.

- Acelerar las iniciativas de Machine Learning con la Virtualización de Datos. La virtualización de los datos fue uno de los aspectos comentados. Entre las principales ventajas de este aspecto se encuentran: reducir el tiempo de integración de fuentes; facilidad para trazar todas las transformaciones de extremo a extremo y compartir entre diferentes personas; ofrecer una capa genérica que cualquier usuario pueda explotar; introducir una capa de seguridad con reglas de acceso centralizadas.

- Las metodologías emergentes en el mundo del dato. El paso al DataOps es un objetivo a largo plazo para muchas empresas todavía. Son grandes los retos de implementación de estas tecnologías que, no obstante, se consideran imprescindibles para el crecimiento. Entre los principales hándicaps: aunar el conocimiento de tantas personas y perfiles con diferentes visiones y skills.

- Tener una web no es suficiente: tecnología de grafos. En la conferencia destacó la importancia de realizar una digitalización enfocada a la experiencia de usuario a través de la tecnología de grafos. Se trata de una herramienta potente para responder preguntas que provienen de modelos de datos de alta complejidad. El reto, su integración con el resto de las tecnologías, para mejorar la digitalización.

- Data literacy: el camino hacia la alfabetización de los datos. Trabajar con datos es necesario, pero enseñar y acostumbrar a los trabajadores a extraer información significativa de ellos, es lo realmente relevante. Según los expertos, la peculiaridad del impulso data driven dentro de la compañía se encuentran en romper los silos de datos, y recomiendan un estudio de evaluación inicial, con planes formativas adaptados a cada grupo. También destacaron la importancia del ‘storytelling’ para explicar y aprender a comunicar los datos.

- Contar con modelos predictivos. Esta tecnología ha sido especialmente relevante para las empresas en 2020, que hasta este último año no se habían visto en la necesidad de tener que hacer frente a situaciones de crisis y cambios de negocio tan repentinos. Invertir en tecnología predictiva permite a las empresas adelantarse a las posibles situaciones derivadas, para tomar las decisiones más adecuadas.

- Combinar escalabilidad y resiliencia para ganar valor a largo plazo. Las organizaciones ya se están dando cuenta de la necesidad de escalar los datos. Según los expertos, tres de cada cuatro consideran que para poder escalar van a tener que hacerlo antes de cinco años. Para ello, se requiere determinar qué datos van a aportar un mayor valor al negocio, e incorporar en todo momento una etapa de gobierno que permita a las empresas alcanzar la resiliencia largo plazo.

- Flexibilidad de las herramientas. Una de las principales claves del éxito de la incorporación de nuevas tecnologías a las empresas será la capacidad de éstas de integrarlas todas con independencia del entorno de ejecución, es decir, que puedan gestionarse en cualquier lenguaje de programación o interconectarse eficazmente entre ellas. Esto, contribuye, además, a aumentar los procesos de seguridad.

Data&cIA Congress 2021 contó con profesionales de empresas como Repsol, El Ganso, BBVA, Correos, Adecco, CUNEF, Orange, Genarali, Naturgy, UNIR y Enel. El congreso cuentó como patrocinador Platinum con Dataiku, Gold serán Graph Everywhere, Denodo, Keyrus, Data Robot y Alteryx. Silver van a ser Snowflake e Informatica y Startup ESIC, Parise y Gen D. Además contó con la colaboración de AI-Network, Axicom, La Neurona y Vino Premier.

Vídeo de la retransmisión completa de las dos salas del evento:

Sala Dataiku https://www.youtube.com/watch?v=Bymjm4B81Z8

SalaDataRobot https://www.youtube.com/watch?v=I1hpPM4HCsM