Por Israel Serrano, responsable de Scality para España y Sur de Europa
Para que la inteligencia artificial y el aprendizaje automático funcionen correctamente, necesitan datos, muchos datos. Afortunadamente, eso es exactamente lo que el mundo digitalizado está bombeando. En 2020 se alcanzó la cifra récord de 64,2 zettabytes de datos nuevos y la demanda de capacidad de almacenamiento no deja de crecer, pero no sirve cualquier tipo de almacenamiento es adecuado debido a que que estos datos son tan valiosos que deben almacenarse de forma segura, accesible, escalable y, sobre todo: duradera.
A medida que más organizaciones ejecutan cargas de trabajo de IA y ML, necesitan un nuevo enfoque de almacenamiento que pueda manejar estas cargas de trabajo masivas. Un caso de uso en el mundo real es una buena manera de ilustrar este punto.
Pensemos en el sector de los viajes y en todos los datos que generan las numerosas aerolíneas, empresas de alquiler de coches, hoteles, etc. Imaginemos por un momento que como dueño de una agencia de viajes pudiésemos saber en tiempo real hacia dónde se dirigen la mayoría de los pasajeros de las aerolíneas en un fin de semana concreto, o que tipo de alojamiento prefieren, que tanto por ciento de los viajeros alquilan un coche en destino, etc. Eso sería una gran ventaja competitiva para nuestro negocio.
Pero llegar a conclusiones útiles como ésta es más fácil de decir que de hacer. El sector de los viajes genera alrededor de un petabyte de datos cada día, y algunos de esos datos se duplican en los sitios de agregación. Los datos de esta naturaleza son sensibles al tiempo, por lo que se necesita una forma de determinar rápidamente qué datos son significativos. Esto requiere la capacidad de escalar.
Esto mismo ocurre con el resto de los sectores que están pendientes de los cambios de tendencia y de demanda de los usuarios.
Desde las grandes empresas hasta las PYMES pueden beneficiarse de la información que proporcionan los datos bien estructurados, de forma que se puedan extraer los datos más valiosos y desechar los que no tienen importancia en la toma de decisiones.
El almacenamiento rápido de objetos ayuda a superar el reto de retener los big data, para que las organizaciones puedan extraer el valor de estos datos y hacer avanzar los negocios.
Diseñado para ser escalable masivamente y, como tal, fundamentalmente diferente de los sistemas tradicionales de almacenamiento de archivos o bloques, el almacenamiento de objetos organiza la información en contenedores de tamaños flexibles, denominados objetos. Cada objeto incluye los datos en sí, así como sus metadatos asociados, y tiene un identificador único global, en lugar de un nombre de archivo y una ruta de archivo. Estos identificadores únicos se organizan en un espacio de direcciones planas, lo que elimina los desafíos de complejidad y escalabilidad de un sistema de archivos jerárquico basado en rutas de archivos complejas y acerca las ventajas competitivas de la información en tiempo real a cualquier empresa, independientemente de su tamaño contribuyendo a mejorar su cuenta de resultados.