¿Y qué es el almacenamiento de objetos?

Por Israel Serrano, responsable de Scality para España y Portugal

Los profesionales de TI buscan plataformas de almacenamiento escalables, flexibles y asequibles para sus crecientes volúmenes de datos no estructurados. Gartner pronostica que las grandes empresas triplicarán su capacidad de datos no estructurados almacenados como almacenamiento de archivos u objetos en sus Centros de Datos, en el EDGE o en la nube pública para 2026 en comparación con 2021.

Por lo tanto, es importante tener claro qué es el almacenamiento de objetos y cómo se relaciona con los datos no estructurados para poder tomar las decisiones de almacenamiento que mejor se adapten a cada organización.

Para comprender la necesidad de almacenamiento de objetos, primero debemos entender el desafío de los datos no estructurados, que son datos que no vienen perfectamente organizados, en una hoja de cálculo, por ejemplo, o se adhieren a un formato de base de datos tradicional. Los ejemplos comunes incluyen correos electrónicos, imágenes, videos, archivos de audio y lecturas de sensores de IoT (Internet de las cosas).

Cada vez más datos son no estructurados. De hecho, los analistas de IDC esperan que los datos no estructurados representen al menos el 80-90% de los datos empresariales para 2025.

En pocas palabras, el almacenamiento de objetos es un tipo de almacenamiento que administra los datos como objetos, es decir que trata los datos en sí más los atributos descriptivos del objeto (metadatos). Esto es diferente a otras arquitecturas de almacenamiento que administran datos como una jerarquía de archivos (sistemas de archivos) o como bloques dentro de sectores y pistas (almacenamiento en bloque).

El almacenamiento de objetos, también conocido como almacenamiento basado en objetos, ofrece una forma realmente sencilla de almacenar información, organizada en distintos contenedores de tamaños flexibles y que utiliza claves para recuperar los datos específicos que está buscando. La idea de una clave es que haya un número o una identificación, como su número de DNI, que identifique de manera única cada objeto. Esa clave se utiliza para identificar o hacer referencia al valor, que son los datos reales, ya sea un archivo de Word o una imagen u otra cosa.

El almacenamiento de archivos es mucho más simple que un sistema de archivos, por ejemplo, con el almacenamiento de objetos, no es necesario saber dónde se encuentran los datos que deseamos encontrar.  Sólo hay que proporcionar una clave y el sistema recupera el objeto de inmediato.

¿Cuáles son los tres elementos de almacenamiento de objetos?

En realidad, solo hay tres elementos en el almacenamiento de objetos: la clave mencionada anteriormente (el identificador único), el valor (los datos en sí) y los metadatos, que identifican las propiedades descriptivas del objeto (como cuándo se creó, su tamaño y quién es el propietario y un número ilimitado de parámetros que caracterizan el dato) y especifica cómo se debe manejar el objeto cuando se accede a él.

En cuanto a los metadatos, se pueden agregar atributos personalizados a los sistemas de almacenamiento de objetos para manejar información adicional relacionada con archivos. Se necesitaría una nueva aplicación y base de datos (denominadas "atributos extendidos") para administrar los metadatos en un sistema de almacenamiento tradicional. Una vez más, el almacenamiento de objetos es mucho más simple.

Almacenamiento de objetos = simplicidad y escalabilidad

La simplicidad facilita el escalado. La sobrecarga que suponen los procesos de administración de los sistemas de archivos afecta a la escalabilidad de dichos sistemas, y es la razón por la cual, estos, nunca podrían almacenar miles de millones de archivos o más. Dado que el almacenamiento de objetos no tiene tal jerarquía de ubicación de carpetas y, en su lugar, administra objetos en un modelo plano simple, permite un almacenamiento eficiente, administración y acceso a los datos a escala de petabytes y más allá. El almacenamiento de objetos mantiene los objetos agrupados en contenedores lógicos (a menudo llamados buckets(cubos)), pero esto sigue siendo mucho más simple y con menor sobrecarga que un sistema de archivos. También conduce a una escalabilidad mucho mayor y está diseñado para ser masivamente escalable para satisfacer las necesidades de las empresas digitales actuales y sus datos.

 

¿Qué es el almacenamiento de objetos frente al almacenamiento en bloque o de archivos?

Todo lo anterior hace que el almacenamiento de objetos sea fundamentalmente diferente de los sistemas tradicionales de almacenamiento de bloques o archivos. Cada objeto incluye los datos en sí, así como sus metadatos relacionados, y tiene una clave única global (en lugar de un nombre de archivo y una ruta de archivo). Las claves están dispuestas en un espacio de direcciones planas, lo que elimina los desafíos de complejidad y escalabilidad de un sistema de archivos jerárquico basado en rutas de archivos complejas.

Para que el almacenamiento en bloques tenga sentido, hay que poner encima un sistema de archivos. Un sistema de archivos no es más que una forma de organizar archivos. Piensa en el almacenamiento en bloques como en un aparcamiento vacío, y el almacenamiento de archivos crea las pequeñas plazas dentro de ese aparcamiento. Para llevar la analogía del aparcamiento un paso más allá, el almacenamiento de objetos es el aparcacoches que te busca el coche usando tu ticket (la llave del objeto).

Eso es almacenamiento de objetos en pocas palabras. Su simplicidad y escalabilidad lo hacen ideal para organizaciones que tienen un gran volumen de datos no estructurados para almacenar. Y en estos días, eso es casi todo el mundo.