Entendiendo las Clases de Almacenamiento en Cloud Storage
El coste de almacenar datos en Cloud Storage no es uniforme; depende de la "clase de almacenamiento" que elijas para tus objetos. Cada clase está diseñada para un patrón de acceso diferente, optimizando la relación entre el coste de almacenamiento y el coste de acceso a los datos.
Las principales clases de almacenamiento son:
- Standard: Ideal para datos de "acceso frecuente" (hot data), como los ficheros de un sitio web o datos que se analizan constantemente. Ofrece la latencia más baja, pero el coste de almacenamiento es el más alto.
- Nearline: Para datos a los que accedes con poca frecuencia (menos de una vez al mes). El coste de almacenamiento es menor, pero se aplica un coste por acceder a los datos.
- Coldline: Diseñada para datos a los que accedes aún menos (menos de una vez cada 90 días). El coste de almacenamiento es muy bajo, pero el coste de acceso es mayor.
- Archive: La opción más económica para el almacenamiento a largo plazo, como copias de seguridad o archivado de datos históricos (acceso inferior a una vez al año). Tiene el coste de acceso más elevado.
El Error Más Común y Costoso
El error más caro es subir todos los datos a la clase Standard por defecto, sin considerar la frecuencia con la que se accederá a ellos. Muchos pipelines de datos ingieren terabytes de información que solo se procesan una vez y luego se consultan esporádicamente. Almacenar esos datos inactivos en la clase Standard significa pagar el precio más alto por ellos, mes tras mes, sin necesidad.
Este problema se agrava porque los costes no solo provienen del almacenamiento en sí, sino también de las operaciones de lectura y la replicación, que son más caras en las clases de almacenamiento en frío si se usan incorrectamente.