Almacenamiento de Objetos: Cloud Storage y Gestión de Ciclo de Vida
Autor: Eduardo Martínez Agrelo
Dejamos atrás la computación para centrarnos en los datos. Cloud Storage (GCS) es el servicio de almacenamiento de objetos de Google Cloud. Es escalable, duradero y, lo más importante, es la base para lagos de datos y backups masivos. En el examen Associate Cloud Engineer, no solo debes saber crear un bucket, sino cómo optimizar su coste usando las herramientas adecuadas. En este ejercicio, aprenderemos a automatizar la limpieza de datos usando Terraform.
¿Qué es un Objeto? Almacenamiento no Estructurado
A diferencia de los discos persistentes (donde guardas bloques de datos), en Cloud Storage guardas Objetos (archivos). Cada objeto consta de los datos en sí y de sus metadatos. Los objetos se guardan en contenedores llamados Buckets.
Concepto clave de examen: El nombre de un bucket debe ser ÚNICO A NIVEL GLOBAL en todo Google Cloud. Si alguien en otra empresa ya usa el nombre "mi-bucket", tú no podrás usarlo.
Elegir la Clase de Almacenamiento (Storage Classes)
Esta es la parte más importante para ahorrar dinero y una pregunta fija en la certificación. Debes elegir la clase según la frecuencia de acceso:
- Standard: Para datos que consultas a diario. El almacenamiento es más caro, pero el acceso es gratuito.
- Nearline: Para datos que consultas una vez al mes (ej. backups recientes).
- Coldline: Para datos que consultas una vez al trimestre (ej. registros legales).
- Archive: Para datos que guardas por años (cumplimiento normativo). El almacenamiento es baratísimo, pero el acceso es muy costoso.
Object Lifecycle Management (Gestión del Ciclo de Vida)
Gestionar esto a mano es imposible. Por eso usamos reglas de ciclo de vida. Una regla permite automatizar acciones basadas en condiciones:
- Acciones: Cambiar el objeto a una clase más barata (ej. de Standard a Coldline) o eliminar el objeto definitivamente.
- Condiciones: Edad del objeto (ej. "tiene más de 30 días"), versión del objeto, o estado del objeto.
Escenario de examen: "Tu empresa debe guardar logs por 10 años, pero solo se consultan los primeros 30 días".
Solución: Regla de ciclo de vida que mueva los logs a Archive después de 30 días.
Implementación con Terraform
En este ejercicio, usamos el recurso google_storage_bucket. Veremos cómo definir el bloque lifecycle_rule. Esta técnica nos permite declarar que los archivos temporales se borren solos, evitando que la factura de la nube crezca indefinidamente por descuido humano.
Conclusión: Almacenamiento Inteligente
Al finalizar este ejercicio, habrás creado un sistema de almacenamiento "autolimpiable". Has aprendido que en la nube, el almacenamiento es infinito, pero tu presupuesto no lo es; y ahora sabes usar el ciclo de vida de objetos para equilibrar ambos.