La monitorización Cloud: hacia una visión multi-location

 

Desde que tengo memoria tecnológica, hace aproximadamente unos 20 años, tengo constancia y conocimiento de las noticias periódicas en la mejora y estandarización de los sistemas de monitorización de servidores, redes y sistemas en general. Además, como actualmente trabajo en el sector de Servicios IT, soy totalmente consciente de la mejora de calidad de nuestro trabajo que tal monitorización ha logrado. Actualmente en Ackstorm sabemos que la monitorización de infraestructura IT es una ‘commodity’ empresarial, es decir, viene por defecto y viene bien o, de no ser así, no hay servicio ni proyecto.


La monitorización y control de nuestra plataforma también es un punto recurrente en las necesidades que encontramos en los proyectos de migración o integración en la Nube. No sirve de mucho migrar a la Nube si perdemos  control, visibilidad y alineación de nuestra arquitectura. En definitiva, Cloud y monitorización son dos conceptos que vienen ligados y desde la empresa experta en Infraestructura Cloud Ackstorm lo sabemos. .

Hasta lo anteriormente mencionado, me diréis que no he dicho nada nuevo. No obstante, sí que podemos intuir que si tengo mis sistemas empresariales en la nube, posiblemente los tenga en un lugar normalmente lejano (Eso es más probable en el caso de España, donde la mayoría contratamos proveedores de Cloud Internacionales). Esto le da a la monitorización un peso específico adicional. No nos engañemos, una región computacional con varias áreas y centros de cálculo  es mucho más grande y abstracta de lo que hasta hace unos pocos años hemos conocido. Y en este contexto, la monitorización de mis sistemas es mi cordón umbilical que garantiza el conocimiento y estado de lo que antes teníamos cerca; quizás en el CPD (Centro de Procesamiento de Datos) de las afueras de mi ciudad.

Los sistemas monitor multi-localización y la experiencia de usuario global

Actualmente mi web, mi aplicativo y mis sistemas son accesibles de manera global desde cualquier punto de la red. Pero esto ya no es suficiente porque mis servicios, la calidad de acceso y la disponibilidad de mis aplicativos deben estar garantizados a nivel de multi-localización. Y utilizo la palabra multi-localización y no global para distinguir que mi infraestructura seguirá a mis usuarios allá donde se encuentren.  Si mi negocio se expande en Asia, levantaré infraestructura en tiempo real y teniendo en cuenta los patrones de uso de esa región (Por ejemplo, acabamos de celebrar el nuevo año chino con un pronunciado descenso de tráfico en la región). Si las noticias de mi portal se siguen puntualmente desde Latinoamérica, invertiré en recursos computacionales en la Nube y en redes de distribución de contenido regionales para poder mantener el interés en esa región del planeta durante el tiempo que sea necesario.

Mis usuarios o mis clientes están fragmentados a nivel continental, nacional o local, mis sistemas también y mi sistema de monitorización tiene que recoger esta situación ¿Cómo controlo todo esto y cómo lo monitorizo para tomar las decisiones adecuadas en el momento adecuado?

Ya no me sirve tener un sistema monitor alojado al lado de mis servidores porque mis servidores ya no están en un único sitio, y durante un periodo de tiempo continuo se crean según el uso demandado y en las regiones donde se solicitan. Ahora lo importante es detectar donde hay una acumulación significativa de usuarios, compradores o  target de mi actividad. La tarea de control y monitorización es dinámica y sobre todo multi-localización.

Sherpas de monitorización

Para realizar esta tarea, Ackstorm y ECmanaged utiliza un método de despliegue de nodos llamado “monitorización enrutada por Sherpas”. Estos Sherpas, a modo de guías de montañeros en una región inhóspita, son nodos de monitorización que se despliegan allá donde sea necesario controlar y monitorizar recursos computacionales de una región o área en concreto.

Desde cada uno de los Sherpas se realizan la actividad de monitorización y se refieren al nodo más cercano de concentración de actividad. De estos nodos se recopila la información para el lanzamiento de alertas, análisis de logs, étc. Los  dashboards o paneles de estado de la plataforma dan una visión real de la infraestructura allá donde ésta se encuentre.

Imagen eliminada.

La experiencia de usuario desde la Nube

Ciertamente tanto los  sensores usuales como la cantidad de usuarios concurrentes y bytes transferidos en un periodo de tiempo, nos pueden dar una idea aproximada de la necesidad de recursos en una región concreta. Pero esta aproximación no es válida si no conocemos bien el aplicativo que está ejecutándose en los servidores. En ocasiones, una máquina con un consumo importante de RAM y un número alto de usuarios no tiene por qué traducirse inmediatamente en un empeoramiento de la experiencia de usuario. También es difícil saber qué parte de la arquitectura está llegando  a su rotura de servicio en sistemas complejos o mixtos con varias capas de frontends y backends.

El uso de “multi-location checks” mide la experiencia de usuario desde la nube. Reproducir el ejercicio de monitorizar desde diferentes lugares, desde donde sabemos que están llegando más conexiones. Esto nos permite estimar qué tal se está comportando nuestra plataforma desde esa región, y dependiendo de ese valor, se estima o no desplegar recursos en esa zona: ya sea habilitar recursos CDN adicionales o levantar proxys o niveles de plataforma intermedia para mejorar la respuesta del aplicativo.

Así Ackstorm y ECmanaged complementan a las sondas standart de conexiones por segundo y conexiones concurrentes con otra información como el tiempo medio de resolución de DNS, tiempo de descarga de cabeceras o tiempo de trasferencia del primer byte.

 

Escrito por Javier Domingo, Senior engineer en Ackstorm SL